martedì 11 gennaio 2011

How Do You Visualizza 100 GB di dati di testo di Google?

Interessante notizia letta in http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
Un lettore anonimo scrive "Vi è una serie incredibile di grafici che visualizzano i trigrammi e bigrams, porzioni di frasi che sono state estratte dai dati web di Google set. I grafici che evidenziano le associazioni di parole e la frequenza con cui li usiamo sulle pagine web. Chris Harrison presso la Carnegie Mellon University ha scoperto, per esempio, che la parola 'lui' è spesso legata a 'afferma,' mentre 'lei' è trovato spesso con 'ama'. Ci sono anche classifiche parola-relazione evidenzia che le parole usate in combinazione con i loro opposti, come il bene e il male, la pace e la guerra, e per PC e Mac ". Ci sono un sacco di queste cose, e sono davvero interessanti per sfogliare.

Per saperne di più di questa storia a Slashdot.




Nessun commento:

Posta un commento