Data Mining Menggunakan Google: "Today's xkcd komik adalah sekitar kuantitatif Google queries. Randall Munroe menemukan jumlah hasil pencarian untuk permintaan seperti "My IQ adalah X", di mana X adalah sebuah variabel, dan merencanakan sebuah grafik untuk setiap query. Meskipun hasilnya tidak dapat diandalkan (Google hanya menampilkan perkiraan untuk jumlah hasil pencarian), ini merupakan cara yang menarik untuk saya indeks Google dari web.



Jika Anda sudah familiar dengan Google Spreadsheets, cobalah untuk membuat sebuah lembar yang memungkinkan Anda masukkan pertanyaan seperti "My IQ adalah X", nama variabel dan nilai-nilai untuk variabel. Hasilnya seharusnya grafik yang menunjukkan jumlah hasil pencarian Google untuk setiap contoh permintaan Anda. Gunakan importXML dan ekspresi XPath untuk menemukan jumlah hasil pencarian Google: "/ / div [@ id = 'resultStats'] / b [3]". Berikut ini sebuah contoh.

(Gambar berlisensi sebagai Creative Commons Attributions-non-komersial. )
 
Top