Tweet dari seluruh dunia, diletakkan mengikut lokasi sebagai sebahagian daripada kajian baru. Klik untuk memperbesar. Imej melalui Isnin Pertama / Leetaru et. al.
Sukar untuk menghargai betapa cepat dan menyeluruh Twitter telah mengambil alih dunia. Hanya tujuh tahun yang lalu, pada tahun 2006, ia adalah idea yang dilukis di atas kertas. Sekarang, perkhidmatan ini digunakan oleh kira-kira 554 juta pengguna-jumlah yang berjumlah hampir 8 peratus daripada semua manusia di planet ini-dan anggaran 17000000000 tweet telah dihantar, dengan jumlah itu memanjat dengan kira-kira 58 juta setiap hari .
Semua tweet ini memberikan sumber berita, hiburan, perbualan dan hubungan antara orang yang tidak ternilai. Tetapi bagi saintis, mereka juga berharga sebagai sesuatu yang agak berbeza: data mentah.
Kerana Twitter mempunyai API terbuka (yang membolehkan tweets dimuat turun sebagai data yang mentah, dianalisis) dan banyak tweet yang ditandai geotag, penyelidik boleh menggunakan berbilion-bilion tweet ini dan menganalisisnya mengikut lokasi untuk mengetahui lebih lanjut tentang geografi manusia di seluruh planet ini. Kejatuhan terakhir, sebagai sebahagian daripada Twitter Global Heartbeat, pasukan Universiti Illinois menganalisis bahasa dan lokasi lebih daripada satu bilion tweet dari seluruh Amerika Syarikat untuk mencipta peta canggih seperti emosi positif dan negatif yang dinyatakan semasa Taufan Sandy, atau sokongan untuk Barack Obama atau Mitt Romney semasa pilihan raya Presiden.
Seperti yang dikemukakan oleh Joshua Keating pada blog Idea Perang Dasar Dasar, ahli kumpulan yang sama, yang diketuai oleh Kalev Leetaru, baru-baru ini melangkah lebih jauh. Seperti yang diterbitkan dalam satu kajian baru awal minggu ini dalam jurnal dalam talian Isnin Pertama, mereka menganalisis lokasi dan bahasa sebanyak 46, 672, 798 tweet yang disiarkan antara 23 Oktober dan 30 November tahun lalu untuk mencipta potret aktiviti manusia yang menakjubkan di seluruh planet ini, yang ditunjukkan di di atas jawatan. Mereka menggunakan Twitter decahose, aliran data yang menangkap 10 peratus rawak dari semua tweet di seluruh dunia pada satu masa tertentu (yang berjumlah 1, 535, 929, 521 untuk tempoh masa), dan hanya memberi tumpuan kepada tweet dengan data geografi yang berkaitan.
Seperti yang ditunjukkan oleh para penyelidik, kepadatan geografi tweet di banyak rantau-terutamanya di dunia Barat, di mana komputer, peranti mudah alih, dan Twitter semua digunakan pada tahap puncak-hampir menyamai kadar penggunaan elektrik dan pencahayaan. Akibatnya, peta tweet (seperti pandangan terperinci mengenai benua AS, di bawah) akhirnya kelihatan seperti imej satelit cahaya buatan pada waktu malam.
Klik untuk memperbesar. Imej melalui Isnin Pertama / Leetaru et. al.
Sebagai ujian untuk melihat bagaimana tweets sesuai dengan penggunaan cahaya tiruan, mereka membuat peta komposit di bawah ini, di mana tweet ditunjukkan sebagai titik merah dan lampu malam ditunjukkan sebagai biru. Kawasan di mana mereka sesuai dengan kekerapan (dan dengan berkesan membatalkan satu sama lain) ditunjukkan sebagai putih, dan kawasan di mana satu melebihi yang lain pula merah atau biru. Banyak kawasan akhirnya kelihatan cantik putih, dengan beberapa pengecualian utama: Iran dan China, di mana Twitter dilarang, kelihatan biru, sementara banyak negara dengan kadar elektrifikasi yang agak rendah (tetapi di mana Twitter masih popular) muncul sebagai merah.
Klik untuk memperbesar. Imej melalui Isnin Pertama / Leetaru et. al.
Projek ini semakin menarik apabila para penyelidik menggunakan sistem automatik untuk memecah tweets mengikut bahasa. Bahasa yang paling biasa di Twitter adalah Bahasa Inggeris, yang diwakili dalam 38.25 peratus daripada semua Tweet. Selepas itu Jepun (11.84 peratus), Sepanyol (11.37 peratus), Indonesia (8.84 peratus), Norway (7.74 peratus) dan Portugis (5.58 peratus).
Pasukan ini membina peta semua tweet yang ditulis dalam 26 bahasa yang paling popular, dengan masing-masing diwakili oleh warna yang berbeza, di bawah:
Klik untuk memperbesar. Imej melalui Isnin Pertama / Leetaru et. al.
Walaupun tweet kebanyakan negara dikuasai oleh bahasa rasmi mereka, ramai yang mendedahkan untuk memasukkan tweet dalam pelbagai bahasa lain. Lihatlah cukup rapat, dan anda akan melihat pelangi warna secara halus muncul dari titik kelabu (tweet bahasa Inggeris) yang menutupi AS:
Klik untuk memperbesar. Imej melalui Isnin Pertama / Leetaru et. al.
Di antara analisis lain, pasukan penyelidikan juga memandang geografi menilai dan merujuk-jarak purata antara pengguna dan seseorang yang dia undi, serta jarak purata antara pengguna itu dan seseorang yang hanya merujuknya dalam tweet. Rata-rata, jarak untuk retweet ialah 1, 115 batu dan 1, 118 untuk rujukan. Tetapi, dengan sesungguhnya, terdapat hubungan positif antara bilangan pengguna yang dikemaskini atau merujuk pengguna lain dan jarak mereka: Pasangan pengguna dengan segelintir interaksi, secara keseluruhannya, lebih cenderung menjadi lebih rapat (500- 600 batu jarak jauh) daripada orang-orang yang mempunyai puluhan tweet dan rujukan di antara mereka.
Ini menunjukkan bahawa pengguna yang tinggal jauh lebih cenderung menggunakan Twitter untuk berinteraksi secara tetap. Salah satu penjelasannya ialah entiti yang paling pengikut-dan dengan itu rujukan dan undian yang paling sering adalah selebriti, organisasi atau syarikat, pengguna yang orang biasa tetapi tidak mempunyai hubungan peribadi dengannya. Peta global yang mengesan antara pengguna adalah di bawah:
Klik untuk memperbesar. Imej melalui Isnin Pertama / Leetaru et. al.
Makalah ini menjadi lebih terperinci mengenai data lain yang berkaitan dengan tweet: nisbah antara liputan berita arus utama dan jumlah tweet di negara (Eropah dan Amerika Syarikat mendapat liputan media yang tidak seimbang, sementara Amerika Latin dan Indonesia diabaikan), tempat Twitter mempunyai menambah pengguna yang paling baru-baru ini (Timur Tengah dan Sepanyol) dan tempat-tempat di mana pengguna mempunyai, rata-rata, paling pengikut (Amerika Selatan dan Pantai Barat).
Terdapat beberapa peringatan untuk semua data ini. Untuk satu, walaupun tweet menganalisis nombor dalam berpuluh-puluh juta, mereka masih hanya 0.3 peratus daripada semua tweet yang dihantar, jadi mereka mungkin tidak mewakili mencukupi semua corak Twitter, terutama jika pengguna yang membolehkan geotagging bertindak berbeza daripada yang lain. Di samping itu, dalam dunia Twitter yang pesat berubah, beberapa trend mungkin telah berubah dengan ketara sejak kejatuhan lepas. Tetapi apabila Twitter terus berkembang dan semakin banyak data tersedia, ia menjadi alasan bahawa analisis semacam ini hanya akan menjadi lebih popular untuk ahli demografi, saintis komputer dan penyelidik lain.