https://frosthead.com

Data Besar atau Terlalu Banyak Maklumat?

Kita semua tahu terdapat banyak lagi maklumat di dunia kita daripada dulu. Berapa banyak lagi, baiklah, kebanyakan kita tidak tahu apa-apa.

Kandungan Terkait

  • Infographics Melalui Zaman Menonjolkan Kecantikan Visual Sains
  • Mengapa Trend Google Flu Tidak Dapat Mengesan Flu (Namun)

Berikut adalah maklumat yang tidak ternilai tentang semua maklumat itu, pujian Dave Turek, lelaki yang bertanggungjawab dalam pembangunan super komputer di IBM: Dari tahun 2003 dan bekerja mundur ke permulaan sejarah manusia, kami menghasilkan, menurut pengiraan IBM, lima exabytes-itu lima bilion gigabyte-maklumat. Menjelang tahun lepas, kami mengkritik data yang banyak setiap dua hari. Menjelang tahun depan, meramalkan Turek, kami akan melakukannya setiap 10 minit.

Tetapi bagaimana mungkin ini? Bagaimana data menjadi kudzu digital? Sederhana, setiap kali telefon bimbit anda menghantar lokasi GPSnya, setiap kali anda membeli sesuatu dalam talian, setiap kali anda mengklik butang Suka di Facebook, anda meletakkan mesej digital lain dalam botol. Dan sekarang lautan cukup banyak ditutup dengan mereka.

Dan itu hanya sebahagian daripada cerita. Mesej teks, rekod pelanggan, urus niaga ATM, imej kamera keselamatan ... senarai menyala dan seterusnya. Kata kunci untuk menggambarkan ini ialah "Data Big, " walaupun itu tidak adil terhadap skala raksasa yang kita buat.

Ini merupakan contoh terkini teknologi yang melampaui kemampuan kami untuk menggunakannya. Dalam kes ini, kita belum mula mengejar kemampuan kita untuk menangkap maklumat, sebab itulah trofi pengurusan pengurusan yang hebat hari ini adalah masa depan kepunyaan syarikat dan kerajaan yang dapat memahami semua data mereka mengumpul, sebaik-baiknya dalam masa nyata.

Perniagaan yang dapat mentafsir setiap bakul digital yang ditinggalkan oleh pelanggan mereka akan mempunyai kelebihan, pemikiran yang berlaku - bukan hanya yang membeli apa di mana pada masa lalu-tetapi sama ada mereka menulis tentangnya atau menyiarkan foto di mana-mana dalam rangkaian sosial. Begitu juga dengan bandar-bandar yang dapat mengumpulkan data dari beribu-ribu sensor yang kini merapatkan landskap perkotaan dan mengubah kehidupan bandar, seperti aliran lalu lintas, ke sains.

Tidak mengejutkan, kempen politik sudah mengambil risiko, data perlombongan yang teruk sebagai sebahagian daripada tumpuan mereka pada pengundi "nanotargeting" supaya mereka tahu dengan tepat bagaimana untuk meletakkan mereka untuk undi dan wang mereka. Antara penganalisis kesimpulan telah diambil, menurut kolumnis New York Times, Thomas Edsall, bahawa Republikan menunjukkan pilihan untuk "Pejabat" dan restoran Cracker Barrel sementara Demokrat lebih cenderung untuk menonton "Malam Lewat Dengan David Letterman" dan makan di Chuck E Keju.

Ini tergesa-gesa untuk menafsirkan flotsam digital menerangkan mengapa Google minggu lalu mengumumkan bahawa ia akan mula menjual produk yang ia panggil BigQuery, perisian yang boleh mengimbas terabyte maklumat dalam beberapa saat. Dan mengapa permulaannya bernama Splunk, yang mempunyai teknologi yang boleh menganalisis jumlah pelanggan dan data urus niaga yang besar, menyaksikan nilai sahamnya melonjak hampir 90 peratus pada hari ia dipublikasikan bulan lalu. Ini, untuk syarikat yang kehilangan $ 11 juta tahun lepas.

Kebangkitan saintis data

Tetapi akses kepada alat pemecahan data terbaik tidak menjamin kebijaksanaan yang hebat. Sangat sedikit syarikat yang mempunyai kakitangan dengan latihan bukan sahaja untuk menilai gunung-gunung data-termasuk banyak tidbits tidak terstruktur dari berjuta-juta halaman Facebook dan telefon pintar-tetapi juga untuk melakukan sesuatu dengannya.

Tahun lepas, McKinsey Global Insitute mengeluarkan laporan yang menggambarkan "Big Data" sebagai "perbatasan seterusnya untuk inovasi, " tetapi juga meramalkan bahawa pada tahun 2018, syarikat-syarikat di Amerika Syarikat akan mempunyai kekurangan bakat yang serius ketika datang ke kemahiran analisis mutlak- seramai 190, 000 orang. Dan ia menentang satu lagi 1.5 juta pengurus perlu dilatih untuk membuat keputusan strategik dengan torrent data yang akan datang.

Tidak semua orang, walaupun, adalah orang percaya dalam keajaiban Big Data. Peter Fader, seorang profesor pemasaran di Penn's Wharton School of Business, tidak yakin bahawa lebih banyak data lebih baik. Bukannya dia fikir syarikat tidak boleh cuba belajar sebanyak mungkin tentang pelanggannya. Hanya saja, kini terdapat tumpuan yang begitu banyak untuk mengagregasi setiap bit data yang dia anggap isipadu dinilai berdasarkan analisis sebenar.

Di sini diambil oleh Fader dari temu ramah baru-baru ini dengan Kajian Teknikal MIT : "Walaupun dengan pengetahuan yang tidak terhingga tentang kelakuan masa lalu, kami sering tidak akan mempunyai maklumat yang mencukupi untuk membuat ramalan bermakna tentang masa depan. Sebenarnya, semakin banyak data yang kita ada, semakin banyak keyakinan palsu kita akan ... Bahagian penting adalah memahami apa batas kita dan menggunakan sains terbaik untuk mengisi jurang. Semua data di dunia tidak akan mencapai matlamat itu untuk kita. "

Siapa data anda?

Berikut adalah contoh bagaimana Big Data digunakan untuk menyelesaikan masalah besar:

  • Mereka tahu apabila mereka telah buruk atau baik: Walaupun kebanyakan syarikat memfokuskan diri untuk menganalisis pelanggan mereka, Amazon menjaringkan mata dengan menggunakan Big Data untuk membantu mereka.
  • Kajian kancing: Anda ingin mengetahui lembu mana yang menanam susu lembu yang paling produktif? Industri tenusu telah mencipta satu cara untuk mengetuk angka-angka.
  • Diagnosis oleh data: Para penyelidik di SUNY Buffalo menganalisis set data besar-besaran dalam usaha mereka untuk menentukan sama ada terdapat kaitan antara pelbagai sklerosis dan faktor persekitaran, seperti tidak cukup pendedahan kepada cahaya matahari.
  • Mencari masalah: Sebuah syarikat yang dinamakan Rakaman Masa Depan adalah maklumat pertambangan dari rangkaian sosial dan laman web kerajaan dan kewangan untuk membuat ramalan tentang bagaimana pertumbuhan penduduk, kekurangan air dan cuaca yang melampau boleh membawa kepada pergolakan dan keganasan politik masa depan.

Bonus video: Menangkap data adalah satu perkara. Membuatnya kelihatan menarik dan difahami adalah satu lagi cabaran lain. David McCandless berlilin dengan kuasa "peta maklumat" dalam perbualan TED ini.

Data Besar atau Terlalu Banyak Maklumat?