https://frosthead.com

Majoriti Besar Data Raw dari Pengajian saintifik Lama Boleh Sekarang Hilang

Salah satu asas kaedah saintifik ialah kebolehulangan hasil. Dalam makmal di mana sahaja di seluruh dunia, seorang penyelidik harus dapat mengkaji subjek yang sama dengan saintis lain dan menghasilkan semula data yang sama, atau menganalisis data yang sama dan melihat corak yang sama.

Inilah sebabnya mengapa penemuan kajian yang diterbitkan hari ini dalam Biologi Semasa begitu banyak. Apabila sekumpulan penyelidik cuba menghantar e-mel kepada penulis 516 kajian biologi yang diterbitkan antara tahun 1991 dan 2011 dan meminta data mentah, mereka cemas untuk mendapati bahawa lebih 90 peratus daripada data tertua (dari kertas yang ditulis lebih dari 20 tahun yang lalu) adalah tidak boleh diakses. Secara keseluruhannya, walaupun termasuk kertas kerja yang diterbitkan baru-baru ini pada 2011, mereka hanya dapat mengesan data untuk 23 peratus.

"Semua orang tahu bahawa jika anda meminta penyelidik untuk mendapatkan data dari kajian lama, mereka akan mengetuk dan mengelakkannya, kerana mereka tidak tahu di mana, " kata Timothy Vines, ahli zoologi di Universiti British Columbia, yang mengetuai usaha itu. "Tetapi tidak pernah ada anggaran yang sistematik tentang seberapa cepat data yang dipegang oleh penulis sebenarnya hilang."

Untuk membuat anggaran mereka, kumpulannya memilih satu jenis data yang agak konsisten dengan pengukuran masa-anatom tumbuhan dan haiwan-dan digali antara 25 dan 40 kertas untuk setiap tahun ganjil sepanjang tempoh yang menggunakan data semacam ini, untuk melihat jika mereka boleh memburu nombor mentah.

Jumlah pertanyaan yang mengejutkan telah dihentikan pada langkah pertama: untuk 25 peratus kajian, alamat e-mel aktif tidak dapat dijumpai, dengan alamat yang tidak disenaraikan yang tersenarai di kertas itu sendiri dan carian web tidak menghidupkan sebarang yang ada sekarang. Untuk 38 peratus kajian lain, pertanyaan mereka tidak memberi sebarang respons. Satu lagi 7 peratus daripada set data telah hilang atau tidak boleh diakses.

"Beberapa waktu, sebagai contoh, ia diselamatkan pada cakera liut tiga setengah inci, jadi tidak ada yang dapat mengaksesnya, kerana mereka tidak lagi memiliki pemacu yang betul, " kata Vines. Oleh kerana idea asas menyimpan data adalah supaya ia dapat digunakan oleh orang lain dalam penyelidikan masa depan, semacam keuskupan semacam ini menyebabkan data tidak berguna.

Ini mungkin kelihatan seperti halangan biasa, tetapi para saintis sama seperti kita yang lain-mereka menukar alamat e-mel, mereka mendapat komputer baru dengan pemacu yang berbeza, mereka kehilangan sandaran fail mereka-jadi trend ini mencerminkan masalah yang serius dan sistemik dalam sains.

Dan memelihara data sangat penting, ia patut diingat, kerana tidak mungkin untuk meramalkan arah penyelidikan arah akan bergerak di masa depan. Contohnya, Vines telah menjalankan penyelidikannya sendiri tentang sepasang spesies katak yang berasal dari Eropa Timur yang kelihatannya sedang dalam proses hibridisasi. Pada tahun 1980-an, beliau berkata, pasukan penyelidik yang berasingan sedang menjalankan topik yang sama, dan menemui kertas lama yang mendokumenkan pengedaran kodak ini pada tahun 1930-an. Mengetahui bahawa pengedaran mereka telah berubah agak sedikit sejak dekad yang berkisar membolehkan para saintis membuat segala macam perhitungan yang mungkin tidak mungkin sebaliknya. "Data asal yang tersedia, dari kajian lama yang ditulis dalam bahasa Poland, sangat berguna kepada para penyelidik yang datang sepanjang 70 tahun kemudian, " katanya.

Terdapat juga hakikat bahawa begitu banyak kajian ini dibayar dengan pembiayaan awam, sebahagian besarnya datang melalui geran yang menetapkan bahawa data yang dihasilkan akan disediakan secara terbuka kepada orang ramai. Di samping itu, data medan dipengaruhi oleh keadaan persekitaran di mana ia dikumpulkan - oleh itu, mustahil untuk meniru dengan sempurna pada bila-bila masa, apabila keadaan telah berubah.

Apakah penyelesaiannya? Sesetengah jurnal-termasuk Ekologi Molekul, di mana Vines adalah pengatur pengurusan-telah mengguna pakai dasar yang memerlukan pengarang menyampaikan data mentah bersama-sama dengan kertas mereka, yang membolehkan jurnal itu sendiri untuk mengarkibkan data selama-lamanya. Walaupun jurnal, seperti orang, mudah terdedah kepada perubahan alamat email dan keusangan teknologi, masalah ini dapat dikendalikan dengan lebih mudah pada skala institusi.

Majoriti Besar Data Raw dari Pengajian saintifik Lama Boleh Sekarang Hilang