https://frosthead.com

Ini Mungkin Pokok Keluarga Terbesar di Dunia

Kebangkitan ujian DNA melalui perkhidmatan seperti 23andme menunjukkan bahawa terdapat pasaran besar di luar sana untuk sejarah keluarga.

Sekarang, saintis telah membina data itu dengan menerbitkan apa yang mereka percaya adalah pangkalan data genealogi terbesar di dunia, dengan pokok keluarga yang menghubungkan 13 juta orang dan membentangkan lebih daripada lima abad.

Sebagai laporan Jocelyn Kaiser untuk majalah Sains, Yaniv Erlich, seorang ahli genetik komputasi di Columbia University, memikirkan projek itu tujuh tahun yang lalu selepas menerima e-mel dari sepupu saudara jauh melalui Geni.com, salah satu daripada banyak tapak di mana mencari hubungan keluarga.

Dengan sokongan ketua pegawai teknologi Gemi.com, Erlich memuat turun profil awam tapak - puluhan juta mereka. Walaupun ia tidak menawarkan data DNA, maklumat itu termasuk nama seseorang, jantina, tarikh dan tempat kelahiran, tarikh kematian dan saudara terdekat.

Alam menulis mengenai projek Erlich pada peringkat awal pada tahun 2013, dan tahun lepas, Sarah Zhang dari Atlantik melaporkan bahawa para penyelidik telah mengeluarkan prakiraan pokok besar-besaran. Sekarang, Kaiser menulis, pasukan Erlich telah menerbitkan satu kajian mengenai kerja mereka dalam jurnal Science. Menggunakan data, mereka mencapai 5.3 juta pokok, yang terbesar yang menghubungkan sekitar 13 juta saudara, kebanyakannya keturunan Eropah.

Sejak memulakan projek itu, Erlich telah menjadi ketua pegawai sains MyHeritage, sebuah syarikat ujian genealogi dan DNA yang memiliki Geni.com. Beliau melakukan Reddit Ask Me Anything pada Jumaat lalu mengenai penemuannya, membetulkan kesalahpahaman dan menerangkan metodologi di sebalik projek itu. Dia juga menyatakan bahawa bahagian pengalaman yang paling menarik untuknya adalah memikirkan cara menerjemahkan semua data yang ada ke dalam sesuatu yang peribadi.

Dalam temu bual dengan National Geographic 's Nicole Wetsman, Erlich mengatakan bahawa memikirkan bagaimana untuk bekerja dengan data itu juga merupakan sebahagian daripada projek yang paling mencabar. "Data genomik mempunyai alat khusus, struktur data, kaedah, tetapi kami tidak mempunyai apa-apa untuk itu. Kami mencipta roda ketika kami pergi, "katanya.

Pada akhirnya, para penyelidik menggunakan teori graf matematik untuk menganjurkan dan mengesahkan maklumat, melaporkan Laura Geggel untuk Live Science . Mereka juga membandingkan profil dengan kira-kira 80, 000 sijil kematian awam yang boleh didapati dari Vermont dalam tempoh 25 tahun untuk memastikan ia bukan hanya profil kaya yang dimuat naik ke Geni.com.

Pasukan kemudian memutuskan maklumat yang mereka ingin cari untuk menguji pangkalan data, tulis Wetsman.

Mereka mula melihat corak dan mendapati turun naik dalam jangka hayat, sesuatu yang mereka jangkakan. Sebagai contoh, mereka melihat setitik lelaki muda semasa Perang Saudara dan Perang Dunia I dan II, dan kebangkitan hidup kanak-kanak pada tahun 1900-an. Mereka juga dapat mengesan penghijrahan seperti ketibaan Mayflower pada tahun 1620 di mana sekarang Massachusetts, diikuti oleh peningkatan kelahiran di kawasan itu.

Penyelidik juga mendapati bahawa umur panjang lebih berkaitan dengan persekitaran dan tingkah laku berbanding dengan genetik; Malah, data yang diturunkan gen hanya 16 peratus yang bertanggungjawab untuk jangka hayat. Walau bagaimanapun, Paola Sebastiani, profesor biostatistik di Boston University Public Health, memperingatkan membuat kesimpulan mengenai data ini dalam wawancara dengan Wetsman. "Terdapat banyak kekeliruan mengenai definisi panjang umur, " katanya.

Ahli genetik Peter Visscher dari University of Queensland di Brisbane, Australia, memberitahu Kaiser bahawa data yang dipatuhi oleh pasukan Erlich berpotensi untuk memberikan gambaran mengenai genetik peranan penyakit jika data dikaitkan dengan maklumat kesihatan.

Pasukan penyelidikan telah mula menggabungkan pokok tersebut dengan maklumat dari DNA.Land, yang mengagumkan sumber data DNA, yang mungkin bermakna bahawa pokok yang lebih besar mungkin akan datang tidak lama lagi. Penyelidik meramalkan bahawa jika pangkalan data boleh kembali 65 generasi, mereka akan dapat menyelesaikan pokok itu.

Ini Mungkin Pokok Keluarga Terbesar di Dunia