https://frosthead.com

Bagaimana Margaret Dayhoff Menjana Pengkomputeran Moden kepada Biologi

Pada tahun 1984, Yayasan Penyelidikan Bioperubatan Kebangsaan melancarkan pangkalan data dalam talian percuma yang mengandungi lebih daripada 283, 000 urutan protein. Hari ini Sumber Maklumat Protein membolehkan para saintis di seluruh dunia untuk mengambil protein yang tidak diketahui, membandingkannya dengan beribu-ribu protein yang diketahui dalam pangkalan data, dan menentukan cara yang sama dan berbeza. Dari data tersebut, mereka dapat dengan cepat dan tepat menyimpulkan sejarah evolusi protein dan hubungannya dengan pelbagai bentuk kehidupan.

Asal usul pangkalan data dalam talian yang besar ini bermula jauh sebelum internet. Semuanya bermula dengan Atlas Protein Sequence and Structure, sebuah buku bercetak 1965 yang mengandungi 65 urutan protein yang diketahui, disusun oleh seorang wanita bernama Margaret Dayhoff. Untuk mencipta Atlasnya, Dayhoff menggunakan teknologi komputer canggih untuk mencari penyelesaian kepada soalan biologi, membantu mengasah kelahiran bidang baru yang kini kami panggil bioinformatik. Pada asalnya seorang ahli kimia, Dayhoff memanfaatkan teknologi baru dan berkembang dari era pengkomputeran pasca Perang Dunia II menjadi alat perintis yang ahli kimia, ahli biologi dan ahli astronomi dapat menggunakan dalam kajian lintas disiplin tentang asal-usul kehidupan di Bumi.

Dayhoff (kemudian Margaret Oakley) dilahirkan di Philadelphia pada 11 Mac 1925 kepada Ruth Clark, guru matematik sekolah tinggi, dan Kenneth Oakley, pemilik perniagaan kecil. Pada usia sepuluh, keluarganya berpindah ke New York City. Di sana, dia menghadiri sekolah-sekolah awam, akhirnya menjadi pengacara Bayside High pada tahun 1942. Beliau menghadiri Kolej Washington Square, New York University dalam satu biasiswa, menamatkan magna cum laude dalam matematik hanya tiga tahun kemudian pada tahun 1945.

Pada tahun yang sama, Dayhoff memasuki Universiti Columbia untuk mendapatkan PhD dalam kimia kuantum di bawah bimbingan ahli kimia terkemuka dan penyelidik operasi Perang Dunia II George Kimball. Penerimaan beliau jarang berlaku buat masa itu. Selepas Perang Dunia II, lebih banyak lelaki memasuki sains, dan kimia menjadi lebih banyak lelaki yang didominasi berbanding dekad sebelumnya, dengan hanya lima peratus PhD kimia yang pergi ke wanita, turun dari lapan peratus.

Semasa masa Dayhoff di universiti itu, Columbia menjadi sarang untuk teknologi pengkomputeran. Ia membanggakan beberapa makmal pengkomputeran pertama di Amerika Syarikat, dan pada tahun 1945 menjadi rumah kepada Makmal Saintifik IBM Watson yang diketuai oleh ahli astronomi WJ Eckert. Makmal Watson telah mula berkhidmat sebagai pusat pengkomputeran bagi Sekutu pada bulan-bulan akhir Perang Dunia II. Selepas perang, ia menjadi tapak untuk membangunkan beberapa komputer super pertama, termasuk Kalkulator Elektronik Sequence Selective (SSEC), yang kemudian digunakan Eckert untuk mengira orbit bulan untuk misi Apollo.

Dengan teknologi ini di hujung jari beliau, Dayhoff menggabungkan minatnya dalam bidang kimia dengan pengkomputeran dengan menggunakan mesin kad punched-pada dasarnya komputer digital awal. Mesin ini membolehkan Dayhoff mengotomatisasi pengiraannya, menyimpan algoritma pada satu set kad dan data pada yang lain. Menggunakan mesin itu, dia dapat memproses pengiraan dengan lebih cepat dan tepat daripada tangan.

Subjek kepentingan Dayhoff adalah sebatian organik polisiklik, yang merupakan molekul yang terdiri daripada tiga atau lebih atom yang bergabung dalam cincin dekat. Beliau menggunakan mesin pencetus-pencetus untuk melakukan sejumlah pengiraan pada tenaga resonant molekul (perbezaan antara potensi tenaga molekul keadaan tertentu dan keadaan purata) untuk menentukan kebarangkalian ikatan molekul dan jarak ikatan.

Dayhoff lulus dengan ijazah doktoralnya dalam kimia kuantum dalam masa tiga tahun sahaja. Penyelidikan yang dilakukannya sebagai pelajar siswazah telah diterbitkan, dengan Kimball sebagai pengarang, pada tahun 1949 dalam Journal of Chemical Physics di bawah gelaran ringkas Punched Card Calculating Energy Resonance.

Juga pada tahun 1948, Dayhoff berkahwin dengan Edward Dayhoff, seorang pelajar dalam fizik eksperimen yang dia temui di Columbia. Pada tahun 1952, pasangan itu berpindah ke Washington, DC di mana Edward mengambil jawatan di Biro Kebangsaan Standard dan Dayhoff melahirkan anak perempuannya yang pertama, Ruth. Dayhoff tidak lama lagi berhenti daripada penyelidikan untuk menjadi ibu tinggal di rumah kepada Ruth dan anak perempuannya Judith, kecuali untuk kedudukan pasca doktoral dua tahun di University of Maryland.

Apabila dia kembali ke penyelidikan dan mula memohon geran untuk membiayai karyanya pada tahun 1962, dia terkejut. Institut Kesihatan Nasional menolak permohonan geran yang menyenaraikan Dayhoff sebagai penyelidik utama, dengan penjelasan bahawa "[Dayhoff] telah keluar dari sentuhan yang sangat intim untuk beberapa waktu ... dengan kawasan yang rumit dan cepat memajukan ini, " seperti sejarawan Bruno Strasser menulis dalam buku yang akan datang Mengumpulkan Eksperimen: Membuat Biologi Data Besar . Pendakian yang semakin meningkat bagi wanita yang telah mengambil masa untuk membesarkan anak adalah salah satu cara institusi-institusi saintifik menghalang-dan terus menghalang-halangan wanita.

Walaupun kekurangan sokongan NIH, Dayhoff hampir memasuki dekad yang paling penting dalam kerjayanya. Pada tahun 1960, dia menerima jemputan dari Robert Ledley, seorang biophysicist perintis yang dia jumpa melalui suaminya, untuk menyertai beliau di Yayasan Penyelidikan Bioperubatan Kebangsaan di Silver Spring, Maryland. Ledley tahu kemahiran komputer Dayhoff akan menjadi penting untuk matlamat asas untuk menggabungkan bidang pengkomputeran, biologi dan perubatan. Dia akan menjadi pengarah syarikat bersekutu selama 21 tahun.

Sekali di Maryland, Dayhoff telah bebas menggunakannya untuk kerangka utama IBM 7090 baru Georgetown University. Sistem IBM direka untuk mengendalikan aplikasi kompleks, dengan kelajuan pengkomputeran enam kali lebih cepat daripada model sebelumnya. Kelajuan ini telah dicapai dengan menggantikan teknologi tabung vakum yang lebih perlahan dengan transistor yang lebih cepat, lebih efisien (komponen yang menghasilkan 1s dan 0s komputer). Menggunakan kerangka utama, Dayhoff dan Ledley mula mencari dan membandingkan urutan peptida dengan program FORTRAN yang telah mereka tulis sendiri dalam usaha untuk memasang urutan separa ke dalam protein lengkap.

IBM 7090 Konsol pengendali IBM 7090 di Pusat Penyelidikan NASA Ames pada tahun 1961, dengan dua bank pemacu pita magnet IBM 729. (NASA)

Komitmen Dayhoff dan Ledley untuk menerapkan analisis komputer kepada biologi dan kimia adalah luar biasa. "Budaya analisis statistik, apatah lagi pengkomputeran digital, benar-benar asing kepada kebanyakan [biokimia], " jelas Strasser dalam temu bual dengan Smithsonian.com . "Ada juga yang membanggakan diri bukannya 'ahli teori, ' iaitu bagaimana mereka memahami analisis data menggunakan model matematik."

Satu disiplin saintifik yang mana savvy komputer Dayhoff lebih dihargai, bagaimanapun, adalah astronomi. Ini minat dalam pengkomputeran adalah sebahagian besarnya kepada WJ Eckhart, yang pada tahun 1940 telah menggunakan mesin menumbuk IBM untuk meramalkan orbit planet. Dan pada tahun 1960-an, minat Amerika dalam penerokaan ruang angkasa sedang penuh, yang bermaksud pembiayaan untuk NASA. Di University of Maryland, Dayhoff bertemu dengan spectroscopist Ellis Lippincott, yang membawanya ke kolaborasi selama enam tahun dengan Carl Sagan di Harvard pada tahun 1961. Ketiga-tiganya mengembangkan model termodinamika solek kimia bahan, dan Dayhoff mencipta program komputer yang boleh mengira kepekatan keseimbangan gas di atmosfera planet.

Dengan program Dayhoff, dia, Lippincott dan Sagan dapat memilih elemen untuk menganalisis, membolehkan mereka menyiasat pelbagai komposisi atmosfera yang berbeza. Akhirnya, mereka membangunkan model atmosfera untuk Venus, Musytari, Marikh dan juga atmosfer Bumi yang primordial.

Semasa meneroka langit, Dayhoff juga mengajukan soalan yang penyelidik telah menjelajah sejak sekurang-kurangnya tahun 1950-an: apakah fungsi protein? Prinsip urutan adalah cara untuk mendapat jawapannya, tetapi penjujukan protein individu adalah sangat tidak cekap. Dayhoff dan Ledley mengambil pendekatan yang berbeza. Daripada menganalisis protein secara berasingan, mereka membandingkan protein yang berasal dari spesies tumbuhan dan haiwan yang berlainan. "Dengan membandingkan urutan protein yang sama dalam spesies yang berlainan, seseorang dapat memerhatikan bahagian-bahagian urutan yang selalu sama dalam semua spesies, satu petanda yang baik bahawa bahagian urutan ini penting untuk kebaikan protein, " kata Strasser.

Dayhoff menyiasat lebih mendalam, mencari sejarah bersama protein. Dia menganalisis bukan sahaja pada bahagian-bahagian yang sama merentas spesies, tetapi juga variasi mereka. "Mereka mengambil perbezaan ini sebagai ukuran jarak evolusi antara spesies, yang membolehkan mereka membina semula pokok filogenetik, " jelas Strasser.

Dayhoff, sentiasa bersedia untuk memanfaatkan kuasa teknologi baru, mengembangkan kaedah berkomputer untuk menentukan urutan protein. Dia menjalankan analisis komputer protein dalam pelbagai spesies, dari kulat candida hingga ikan paus. Kemudian dia menggunakan perbezaan mereka untuk menentukan hubungan leluhur mereka. Pada tahun 1966, dengan bantuan Richard Eck, Dayhoff mencipta rekonstruksi pertama pokok filogenetik.

Dalam artikel Scientific American 1969, "Analisis Komputer Evolusi Protein, " Dayhoff menyampaikan kepada orang awam tentang pokok-pokok ini bersama-sama dengan penyelidikannya menggunakan komputer untuk menyusun protein. "Setiap urutan protein yang ditubuhkan, setiap mekanisme evolusi yang diterangi, setiap inovasi utama dalam sejarah filogenetik yang diturunkan akan meningkatkan pemahaman kita tentang sejarah kehidupan, " tulisnya. Dia cuba menunjukkan masyarakat sains hayat potensi model berkomputer.

Matlamat seterusnya adalah untuk mengumpul semua protein yang diketahui di satu tempat di mana para penyelidik dapat mencari urutan dan membandingkannya dengan orang lain. Tidak seperti hari ini, apabila mudah untuk memanggil sumber-sumber di pangkalan data elektronik dengan hanya kata kunci, Dayhoff terpaksa mengupas jurnal fizikal untuk mencari protein yang dia cari. Dalam banyak keadaan, ini bermakna memeriksa sesetengah kerja penyelidik untuk kesilapan. Walaupun dengan bantuan komputer, kerja pengumpulan dan pengkatalogan urutan diperlukan jumlah masa yang banyak dan mata saintifik yang arif.

Tidak semua orang melihat nilai dalam apa yang dia lakukan. Untuk penyelidik lain, karya Dayhoff menyerupai koleksi dan pengkatalogan karya sejarah semula jadi abad ke-19 dan bukannya karya eksperimen saintis abad ke-20. "Mengumpulkan, membandingkan dan mengklasifikasikan perkara-perkara alam semula jadi seolah-olah kuno kepada banyak ahli biologi eksperimen pada separuh kedua abad ke-20, " kata Stasser. Beliau merujuk kepada Dayhoff sebagai "orang luar." "Dia menyumbang kepada bidang yang tidak wujud dan dengan itu tidak mendapat pengiktirafan profesional, " katanya.

Pada tahun 1965, Dayhoff menerbitkan koleksi 65 protein yang diketahui dalam Atlas of Sequence and Structure, sebuah versi pangkalan datanya. Akhirnya data dipindahkan ke pita magnetik, dan kini ia hidup dalam talian di mana para penyelidik terus menggunakan datanya untuk mencari beribu-ribu lagi protein. Pangkalan data bioperubatan yang lain telah menyertai perbalahan, termasuk Protein Data Bank, koleksi protein protein dan asid nukleik yang dilancarkan pada tahun 1971, dan GenBank, pangkalan data urutan genetik yang dilancarkan pada tahun 1982. Dayhoff memulakan revolusi saintifik.

"Hari ini, setiap penerbitan tunggal dalam biologi eksperimen mengandungi gabungan data percubaan baru dan kesimpulan yang diperoleh daripada perbandingan dengan data lain yang tersedia dalam pangkalan data awam, pendekatan yang Dayhoff bermula setengah abad yang lalu, " kata Strasser.

Sebagai bioinformatik berkembang, tugas mengumpul dan pengiraan sebahagian besarnya jatuh kepada wanita. Kolaborasi Dayhoff di Atlas adalah semua wanita kecuali Ledley. Sama seperti "komputer" wanita NASA pada tahun 1960-an dan penyusun kod wanita Perang Dunia II, wanita-wanita ini tidak lama lagi didorong ke arah amalan saintifik. Merujuk kepada "gadis-gadis ENIAC" yang memprogram komputer pertama, komputer umum, sejarawan pengkomputeran Jennifer Light menulis bahawa "ia berada dalam batasan tepat seperti klasifikasi pekerjaan rendah status yang wanita terlibat dalam kerja yang belum pernah terjadi sebelumnya."

Dalam lakaran biografinya, Dayhoff, Lois T. Hunt, yang bekerja di Atlas dengannya, menulis bahawa Dayhoff mempercayai siasatannya terhadap atmosfer bumi yang mula-mula dapat memberikannya "sebatian yang diperlukan untuk pembentukan kehidupan." Ini, mungkin lebih daripada pengkomputeran, adalah apa yang menghubungkan bahagian-bahagian yang berbeza dari penyelidikan saintifik Dayhoff bersama-sama. Dari protein kecil ke atmosfera yang luas, Dayhoff mencari rahsia kemunculan kehidupan di planet ini. Walaupun dia tidak membuka kunci mereka semua, dia memberi sains moden alat dan cara untuk meneruskan pencarian.

Bagaimana Margaret Dayhoff Menjana Pengkomputeran Moden kepada Biologi