Mutasi Gen Dengan Machine Learning
- Krisna Mughni
- Jun 13, 2020
- 3 min read

Teknologi pengeditan gen menjadi lebih baik dan tumbuh lebih cepat dari sebelumnya. Editor basis yang baru dan lebih baik--jenis korektor genetik yang sangat efisien dan tepat--meningkatkan teknologi untuk mengobati penyakit genetik pada manusia. Tapi, basis editor datang dengan tantangan baru: Seperti cincin dan kunci besar tanpa panduan, para ilmuwan dapat menghabiskan banyak waktu untuk mencari alat terbaik untuk memecahkan kerusakan genetik seperti yang menyebabkan anemia sel sabit atau progeria (cepat penyakit penuaan). Bagi pasien, waktu terlalu penting untuk disia-siakan.
"Editor-editor baru muncul setiap minggu," kata David Liu, Profesor Ilmu Pengetahuan Alam Thomas Dudley Cabot dan anggota institut inti dari Broad Institute dan Howard Hughes Medical Institute (HHMI). "Kemajuannya luar biasa, tetapi membuat para peneliti dengan pilihan yang membingungkan untuk apa yang digunakan oleh editor dasar."
Liu menemukan editor dasar. Dengan tepat, ia dan tim penelitiannya sekarang telah menemukan cara untuk mengidentifikasi mana yang paling mungkin untuk mencapai suntingan yang diinginkan, seperti yang dilaporkan hari ini di Cell . Dengan menggunakan data eksperimental dari pengeditan lebih dari 38.000 situs target dalam sel manusia dan tikus dengan 11 editor basis paling populer (BE), mereka menciptakan model pembelajaran mesin yang secara akurat memprediksi hasil pengeditan dasar, kata Liu. Perpustakaan, yang disebut BE-Hive, tersedia untuk penggunaan umum. Tetapi upaya tersebut menghasilkan lebih dari sekadar katalog BE yang rapi; model pembelajaran mesin menemukan properti editor baru dan kemampuan yang gagal diperhatikan manusia.
"Jika Anda mulai menggunakan pengeditan dasar untuk mengoreksi satu mutasi penyebab penyakit," kata Mandana Arbab, seorang rekan pascadoktoral di lab Liu dan penulis pendamping pertama dalam penelitian ini, "Anda pergi dengan segunung kemungkinan cara untuk melakukannya dan sulit untuk mengetahui mana yang paling mungkin berhasil. "
Editor basis mungkin lebih tepat daripada bentuk-bentuk lain pengeditan gen, tetapi mereka masih dapat menyebabkan pengeditan yang tidak diinginkan, seringkali tidak dapat diprediksi, di luar target genetik yang dimaksudkan. Setiap editor memiliki keanehannya sendiri. Berbagai jenis beroperasi dalam "jendela" pengeditan yang lebih kecil atau lebih besar, membentang DNA sekitar dua hingga lima huruf lebar. Beberapa editor mungkin melampaui atau melampaui target mereka; yang lain mungkin hanya mengubah satu dari dua As di jendela yang diberikan.
"Jika urutan dalam jendela adalah GACA," kata Liu, "dan Anda menggunakan editor basis adenine untuk mengubah salah satu As, akankah salah satu diedit lebih disukai dari yang lain?"
Jawabannya tergantung pada editor dasar, panduan berpasangan RNA--pendamping yang mengangkut editor ke situs kerja DNA yang sesuai--dan urutan DNA sekitarnya. Untuk memastikan semua faktor rumit ini, tim pertama-tama mengumpulkan sejumlah besar data. Lebih dari satu tahun, kata Arbab, mereka melengkapi sel dengan lebih dari 38.000 situs target DNA dan kemudian memperlakukan mereka dengan 11 editor basis paling populer, dipasangkan dengan RNA pemandu. Setelah perawatan, mereka mengurutkan DNA sel untuk mengumpulkan miliaran poin data tentang bagaimana masing-masing editor basis memengaruhi setiap sel.
Untuk menganalisis karunia ini, Max Shen, seorang Ph.D. mahasiswa program Komputasi dan Biologi Sistem Massachusetts Institute of Technology, anggota Broad Institute, dan penulis pendamping pertama merancang dan melatih model pembelajaran mesin untuk memprediksi eksentrisitas khusus setiap editor dasar. Dalam sebuah studi terobosan sebelumnya, Shen dan teman-teman labnya melatih model pembelajaran mesin yang berbeda untuk menganalisis data dari alat pengeditan gen umum lainnya, CRISPR, dan menghilangkan kesalahpahaman populer bahwa alat tersebut menghasilkan penyisipan dan penghapusan yang tidak dapat diprediksi dan umumnya tidak berguna, kata Shen. Sebaliknya, mereka menunjukkan bahwa bahkan jika manusia tidak dapat memprediksi di mana penyisipan dan penghapusan itu terjadi, pembelajaran mesin bisa.
Sekarang, para peneliti dapat menempatkan urutan DNA target ke dalam BE-Hive, model pembelajaran mesin yang diperkuat Shen, dan melihat hasil yang diprediksi menggunakan masing-masing dari 11 editor dasar pada target tersebut. "BE-Hive memprediksi, hingga tingkat urutan DNA individu, apa yang akan menjadi distribusi produk yang dihasilkan dari masing-masing editor dasar yang bertindak di situs target itu," kata Liu.
Beberapa prediksi BE-Hive mengejutkan, bahkan bagi penemu editor dasar. "Kadang-kadang," kata Liu, "karena alasan bahwa otak primata kita tidak cukup canggih untuk diprediksi, model itu dapat secara akurat memberi tahu kita bahwa meskipun ada dua C tepat di jendela pengeditan, editor khusus ini hanya akan mengedit yang kedua , sebagai contoh."
BE-Hive juga belajar ketika editor basis dapat membuat apa yang disebut editan transversion: Alih-alih mengubah C menjadi T, beberapa editor basis mengubah C menjadi G atau A, jarang dan tidak normal tetapi berpotensi quirks berharga. Para peneliti kemudian menggunakan BE-Hive untuk mengoreksi 174 mutasi transversion yang menyebabkan penyakit dengan produk sampingan yang minimal. Dan, mereka menggunakan BE-Hive untuk menemukan properti editor basis yang tidak diketahui, yang mereka gunakan untuk merancang alat baru dengan kemampuan baru, menambahkan beberapa kunci genetik ke cincin yang terus berkembang.
コメント