Biologiyaning asosiy vazifalaridan biri hal qilindi

Biologiyaning asosiy vazifalaridan biri hal qilindi
Biologiyaning asosiy vazifalaridan biri hal qilindi
Anonim

Protein tuzilishi - ilm -fan, masalan, plastik chiqindilarni qayta ishlash yoki irsiy kasalliklarni davolash uchun ochilishi kerak bo'lgan asosiy sirlardan biridir. Ma'lum bo'lishicha, tabiat har qanday kompyuterga qaraganda ayyorroq: dunyoda 200 milliondan ortiq protein tuzilmalari mavjud va ularning har biri individualdir. Sun'iy intellekt (AI) olimlarni o'z sirlarini ochishga yaqinlashtirdi.

Sun'iy intellekt (AI) biologiyaning eng muhim muammolaridan birini hal qildi: endi undan oqsilning uch o'lchovli tuzilishining aminokislotalar ketma-ketligini bashorat qilish mumkin. Bu ketma -ketlikning mukammal yoki nomukammalligiga qarab, protein o'z vazifalarini bajaradi. Strukturaviy biologiya bo'yicha etakchi mutaxassislar va ikki yilda bir marta oqsillarni yig'ish (katlama) tajribasi tashkilotchilari sun'iy intellekt (AI) sohasida rivojlanayotgan Britaniyaning DeepMind kompaniyasi olimlari tomonidan bu ajoyib yutuqni e'lon qilishdi. DeepMind usuli keng ko'lamli oqibatlarga olib kelishi aytilgan. Masalan, u yangi dori vositalarini ishlab chiqishni keskin tezlashtirishi mumkin.

"DeepMind jamoasi strukturaviy biologiya va oqsil tadqiqotlarining rivojlanish istiqbollarini keskin o'zgartiradigan ajoyib natijaga erishdi", deydi Evropa bioinformatika instituti direktori Janet Tornton. "Bu qiyinchilik 50 yoshda", - deya qo'shib qo'yadi Jon Moult, Merilend universiteti Shady Grove; Moult-oqsil tuzilishini bashorat qilishning tanqidiy bahosi (CASP) ilmiy tanlovining asoschilaridan biri. "Men bu lahzani ko'raman deb o'ylamagan edim", deb qo'shimcha qiladi Moult.

Bu nima haqida? Inson tanasida o'n minglab turli xil oqsillar mavjud, ularning har biri ko'plab aminokislotalar zanjiri - o'ndan yuzlabgacha. Aminokislotalar ketma-ketligi ular orasidagi son-sanoqsiz o'zaro ta'sirlarni aniqlaydi va shu bilan oqsillarning xususiyatlarini aniqlaydigan murakkab uch o'lchovli tuzilmalarning paydo bo'lishiga olib keladi. Bu oqsil tuzilmalari haqidagi ma'lumotlar olimlarga yangi dorilar yaratishga imkon beradi. Va kerakli tuzilishga ega bo'lgan oqsillarni sintez qilish qobiliyati fermentlarning (tezlatgichlarning) rivojlanishini tezlashtiradi, ularning yordami bilan, masalan, bioyoqilg'i ishlab chiqarish va plastik chiqindilarni to'liq parchalash mumkin.

O'nlab yillar davomida olimlar uch o'lchovli oqsil tuzilmalarini rentgen kristallografiyasi yoki krioelektron mikroskopi (krio-EM) kabi eksperimental usullardan foydalanib hal qiladilar. Biroq, bunday usullarni qo'llash, ba'zida, oylar yoki yillar davom etadi; bundan tashqari, bu usullar har doim ham ishlamaydi. Ma'lum bo'lgan 200 milliondan ortiq protein tuzilmalaridan faqat 170 mingga yaqini shifrlangan.

O'tgan asrning 60 -yillarida olimlar shunday xulosaga kelishdiki, agar ma'lum bir oqsil ketma -ketligiga xos bo'lgan barcha bog'lanishlarni aniqlash mumkin bo'lsa, u holda oqsilning fazoviy tuzilishini bashorat qilish mumkin bo'ladi. Ammo, har bir oqsilda bir -birlari bilan har xil ta'sir o'tkazadigan yuzlab aminokislotalar bo'linmalari mavjud bo'lganligi sababli, biz bir aminokislotalar ketma -ketligi uchun bunday tuzilmalarning umumiy soni shunchaki ulkan ekanligini topamiz. Kompyuter olimlari bu muammoning echimini topdilar, lekin ishlar sekinlashdi.

1994 yilda Jon Moult va uning hamkasblari har ikki yilda bir marta o'tkaziladigan keng ko'lamli CASP tajribasini boshladilar. Bu tajriba ishtirokchilariga tuzilishi noma'lum bo'lgan yuzga yaqin oqsillardan iborat aminokislotalar ketma -ketligi beriladi. Ba'zi olimlar guruhlari har bir ketma -ketlik uchun tuzilmani hisoblashadi, boshqa guruhlar uni eksperimental tarzda aniqlaydilar. Keyin tajriba tashkilotchilari bashorat qilingan bashoratlarni laboratoriya natijalari bilan taqqoslashning aniqligi (GDT) yordamida solishtiradilar, bu noldan yuzgacha. Moultning aytishicha, 90 GDT dan yuqori bo'lgan hisob -kitoblar eksperimental taxminlarga yaqin deb hisoblanadi.

1994 yilda olimlar ular tomonidan taxmin qilingan oddiy oqsillarning tuzilishi eksperimental natijalarga mos kelishiga erishishdi. Ammo kattaroq va murakkab oqsillar uchun hisoblash natijalari taxminan 20 GDTni tashkil etdi - bu "to'liq muvaffaqiyatsizlik", CASP hakamlaridan biri, rivojlanish biologiyasi institutining evolyutsion biologi Andrey Lupas aytganidek. Maks Plank. 2016 yilga kelib, olimlarning raqobatbardosh guruhlari, asosan, CASP uchun ma'lum bo'lgan oqsil tuzilmalarini tahlil qilish orqali, 40 ga yaqin GDTni eng murakkab oqsillar uchun yollashdi.

DeepMind 2018 yilda birinchi marta musobaqaga kirganida, uning AlphaFold deb nomlangan algoritmi nazariy va amaliy natijalarni solishtirish uchun yuqorida tavsiflangan usulga tayangan. Ammo AlphaFold shuningdek, chuqur o'rganish usullarini qo'llaydi: dasturiy ta'minot katta hajmdagi ma'lumotlardan (bu holda ma'lum oqsillarning ketma -ketligi va tuzilmalari) o'rganadi va naqshlarni aniqlashni o'rganadi. DeepMind har bir oqsil tuzilishi uchun o'rtacha 15% raqobatni yengib, eng qiyin vazifalar uchun 60 GDT ga yaqin ball to'plab, osonlikcha g'alaba qozondi.

Shunday bo'lsa -da, DeepMind -da AlphaFold algoritmini ishlab chiqish uchun mas'ul bo'lgan Jon Jumperning so'zlariga ko'ra, qilingan bashoratlar amaliy maqsadlarda ishlatib bo'lmaydigan darajada qo'pol edi. "Biz hali ham biologiyada amaliy foydalanishdan uzoq ekanligimizni bilardik", dedi Jumper. Yaxshi natijalarga erishish uchun, Jumper va uning hamkasblari chuqur o'rganishni "diqqat algoritmi" bilan birlashtirib, odamning jumboqlarni yig'ish qobiliyatiga taqlid qilgan. Bu shunday bo'ladi: birinchi navbatda, mayda bo'laklar mayda bo'laklardan (bu holda, aminokislotalar bo'laklari bo'laklari), so'ngra bu bo'laklarni birlashtirishga urinib, kattaroq kattaliklarning bir butunini tashkil qiladi. Bu ish 128 ta mashinani o'rganish protsessorlaridan tashkil topgan kompyuter tarmog'ini o'z ichiga oladi; ular algoritmni 170 mingga yaqin ma'lum protein tuzilmalari bo'yicha o'rgatishga muvaffaq bo'lishdi.

Va u ishladi! Bu yil AlphaFold algoritmi CASPda tahlil qilish uchun taklif qilingan oqsillar uchun o'rtacha 92,4 GDT ball oldi. Eng murakkab oqsillarni tahlil qilganda, AlphaFold algoritmi o'rtacha 87 ball to'plagan, bu ilgari berilgan eng to'g'ri prognozlardan 25 ball yuqori. Algoritm hatto hujayra membranalarida joylashgan va odamlarning ko'plab kasalliklari uchun javob beradigan oqsillarning tuzilishini tahlil qilish bilan ham shug'ullangan, shu bilan birga, rentgen kristallografiyasi yordamida o'rganish qiyin. Tibbiy tadqiqotlar kengashining molekulyar biologiya laboratoriyasi tuzilmali biolog Venki Ramakrishnan natijani "oqsil tuzilishini bashorat qilishda ajoyib yutuq" deb atadi.

Jon Moultning so'zlariga ko'ra, bu yilgi tanlovda olimlarning barcha guruhlari yanada aniq natijalarni namoyish etishdi. Ammo, agar AlphaFold algoritmi haqida gapiradigan bo'lsak, Andrey Lupasning so'zlariga ko'ra, "vaziyat tubdan o'zgardi". CASP tajribasi tashkilotchilari hatto DeepMind algoritmining yaxlitligiga shubha qilishdi. Va Lupas oldiga alohida vazifa qo'ydi: arxea turlarining membrana oqsilining tuzilishini bilish (qadimgi mikroorganizmlar guruhining vakili). O'n yildan buyon uning tadqiqot guruhi bu oqsilning kristalli tuzilishini rentgenogrammasini olishga harakat qilmoqda. Ammo, Lupaning so'zlariga ko'ra, bu muammoni hal qilib bo'lmaydi.

Biroq, AlphaFold algoritmida hech qanday muammo yo'q edi. Chiqish uchta komponentli oqsilning batafsil tasviri bo'lib, uning o'rtasida ikkita spiral novdasi bor. Algoritm tomonidan ishlab chiqarilgan model Lupas va uning hamkasblariga rentgen yordamida olingan ma'lumotlarni tushunishga imkon berdi; yarim soat ichida ular o'zlarining eksperimental ma'lumotlarini AlphaFold algoritmi bashorat qilgan tuzilish bilan solishtirishdi. "Natija deyarli mukammal", deydi Lupas. - Ma'lumotlarni manipulyatsiya qilish imkonsiz edi. Men buni qanday uddalashganini tushunmayapman."

CASP eksperimentida ishtirok etish shartlaridan biri, DeepMind, boshqa barcha guruhlar bilan bir qatorda, boshqa guruhlar ham buni takrorlashlari uchun o'z usullarining muhim tafsilotlarini oshkor qilishga rozi bo'lishdi. Bu tajriba o'tkazuvchilar uchun sovg'adir, chunki oqsil tuzilishini aniq bashorat qilish ularga rentgen tekshiruvi va krio-elektron mikroskopi (krio-EM) yordamida olingan noaniq ma'lumotlarni to'g'ri talqin qilishga yordam beradi. Bundan tashqari, AlfaFold algoritmi, Moultga ko'ra, dori ishlab chiqaruvchilarga SARS-CoV-2 kabi yangi va xavfli patogenlarni tashkil etuvchi oqsillarning tuzilishini tezda aniqlash imkonini beradi, bu esa o'z navbatida ulardan biri sifatida qaralishi kerak. bu patogenlarni blokirovka qilish mumkin bo'lgan molekulalarni qidirish jarayonidagi muhim qadamlar.

Biroq, AlphaFold algoritmi hamma vazifalarni bajara olmaydi. Masalan, CASP tajribasida oqsillardan birini tahlil qilishda uning ishi sezilarli darajada sekinlashdi (bu yig'ilish paytida bir -birining o'rnini buzadigan 52 ta takrorlanuvchi segmentlar aralashmasi edi). Jon Jumperning aytishicha, tadqiqot guruhi hozirda AlphaFold -ni o'qitmoqchi, u yuqorida aytib o'tilgan tuzilmalarni, shuningdek hujayrada muhim funktsiyalarni bajaradigan oqsil komplekslarini tahlil qila oladi.

Biroq, ko'p o'tmay, eng qiyin muammolardan biri hal bo'lgach, boshqalar paydo bo'ladi. "Hali hammasi tugamadi", deydi Janet Tornton. "Oldimizda ko'plab yangi vazifalar turibdi."

Mavzu bo'yicha mashhur