სტუბი დოქტორი სერაფიმ ბაცოღლუ, Seer-ის მონაცემთა მთავარი ოფიცერი - ინტერვიუების სერია - Unite.AI
დაკავშირება ჩვენთან ერთად

ინტერვიუები

დოქტორი სერაფიმ ბაცოღლუ, Seer - ინტერვიუების სერიის მონაცემთა მთავარი ოფიცერი

mm

გამოქვეყნებულია

 on

სერაფიმ ბაცოღლუ არის მონაცემთა მთავარი ოფიცერი დანახვაზე. Seer-ში გაწევრიანებამდე, სერაფიმი მუშაობდა Insitro-ში მონაცემთა მთავარ ოფიცრად, წამყვანი მანქანათმცოდნეობისა და მონაცემთა მეცნიერების მიდგომაში წამლების აღმოჩენისადმი. Insitro-მდე ის მსახურობდა Illumina-ში გამოყენებითი და გამოთვლითი ბიოლოგიის ვიცე-პროექტის თანამდებობაზე, წამყვანი კვლევისა და ტექნოლოგიების განვითარებაში ხელოვნური ინტელექტისა და მოლეკულური ანალიზის მიზნით, რათა გენომიური მონაცემები უფრო ინტერპრეტაციის გახადოს ადამიანის ჯანმრთელობაში.

რამ მიგიზიდათ თავიდან გენომიკის სფერო?

გამოთვლითი ბიოლოგიის სფეროთი დავინტერესდი MIT-ში კომპიუტერულ მეცნიერებაში დოქტორანტურის დაწყებისას, როდესაც გავიარე გაკვეთილი თემაზე, რომელსაც ასწავლიდნენ ბონი ბერგერი, რომელიც გახდა ჩემი დოქტორის მრჩეველი, და დევიდ გიფორდი. ადამიანის გენომის პროექტი ჩემი დოქტორანტურის დროს ჩქარობდა. ერიკ ლენდერი, რომელიც ხელმძღვანელობდა გენომის ცენტრს MIT-ში, გახდა ჩემი დოქტორის თანამრჩეველი და ჩამრთო პროექტში. ადამიანის გენომის პროექტით მოტივირებული ვიმუშავე მთლიანი გენომის შეკრებაზე და ადამიანისა და თაგვის დნმ-ის შედარებით გენომიკაზე.

შემდეგ გადავედი სტენფორდის უნივერსიტეტში კომპიუტერული მეცნიერების განყოფილების ფაკულტეტზე, სადაც გავატარე 15 წელი და მქონდა პრივილეგია, მიმეცა რჩევა 30 წარმოუდგენლად ნიჭიერ დოქტორანტს და ბევრ პოსტდოქტორანტს და ბაკალავრიატს. ჩემი გუნდის აქცენტი იყო ალგორითმების გამოყენება, მანქანათმცოდნეობის და პროგრამული ინსტრუმენტების მშენებლობა ფართომასშტაბიანი გენომიური და ბიომოლეკულური მონაცემების ანალიზისთვის. მე დავტოვე სტენფორდი 2016 წელს, რათა მივმართო კვლევისა და ტექნოლოგიების განვითარების ჯგუფს Illumina-ში. მას შემდეგ მე ვსარგებლობდი ინდუსტრიაში წამყვანი R&D გუნდებით. მიმაჩნია, რომ გუნდური მუშაობა, ბიზნეს ასპექტი და უფრო პირდაპირი გავლენა საზოგადოებაზე დამახასიათებელია ინდუსტრიისთვის, ვიდრე აკადემია. ჩემი კარიერის განმავლობაში ვმუშაობდი ინოვაციურ კომპანიებში: DNAnexus, რომელიც თანადამფუძნებელი ვიყავი 2009 წელს, Illumina, insitro და ახლა Seer. გამოთვლა და მანქანათმცოდნეობა აუცილებელია ბიოტექნოლოგიის ტექნოლოგიურ ჯაჭვში, დაწყებული ტექნოლოგიების განვითარებამდე, მონაცემთა მოპოვებამდე, ბიოლოგიური მონაცემების ინტერპრეტაციამდე და ადამიანის ჯანმრთელობამდე თარგმნამდე.

ბოლო 20 წლის განმავლობაში, ადამიანის გენომის თანმიმდევრობა გაცილებით იაფი და სწრაფი გახდა. ამან განაპირობა დრამატული ზრდა გენომის თანმიმდევრობის ბაზარზე და უფრო ფართო მიღება სიცოცხლის მეცნიერებების ინდუსტრიაში. ჩვენ ახლა იმ მწვერვალზე ვართ, რომ გვქონდეს პოპულაციის გენომიური, მულტი-ომიური და ფენოტიპური მონაცემები საკმარისი ზომის, რათა მნიშვნელოვანი რევოლუცია მოახდინოს ჯანდაცვის სფეროში, მათ შორის პრევენციის, დიაგნოსტიკის, მკურნალობისა და წამლების აღმოჩენის ჩათვლით. ჩვენ უფრო მეტად შეგვიძლია აღმოვაჩინოთ დაავადების მოლეკულური საფუძვლები ინდივიდებისთვის გენომიური მონაცემების გამოთვლითი ანალიზით და პაციენტებს აქვთ შანსი მიიღონ პერსონალიზებული და მიზანმიმართული მკურნალობა, განსაკუთრებით კიბოს და იშვიათი გენეტიკური დაავადებების სფეროებში. მედიცინაში აშკარა გამოყენების გარდა, მანქანური სწავლება გენომიურ ინფორმაციასთან ერთად საშუალებას გვაძლევს მივიღოთ ინფორმაცია ჩვენი ცხოვრების სხვა სფეროებში, როგორიცაა ჩვენი გენეალოგია და კვება. მომდევნო რამდენიმე წლის განმავლობაში მოხდება პერსონალიზებული, მონაცემებზე ორიენტირებული ჯანდაცვის მიღება, ჯერ ადამიანთა შერჩეული ჯგუფებისთვის, როგორიცაა იშვიათი დაავადების მქონე პაციენტები და უფრო ფართო საზოგადოებისთვის.

თქვენს ამჟამინდელ თანამდებობამდე თქვენ იყავით მონაცემთა მთავარი ოფიცერი Insitro, წამყვანი მანქანათმცოდნეობა და მონაცემთა მეცნიერება წამლების აღმოჩენისადმი მიდგომით. რა იყო თქვენი ძირითადი ამოცანები ამ პერიოდიდან იმის შესახებ, თუ როგორ შეიძლება მანქანური სწავლის გამოყენება წამლების აღმოჩენის დასაჩქარებლად?

ჩვეულებრივი ნარკოტიკების აღმოჩენისა და განვითარების "ცდა-შეცდომის" პარადიგმა აწუხებს არაეფექტურობას და უკიდურესად ხანგრძლივ ვადებს. ერთი წამლის ბაზარზე გატანას შეიძლება დასჭირდეს 1 მილიარდი დოლარი და ათწლეულზე მეტი. ამ მცდელობებში მანქანათმცოდნეობის ჩართვით, ჩვენ შეგვიძლია მკვეთრად შევამციროთ ხარჯები და ვადები გზაზე რამდენიმე ნაბიჯით. ერთი ნაბიჯი არის სამიზნე იდენტიფიკაცია, სადაც გენი ან გენების ნაკრები, რომელიც მოდულირებს დაავადების ფენოტიპს ან აბრუნებს დაავადების უჯრედულ მდგომარეობას უფრო ჯანსაღ მდგომარეობაში, შეიძლება იდენტიფიცირებული იყოს ფართომასშტაბიანი გენეტიკური და ქიმიური აშლილობისა და ფენოტიპური წაკითხვის საშუალებით, როგორიცაა გამოსახულება და ფუნქციური გენომიკა. . კიდევ ერთი ნაბიჯი არის ნაერთების იდენტიფიკაცია და ოპტიმიზაცია, სადაც მცირე მოლეკულა ან სხვა მოდალობა შეიძლება შეიქმნას მანქანათმცოდნეობით ორიენტირებული სილიკოს პროგნოზით, ასევე ინ ვიტრო სკრინინგით და უფრო მეტიც წამლის სასურველი თვისებებით, როგორიცაა ხსნადობა, გამტარიანობა, სპეციფიკა და არა ტოქსიკურობის ოპტიმიზაცია შესაძლებელია. ყველაზე რთული და ყველაზე მნიშვნელოვანი ასპექტი, ალბათ, ადამიანებისთვის თარგმნაა. აქ, სწორი მოდელის არჩევანი - გამოწვეული პლურიპოტენტური ღეროვანი უჯრედებიდან მიღებული ხაზები პაციენტის პირველადი უჯრედული ხაზებისა და ქსოვილის ნიმუშების წინააღმდეგ ცხოველური მოდელების წინააღმდეგ - სწორი დაავადებისთვის წარმოუდგენლად მნიშვნელოვან კომპრომისებს წარმოადგენს, რაც საბოლოოდ აისახება მიღებული მონაცემების პლუს აპარატის უნარზე. პაციენტებისთვის თარგმნის სწავლა.

Seer Bio არის პიონერული ახალი გზები პროტეომის საიდუმლოების გაშიფვრის მიზნით, ადამიანის ჯანმრთელობის გასაუმჯობესებლად, მკითხველებისთვის, რომლებიც არ იცნობენ ამ ტერმინს, რა არის პროტეომი?

ის პროტეომი არის ორგანიზმის მიერ დროთა განმავლობაში წარმოებული ან მოდიფიცირებული ცილების ერთობლიობა გარემოს, კვების და ჯანმრთელობის მდგომარეობის საპასუხოდ. პროტეომიკა არის პროტეომის შესწავლა მოცემული უჯრედის ტიპის ან ქსოვილის ნიმუშში. ადამიანის ან სხვა ორგანიზმების გენომი სტატიკურია: სომატური მუტაციების მნიშვნელოვანი გამონაკლისის გარდა, დაბადებისას გენომი არის გენომი, რომელსაც აქვს მთელი ცხოვრება, ზუსტად კოპირებულია სხეულის თითოეულ უჯრედში. პროტეომა დინამიურია და იცვლება წლების, დღეების და წუთებშიც კი. როგორც ასეთი, პროტეომები ბევრად უფრო ახლოსაა ფენოტიპთან და, საბოლოოდ, ჯანმრთელობის მდგომარეობასთან, ვიდრე გენომები და, შესაბამისად, უფრო ინფორმაციულია ჯანმრთელობის მონიტორინგისა და დაავადების გასაგებად.

Seer-ში ჩვენ შევიმუშავეთ პროტეომზე წვდომის ახალი გზა, რომელიც უზრუნველყოფს ცილების და პროტეოფორმების უფრო ღრმა ხედვას კომპლექსურ ნიმუშებში, როგორიცაა პლაზმა, რომელიც უაღრესად ხელმისაწვდომი ნიმუშია, რომელიც სამწუხაროდ დღემდე დიდ გამოწვევას უქმნის ჩვეულებრივი მასის სპექტრომეტრიის პროტეომიკას.

რა არის Seer's Proteograph™ პლატფორმა და როგორ გვთავაზობს ის პროტეომის ახალ ხედს?

Seer's Proteograph პლატფორმა იყენებს საკუთრების ინჟინერირებული ნანონაწილაკების ბიბლიოთეკას, რომელიც იკვებება მარტივი, სწრაფი და ავტომატიზირებული სამუშაო ნაკადით, რაც უზრუნველყოფს პროტეომის ღრმა და მასშტაბურ დაკითხვას.

პროტეოგრაფის პლატფორმა ბრწყინავს პლაზმის და სხვა რთული ნიმუშების დაკითხვისას, რომლებიც აჩვენებენ დიდ დინამიურ დიაპაზონს - მასშტაბის მრავალი რიგის განსხვავება ნიმუშში სხვადასხვა ცილების სიმრავლეში - სადაც მასობრივი სპექტრომეტრიის ჩვეულებრივი მეთოდები ვერ ახერხებს პროტეომის დაბალი სიმრავლის ნაწილის აღმოჩენას. Seer-ის ნანონაწილაკები შემუშავებულია რეგულირებადი ფიზიოქიმიური თვისებებით, რომლებიც აგროვებენ ცილებს დინამიურ დიაპაზონში მიუკერძოებლად. პლაზმის ტიპურ ნიმუშებში ჩვენი ტექნოლოგია იძლევა 5x-დან 8x-მდე მეტი ცილის აღმოჩენას, ვიდრე სუფთა პლაზმის დამუშავებისას პროტეოგრაფის გამოყენების გარეშე. შედეგად, ნიმუშის მომზადებიდან ინსტრუმენტაციამდე და მონაცემთა ანალიზამდე, ჩვენი Proteograph Product Suite ეხმარება მეცნიერებს იპოვონ პროტეომის დაავადების ხელმოწერები, რომლებიც სხვაგვარად შეიძლება შეუმჩნეველი იყოს. ჩვენ გვსურს იმის თქმა, რომ Seer-ში ჩვენ ვხსნით ახალ კარიბჭეს პროტეომამდე.

გარდა ამისა, ჩვენ მეცნიერებს საშუალებას ვაძლევთ მარტივად განახორციელონ ფართომასშტაბიანი პროტეოგენომიური კვლევები. პროტეოგენომიკა არის გენომის მონაცემების გაერთიანება პროტეომიურ მონაცემებთან ცილის ვარიანტების იდენტიფიცირებისა და რაოდენობრივი განსაზღვრის მიზნით, გენომის ვარიანტების დაკავშირება ცილების სიმრავლის დონესთან და საბოლოოდ დააკავშირებს გენომსა და პროტეომს ფენოტიპთან და დაავადებასთან და იწყება დაავადებასთან დაკავშირებული გამომწვევი და ქვედა გენეტიკური გზების გარჩევა. .

შეგიძლიათ განიხილოთ მანქანური სწავლების ზოგიერთი ტექნოლოგია, რომელიც ამჟამად გამოიყენება Seer Bio-ში?

Seer იყენებს მანქანათმცოდნეობას ყველა საფეხურზე, ტექნოლოგიის განვითარებიდან დაწყებული მონაცემების ანალიზამდე. ეს ნაბიჯები მოიცავს: (1) ჩვენი საკუთრების ნანონაწილაკების დიზაინს, სადაც მანქანათმცოდნეობა გვეხმარება განვსაზღვროთ ნანონაწილაკების რომელი ფიზიკურ-ქიმიური თვისებები და კომბინაციები იმუშავებს პროდუქტის კონკრეტულ ხაზებთან და ანალიზებთან; (2) პეპტიდების, ცილების, ვარიანტებისა და პროტეოფორმების გამოვლენა და რაოდენობრივი განსაზღვრა MS ინსტრუმენტებიდან მიღებული ამოკითხვის მონაცემებიდან; (3) ქვედა დინების პროტეომიური და პროტეოგენომიური ანალიზები ფართომასშტაბიანი პოპულაციის კოჰორტებში.

გასულ წელს, ჩვენ გამოაქვეყნა ნაშრომი Advanced Materials-ში პროტეომიკის მეთოდების, ნანოინჟინერიისა და მანქანათმცოდნეობის გაერთიანება პროტეინის კორონას ფორმირების მექანიზმების გაგების გასაუმჯობესებლად. ამ ნაშრომმა გამოავლინა ნანო-ბიო ურთიერთქმედება და აცნობებს Seer-ს გაუმჯობესებული მომავალი ნანონაწილაკებისა და პროდუქტების შექმნაში.

ნანონაწილაკების განვითარების გარდა, ჩვენ ვვითარდებით ახალი ალგორითმები ვარიანტული პეპტიდების იდენტიფიცირებისთვის და თარგმანის შემდგომი ცვლილებები (PTMs). ჩვენ ახლახან შევიმუშავეთ მეთოდი ცილის რაოდენობრივი ნიშნის ლოკების გამოვლენა (pQTLs), რომელიც მდგრადია ცილის ვარიანტების მიმართ, რაც ცნობილი დამაბნეველია აფინურობაზე დაფუძნებული პროტეომიკისთვის. ჩვენ ვაგრძელებთ ამ ნაშრომს უშუალოდ ამ პეპტიდების იდენტიფიცირებას ნედლეული სპექტრიდან ღრმა სწავლაზე დაფუძნებული de novo თანმიმდევრობის მეთოდების გამოყენებით, რათა შესაძლებელი იყოს ძიება სპექტრული ბიბლიოთეკების ზომის გაბერვის გარეშე.

ჩვენი გუნდი ასევე ავითარებს მეთოდებს, რომლებიც საშუალებას აძლევს მეცნიერებს, რომლებსაც არ აქვთ მანქანური სწავლების ღრმა გამოცდილება, ოპტიმალურად დაარეგულირონ და გამოიყენონ მანქანათმცოდნეობის მოდელები თავიანთ აღმოჩენებში. ეს მიიღწევა Seer ML ჩარჩოს მეშვეობით, რომელიც დაფუძნებულია AutoML ინსტრუმენტი, რომელიც საშუალებას იძლევა ეფექტური ჰიპერპარამეტრების დარეგულირება ბაიესის ოპტიმიზაციის საშუალებით.

დაბოლოს, ჩვენ ვამუშავებთ მეთოდებს, რათა შევამციროთ სერიული ეფექტი და გავზარდოთ მასობრივი სპეციფიკაციის წაკითხვის რაოდენობრივი სიზუსტე გაზომილი რაოდენობრივი მნიშვნელობების მოდელირებით, რათა მაქსიმალურად გავზარდოთ მოსალოდნელი მეტრიკა, როგორიცაა ინტენსივობის მნიშვნელობების კორელაცია პეპტიდებში პროტეინის ჯგუფში.

ჰალუცინაციები ჩვეულებრივი პრობლემაა LLM-ებთან, რა არის ამის თავიდან აცილების ან შესამცირებლად?

LLM არის გენერაციული მეთოდები, რომლებსაც ეძლევა დიდი კორპუსი და გაწვრთნილი არიან მსგავსი ტექსტის გენერირებისთვის. ისინი ასახავს ტექსტის ძირითად სტატისტიკურ თვისებებს, რომლებზეც ისინი ივარჯიშებენ, მარტივი ლოკალური თვისებებიდან, როგორიცაა სიტყვების (ან ნიშნების) სიხშირის პოვნა ერთად, უფრო მაღალი დონის თვისებებამდე, რომლებიც ემსგავსებიან კონტექსტისა და მნიშვნელობის გაგებას.

თუმცა, LLM-ები პირველ რიგში არ არიან გაწვრთნილი იმისთვის, რომ იყვნენ სწორი. განმტკიცების სწავლა ადამიანის უკუკავშირით (RLHF) და სხვა ტექნიკით ეხმარება მათ ავარჯიშონ სასურველ თვისებებზე, მათ შორის სისწორეში, მაგრამ არ არის სრულებით წარმატებული. მოწოდების შემთხვევაში, LLM-ები წარმოქმნიან ტექსტს, რომელიც ყველაზე მეტად წააგავს ტრენინგის მონაცემების სტატისტიკურ თვისებებს. ხშირად ეს ტექსტიც სწორია. მაგალითად, თუ გკითხავთ „როდის დაიბადა ალექსანდრე მაკედონელი“, სწორი პასუხი არის ძვ. თუმცა, კითხვაზე „როდის დაიბადა იმპერატრიცა რეგინელა“, გამოგონილი პერსონაჟი, რომელიც არ იმყოფება სასწავლო კორპუსში, LLM სავარაუდოდ ჰალუცინაციას განიცდის და შექმნის ისტორიას მისი დაბადების შესახებ. ანალოგიურად, როდესაც სვამენ კითხვას, რომელზეც LLM შეიძლება ვერ მოიპოვოს სწორი პასუხი (ან იმის გამო, რომ სწორი პასუხი არ არსებობს, ან სხვა სტატისტიკური მიზნებისთვის), მას სავარაუდოდ ჰალუცინაცია გაუჩნდება და უპასუხებს თითქოს იცის. ეს ქმნის ჰალუცინაციებს, რომლებიც აშკარა პრობლემაა სერიოზული გამოყენებისთვის, როგორიცაა „როგორ შეიძლება ამა თუ იმ კიბოს მკურნალობა“.

ჰალუცინაციებისთვის სრულყოფილი გადაწყვეტილებები ჯერ არ არსებობს. ისინი ენდემურია LLM-ის დიზაინისთვის. ერთი ნაწილობრივი გამოსავალი არის სათანადო მოთხოვნა, როგორიცაა LLM-ს სთხოვა „დაფიქრდეს ყურადღებით, ნაბიჯ-ნაბიჯ“ და ა.შ. ეს ზრდის LLM-ების ალბათობას, რომ არ მოიგონონ ისტორიები. უფრო დახვეწილი მიდგომა, რომელიც მუშავდება, არის ცოდნის გრაფიკების გამოყენება. ცოდნის გრაფიკები იძლევა სტრუქტურირებულ მონაცემებს: ცოდნის გრაფიკის ერთეულები დაკავშირებულია სხვა ერთეულებთან წინასწარ განსაზღვრული, ლოგიკური გზით. მოცემული დომენისთვის ცოდნის გრაფიკის აგება, რა თქმა უნდა, რთული ამოცანაა, მაგრამ შესასრულებელია ავტომატური და სტატისტიკური მეთოდებისა და კურირების კომბინაციით. ჩაშენებული ცოდნის გრაფიკით, LLM-ებს შეუძლიათ გადაამოწმონ მათ მიერ წარმოქმნილი განცხადებები ცნობილი ფაქტების სტრუქტურირებულ კომპლექტთან მიმართებაში და შეიძლება შეიზღუდონ არ შექმნან განცხადება, რომელიც ეწინააღმდეგება ან არ არის მხარდაჭერილი ცოდნის გრაფიკით.

ჰალუცინაციების ფუნდამენტური საკითხის გამო და, სავარაუდოდ, საკმარისი მსჯელობისა და განსჯის უნარის ნაკლებობის გამო, LLM-ები დღეს ძლიერია ინფორმაციის მოსაპოვებლად, დასაკავშირებლად და გამოხდისთვის, მაგრამ ვერ შეცვლიან ადამიანურ ექსპერტებს სერიოზულ პროგრამებში, როგორიცაა სამედიცინო დიაგნოზი ან იურიდიული რჩევა. მიუხედავად ამისა, მათ შეუძლიათ საოცრად გაზარდონ ადამიანური ექსპერტების ეფექტურობა და შესაძლებლობები ამ სფეროებში.

შეგიძლიათ გააზიაროთ თქვენი ხედვა მომავლის შესახებ, სადაც ბიოლოგია იმართება მონაცემებით და არა ჰიპოთეზებით?

ჰიპოთეზაზე ორიენტირებული ტრადიციული მიდგომა, რომელიც გულისხმობს მკვლევარების მოძიებას შაბლონებს, ჰიპოთეზების შემუშავებას, ექსპერიმენტების ან კვლევების ჩატარებას მათ შესამოწმებლად, შემდეგ კი მონაცემებზე დაფუძნებული თეორიების დახვეწას, ცვლის ახალ პარადიგმას, რომელიც დაფუძნებულია მონაცემებზე ორიენტირებულ მოდელირებაზე.

ამ განვითარებად პარადიგმაში, მკვლევარები იწყებენ ჰიპოთეზების გარეშე, ფართომასშტაბიანი მონაცემების გენერირებას. შემდეგ, ისინი ავარჯიშებენ მანქანათმცოდნეობის მოდელს, როგორიცაა LLM, ოკლუზიური მონაცემების ზუსტი რეკონსტრუქციის, ძლიერი რეგრესიის ან კლასიფიკაციის შესრულების მიზნით, რიგ ქვემოთ მოცემულ ამოცანებში. მას შემდეგ, რაც მანქანათმცოდნეობის მოდელი შეძლებს მონაცემების ზუსტად პროგნოზირებას და მიაღწევს ერთგულებას, რომელიც შედარებულია ექსპერიმენტულ რეპლიკებს შორის მსგავსებასთან, მკვლევარებს შეუძლიათ გამოიკითხონ მოდელი, რათა მიიღონ ინფორმაცია ბიოლოგიური სისტემის შესახებ და გაარკვიონ ძირითადი ბიოლოგიური პრინციპები.

LLM-ები განსაკუთრებით კარგია ბიომოლეკულური მონაცემების მოდელირებაში და გამიზნულია ჰიპოთეზაზე ორიენტირებული ბიოლოგიურ აღმოჩენაზე გადასვლაზე. ეს ცვლილება სულ უფრო მკვეთრად გახდება მომდევნო 10 წლის განმავლობაში და საშუალებას მისცემს ბიომოლეკულური სისტემების ზუსტი მოდელირებას მარცვლოვნებით, რომელიც სცილდება ადამიანის შესაძლებლობებს.

რა არის პოტენციური გავლენა დაავადების დიაგნოზსა და წამლების აღმოჩენაზე?

მე მჯერა, რომ LLM და გენერაციული AI გამოიწვევს მნიშვნელოვან ცვლილებებს სიცოცხლის მეცნიერებების ინდუსტრიაში. ერთი სფერო, რომელიც დიდ სარგებელს მოუტანს LLM-ისგან, არის კლინიკური დიაგნოზი, განსაკუთრებით იშვიათი, ძნელად დიაგნოსტირებადი დაავადებებისა და კიბოს ქვეტიპებისთვის. არსებობს პაციენტის ყოვლისმომცველი ინფორმაციის უზარმაზარი რაოდენობა, რომელსაც ჩვენ შეგვიძლია გამოვიყენოთ - გენომის პროფილებიდან, მკურნალობის პასუხებიდან, სამედიცინო ჩანაწერებიდან და ოჯახის ისტორიიდან - ზუსტი და დროული დიაგნოზის დასადგენად. თუ ჩვენ შევძლებთ ვიპოვოთ გზა, რომ შევადგინოთ ყველა ეს მონაცემი ისე, რომ ისინი ადვილად ხელმისაწვდომი იყოს და არ იყოს დაცული ცალკეული ჯანდაცვის ორგანიზაციების მიერ, ჩვენ შეგვიძლია მკვეთრად გავაუმჯობესოთ დიაგნოსტიკური სიზუსტე. ეს არ ნიშნავს იმას, რომ მანქანათმცოდნეობის მოდელები, LLM-ების ჩათვლით, შეძლებენ ავტონომიურად იმუშაონ დიაგნოსტიკაში. მათი ტექნიკური შეზღუდვების გამო, უახლოეს მომავალში ისინი არ იქნებიან ავტონომიური, არამედ გაზრდიან ადამიანურ ექსპერტებს. ისინი იქნება მძლავრი ხელსაწყოები, რათა დაეხმარონ ექიმს შესანიშნავად ინფორმირებული შეფასებებისა და დიაგნოზის გაკეთებაში დღემდე საჭირო დროის ფრაგმენტში, და სათანადოდ დააფიქსიროს და მიაწოდოს მათი დიაგნოზი პაციენტს, ისევე როგორც აპარატის მეშვეობით დაკავშირებულ ჯანდაცვის პროვაიდერთა მთელ ქსელს. სასწავლო სისტემა.

ინდუსტრია უკვე იყენებს მანქანათმცოდნეობას წამლების აღმოჩენისა და განვითარებისთვის, ამტკიცებს თავის უნარს შეამციროს ხარჯები და ვადები ტრადიციულ პარადიგმასთან შედარებით. LLM-ები დამატებით ემატება ხელმისაწვდომ ინსტრუმენტთა ყუთს და უზრუნველყოფენ შესანიშნავ ჩარჩოებს ფართომასშტაბიანი ბიომოლეკულური მონაცემების მოდელირებისთვის, მათ შორის გენომები, პროტეომები, ფუნქციური გენომიური და ეპიგენომიური მონაცემები, ერთუჯრედიანი მონაცემები და სხვა. უახლოეს მომავალში, ფონდის LLM-ები უდავოდ დაუკავშირდებიან ყველა ამ მონაცემთა მოდალობას და ინდივიდების დიდ კოჰორტას, რომელთა გენომიური, პროტეომიური და ჯანმრთელობის ინფორმაცია გროვდება. ასეთი LLM-ები ხელს შეუწყობს წამლის პერსპექტიული მიზნების გენერირებას, განსაზღვრავს ცილების აქტივობის სავარაუდო ჯიბეებს, რომლებიც დაკავშირებულია ბიოლოგიურ ფუნქციასთან და დაავადებასთან, ან შესთავაზებს გზებს და უფრო რთულ უჯრედულ ფუნქციებს, რომლებიც შეიძლება მოდულირებული იყოს კონკრეტული გზით მცირე მოლეკულებით ან წამლის სხვა მოდალებით. ჩვენ ასევე შეგვიძლია შევეხოთ LLM-ებს, რათა განვსაზღვროთ წამლებზე პასუხისმგებელი და არმოპასუხე გენეტიკური მგრძნობელობის საფუძველზე, ან სხვა დაავადების ჩვენებებში წამლების ხელახალი დანიშნულება. ბევრი არსებული ინოვაციური AI-ზე დაფუძნებული ნარკოტიკების აღმოჩენის კომპანია, უდავოდ, უკვე იწყებს ფიქრს და განვითარებას ამ მიმართულებით, და ჩვენ უნდა ველოდოთ დამატებითი კომპანიების ჩამოყალიბებას, ისევე როგორც საზოგადოებრივ ძალისხმევას, რომელიც მიზნად ისახავს LLM-ების განთავსებას ადამიანის ჯანმრთელობასა და წამლებში. აღმოჩენა.

გმადლობთ დეტალური ინტერვიუსთვის, მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს დანახვაზე.

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.