
🧪 Nature-ის კვლევა: სამედიცინო AI ექიმებს უტოლდება, თუმცა ბაზისური მოდელების გაუმჯობესება სტრუქტურულ უპირატესობას აქრობს
ჟურნალ Nature-ში გამოქვეყნებული ორი ახალი კვლევის თანახმად, სპეციალიზებული ხელოვნური ინტელექტის სისტემები დაავადებების დიაგნოსტირებასა და მკურნალობის დაგეგმვაში ექიმებს უტოლდებიან. თუმცა, ორივე სისტემა მუშაობს ბაზისურ მოდელებზე, რომლებიც უკვე მოძველებულად ითვლება და ახალი მოდელების გამოჩენის ფონზე მათ ეფექტურობას კითხვები უჩნდება. პირველი გერმანული სისტემა MIRA დრეზდენის ტექნიკურ და ჰაიდელბერგის უნივერსიტეტებში შეიქმნა. კვლევის მიხედვით, MIRA-მ ექიმებს აჯობა ისეთი პათოლოგიების დიაგნოსტირებაში, როგორებიცაა პანკრეასის კიბო და ფილტვების ანთება. მეორე სისტემამ, Google-ის AMIE-მ კი მკურნალობის უფრო ზუსტი გეგმები შეადგინა და უკეთესი შედეგი აჩვენა. MIRA ავტონომიური აგენტის სახით მუშაობს და ელექტრონულ სამედიცინო ბარათებში 85 000-ზე მეტი ოპერაციის შესრულება შეუძლია. მკვლევარებმა სისტემა 500-ზე მეტ გადაუდებელი დახმარების შემთხვევაზე შეამოწმეს. MIRA-მ სწორი დიაგნოზი შემთხვევათა 88.9%-ში დასვა, რაც სამედიცინო სფეროსთვის ძალიან მაღალ მაჩვენებლად ითვლება. კვლევის ფარგლებში 311 შემთხვევის შედარებისას MIRA-მ 87.8%-იანი სიზუსტე აჩვენა. ამავე დროს გამოცდილმა სპეციალისტებმა 78.1%-ს მიაღწიეს, ხოლო რეზიდენტებისა და ექიმების შერეულმა ჯგუფმა 71.1%-იანი შედეგი დააფიქსირა. სისტემამ საუკეთესო მაჩვენებელი აპენდიციტის (98.6%) და პანკრეატიტის (92.3%) დროს აჩვენა. Google-ის AMIE ორნაწილიან სტრუქტურას იყენებს, სადაც ერთი აგენტი პაციენტთან საუბრობს, ხოლო მეორე აანალიზებს მონაცემებს სამედიცინო გაიდლაინების მიხედვით. 100 შემთხვევის ანალიზისას AMIE-ის მკურნალობის გეგმები 95%-ში მიიჩნიეს მართებულად, როდესაც ექიმების შემთხვევაში ეს მაჩვენებელი 72% იყო, რაც სამედიცინო პერსონალის შეშფოთებას იწვევს. მიუხედავად მაღალი მაჩვენებლებისა, ორივე ჯგუფი სიფრთხილისკენ მოუწოდებს საზოგადოებას. კვლევის თანაავტორი, იაკობ კათერი აცხადებს: „ჩვენ ვხედავთ წინასწარ ჩვენებას იმისა, თუ როგორ შეუძლია ხელოვნურ ინტელექტს მედიცინის გარდაქმნა.“ მან ეს სისტემები თვითმფრინავის ავტოპილოტს შეადარა, რაც ადამიანის კონტროლის აუცილებლობაზე მიუთითებს. დამოუკიდებელი ექსპერტები აღნიშნავენ, რომ ეს კვლევები მხოლოდ სიმულაციებს ეყრდნობა. ოქსფორდის უნივერსიტეტის პროფესორი, ქეთრინ პოუპი მიუთითებს, რომ ეს მაინც შორს არის რეალური, კომპლექსური და ქაოტური სამედიცინო ყოველდღიურობისგან, სადაც ექიმებს ბევრი არაპროგნოზირებადი ფაქტორისა და ემოციური მდგომარეობის გათვალისწინება უწევთ. ედინბურგის უნივერსიტეტის პროფესორი, ჯული ჯეკო განმარტავს, რომ სისტემების უპირატესობა გეგმების სისრულესა და სიზუსტეში მდგომარეობს, და არა კლინიკური სისწორის ფუნდამენტურ სხვაობაში. ხელოვნური ინტელექტი მკაცრად გაწერილ სტანდარტებს მიყვება, რაც რეალურ ცხოვრებაში გაცილებით რთულია და ხშირად ინდივიდუალურ მიდგომას მოითხოვს. გამორჩეული აღმოჩენა კვლევის დამატებით ექსპერიმენტებში იმალება. AMIE ამჟამად მუშაობს მოძველებულ Gemini 1.5 Flash მოდელზე, ხოლო MIRA იყენებს GPT-4o-სა და o1-preview-ს. მკვლევარებმა სცადეს AMIE-ის სპეციალური სტრუქტურა ახალ Gemini 2.5 Flash მოდელზე გადაეტანათ, რათა შეემოწმებინათ მისი ეფექტურობა. ახალ მოდელზე გადატანის შემდეგ სპეციალიზებული სისტემის უპირატესობა თითქმის გაქრა. ეს ექსპერიმენტი აჩვენებს, რომ სპეციალიზებული დამხმარე არქიტექტურა მხოლოდ სუსტი მოდელების შეცდომებს აკომპენსირებს, რაც მომავალში ამ სტრუქტურას ზედმეტ ბარგად აქცევს და კითხვის ნიშნის ქვეშ აყენებს მის შემდგომ გამოყენებას. ძლიერი ბაზისური მოდელები ამ ამოცანებს დამოუკიდებლად უმკლავდებიან. ახალი თაობის სისტემები, როგორებიცაა Gemini 2.5 Pro და GPT-5, უკვე აჩვენებენ მსგავს კლინიკურ შედეგებს დამატებითი საინჟინრო სტრუქტურების გარეშეც, რაც სამედიცინო ტექნოლოგიების სწრაფ განვითარებაზე და დამხმარე სისტემების გაუფასურებაზე მეტყველებს. მკვლევარები დასძენენ, რომ MIRA-ს არქიტექტურა საავადმყოფოს კლინიკურ სისტემებთან კავშირს ეყრდნობა. ეს ნაწილი არ მოძველდება უფრო ძლიერი მოდელების გამოჩენის შემთხვევაშიც, რაც სისტემას გრძელვადიან პერსპექტივაში გამოყენებადს ხდის და უზრუნველყოფს მის ინტეგრაციას რეალურ საავადმყოფოებში. სამედიცინო სფეროს წარმომადგენლები ასევე აღნიშნავენ, რომ MIRA და AMIE მოდელების ინტეგრაცია საავადმყოფოებში დიდ დროს და რესურსებს მოითხოვს. მიუხედავად კარგი შედეგებისა, ექიმები არ არიან მზად სრულად ენდონ ხელოვნურ ინტელექტს. საბოლოო ჯამში, Nature-ში გამოქვეყნებული კვლევები გვაჩვენებს მედიცინის მომავალს, თუმცა რეალური გარდაქმნა მხოლოდ ბაზისური მოდელების განვითარებასთან ერთად მოხდება. ტექნოლოგიების სწრაფი ტემპი კი სპეციალიზებულ სისტემებს მოძველების საფრთხეს უქმნის.
AI systems rival doctors in new Nature studies, but one result suggests the tech won't age well