Studija tvrdi da Google veštačka inteligencija nadmašuje ljudske lekare u dijagnostici i empatiji
Nova studija tvrdi da je Google-ov napredni AI četbot pokazao superiorne dijagnostičke sposobnosti i empatiju u poređenju sa sertifikovanim lekarima primarne zdravstvene zaštite u simuliranim medicinskim scenarijima.
„Nature“ izveštava da nedavna studija tvrdi da se Google-ov napredni AI chatbot ističe u medicinskoj dijagnostici. Nazvan Articulate Medical Intelligence Explorer (AMIE), ovaj sistem veštačke inteligencije, zasnovan na Google-ovom AI chatbot-u sa velikim jezičkim modelom (LLM), pokazao je sposobnost da vodi medicinske intervjue i ponudi dijagnoze sa tačnošću za koju studija tvrdi da se poklapa ili prevazilazi ljudske lekare.
Alan Karthikesalingam, naučnik za klinička istraživanja u Google Health-u u Londonu i koautor studije, primetio je jedinstvenost Google AI, rekavši: „Prema našim saznanjima, ovo je prvi put da je konverzacijski AI sistem ikada dizajniran optimalno za dijagnostički dijalog i uzimanje anamneze. Prema studiji, chatbot je bio tačniji od lekara primarne zdravstvene zaštite koji su sertifikovani od strane odbora u dijagnostikovanju respiratornih i kardiovaskularnih stanja, između ostalog, i bio je više rangiran u empatiji tokom medicinskih intervjua u poređenju sa ljudskim lekarima.
Međutim, AMIE chatbot je još uvek u eksperimentalnoj fazi i testiran je samo na glumcima obučenim da prikazuju ljude sa zdravstvenim problemima. Kartikesalingam je pozvao na oprez u tumačenju ovih rezultata, rekavši: „Želimo da se rezultati tumače sa oprezom“.
Globalno zagrevanje? 142 miliona Amerikanaca upozoreno na ektremnu hladnoću https://t.co/ZclEAlmFWb
— Nulta Tačka (@NultaTackaSrb) January 18, 2024
Obuka AI je uključivala novi metod za prevazilaženje nedostatka medicinskih razgovora u stvarnom svetu za podatke o obuci. Google tim je prvobitno fino podesio LLM sa postojećim skupovima podataka kao što su elektronski zdravstveni kartoni i transkribovani medicinski razgovori. Da bi dodatno obučili model, istraživači su podstakli LLM da igra ulogu i kao pacijent sa specifičnim stanjem i kao empatični kliničar, sa ciljem da razume istoriju pacijenta i osmisli potencijalne dijagnoze.
U testiranju sistema, istraživači su koristili 20 pojedinaca obučenih kao imitatori pacijenata u onlajn tekstualnim konsultacijama sa AMIE i ljudskim kliničarima. Sistem veštačke inteligencije ne samo da je odgovarao, već je u mnogim slučajevima i prevazišao dijagnostičku tačnost lekara. Karthikesalingam primećuje inherentnu prednost LLM-a u ovom kontekstu, objašnjavajući da može „brzo da sastavi dugačke i lepo strukturirane odgovore“, što mu omogućava da bude dosledno pažljiv bez da se umori.
Međutim, Kartikesalingam je primetio da „ovo ni na koji način ne znači da je jezički model bolji od lekara u uzimanju kliničke istorije“, pošto je u testu bilo mnogo faktora. Neki od lekara možda nisu navikli da dijagnostikuju pacijente preko tekstualnog ćaskanja, što je možda uticalo na njihov učinak.
Implikacije studije sežu dalje od dijagnostike. Kao što Daniel Ting, kliničar AI naučnik na medicinskoj školi Duke-NUS u Singapuru, ističe, ispitivanje sistema za pristrasnosti je od suštinskog značaja da bi se osiguralo da je algoritam pravedan i inkluzivan. Ting je takođe naglasio važnost privatnosti i rukovanja podacima u komercijalnim velikim jezičkim modelima, navodeći: „Za mnoge od ovih komercijalnih platformi velikih jezičkih modela trenutno još uvek nismo sigurni gde se podaci čuvaju i kako se analiziraju“.