sidebanner

nyheder

Siden IBM Watson startede i 2007, har mennesker kontinuerligt forfulgt udviklingen af ​​medicinsk kunstig intelligens (AI). Et brugbart og kraftfuldt medicinsk AI-system har et enormt potentiale til at omforme alle aspekter af moderne medicin, muliggøre smartere, mere præcis, effektiv og inkluderende pleje, bringe velvære til sundhedspersonale og patienter og derved forbedre menneskers sundhed betydeligt. I de sidste 16 år har forskere inden for medicinsk AI samlet sig inden for forskellige små felter, men på nuværende tidspunkt har de endnu ikke været i stand til at bringe science fiction til virkelighed.

I år, med den revolutionerende udvikling af AI-teknologi som ChatGPT, har medicinsk AI gjort store fremskridt på mange områder. Hidtil uset gennembrud inden for medicinsk AI's evner: Nature Journal har løbende lanceret forskning i medicinske store sprogmodeller og medicinske billedbasiske modeller; Google udgiver Med-PaLM og dens efterfølger og når et ekspertniveau i spørgsmålene til den amerikanske lægeeksamen. Store akademiske tidsskrifter vil fokusere på medicinsk AI: Nature udgiver perspektiverne på den grundlæggende model for generel medicinsk AI; Efter en række anmeldelser af AI inden for medicin tidligere på året udgav New England Journal of Medicine (NEJM) sin første digitale sundhedsoversigt den 30. november og lancerede det første nummer af NEJM-undertidsskriftet NEJM AI den 12. december. Landingsbanen for medicinsk AI er yderligere moden: JAMA-undertidsskriftet udgav det globale initiativ til deling af medicinske billeddata; Den amerikanske fødevare- og lægemiddeladministration (FDA) udvikler udkast til retningslinjer for regulering af medicinsk AI.

Nedenfor gennemgår vi de betydelige fremskridt, som forskere verden over har gjort i retning af brugbar medicinsk AI i 2023.

801

Grundlæggende model for medicinsk AI

Konstruktionen af ​​medicinsk AI-grundmodel er uden tvivl årets hotteste forskningsfokus. Nature-tidsskrifterne har i løbet af året udgivet oversigtsartikler om den universelle grundlæggende model for sundhedspleje og den store sprogmodel for sundhedspleje. Medical Image Analysis, det førende tidsskrift i branchen, har gennemgået og set frem til udfordringerne og mulighederne ved grundmodelforskning inden for medicinsk billedanalyse og foreslået konceptet "stamtavle for grundmodel" for at opsummere og vejlede udviklingen af ​​grundmodelforskning inden for medicinsk AI. Fremtiden for grundlæggende AI-modeller til sundhedspleje bliver tydeligere. Ved at trække på de succesfulde eksempler på store sprogmodeller som ChatGPT, ved hjælp af mere avancerede selvovervågede præ-træningsmetoder og en enorm akkumulering af træningsdata, forsøger forskere inden for medicinsk AI at bygge 1) sygdomsspecifikke basismodeller, 2) generelle basismodeller og 3) multimodale store modeller, der integrerer en bred vifte af tilstande med massive parametre og overlegne muligheder.

AI-model for medicinsk dataindsamling

Ud over de store AI-modeller, der spiller en stor rolle i downstream kliniske dataanalyseopgaver, er teknologien repræsenteret af generative AI-modeller også dukket op i upstream klinisk dataindsamling. Processen, hastigheden og kvaliteten af ​​dataindsamling kan forbedres betydeligt ved hjælp af AI-algoritmer.

 

Tidligere i år offentliggjorde Nature Biomedical Engineering en undersøgelse fra Tyrkiets Straits University, der fokuserede på at bruge generativ AI til at løse problemet med patologisk billedassisteret diagnose i kliniske anvendelser. Artefakter i frossent væv under kirurgi er en hindring for hurtig diagnostisk evaluering. Selvom formalin- og paraffinindlejret (FFPE) væv giver en prøve af højere kvalitet, er produktionsprocessen tidskrævende og tager ofte 12-48 timer, hvilket gør det uegnet til brug i kirurgi. Forskerholdet foreslog derfor en algoritme kaldet AI-FFPE, som kan få vævet i det frosne snit til at se ud som FFPE. Algoritmen korrigerede med succes artefakterne i de frosne snit, forbedrede billedkvaliteten og bevarede samtidig de klinisk relevante egenskaber. I klinisk validering forbedrer AI-FFPE-algoritmen patologers diagnostiske nøjagtighed for tumorsubtyper betydeligt, samtidig med at den kliniske diagnosetid forkortes betydeligt.

Cell Reports Medicine rapporterer et forskningsarbejde udført af et team fra Jilin Universitys Third Clinical College, Department of Radiology, Zhongshan Hospital tilknyttet Fudan University og Shanghai University of Science and Technology [25]. Denne undersøgelse foreslår et generel deep learning og iterativ rekonstruktionsfusionsframework (Hybrid DL-IR) med høj alsidighed og fleksibilitet, der viser fremragende billedrekonstruktionsydelse i hurtig MR, lavdosis-CT og hurtig PET. Algoritmen kan opnå MR-single-organ multi-sequence scanning på 100 sekunder, reducere strålingsdosis til kun 10% af CT-billedet og eliminere støj, og kan rekonstruere små læsioner fra PET-optagelse med 2 til 4 gange acceleration, samtidig med at effekten af ​​bevægelsesartefakter reduceres.

Medicinsk AI i samarbejde med sundhedspersonale

Den hurtige udvikling af medicinsk AI har også fået sundhedspersonale til seriøst at overveje og udforske, hvordan man kan samarbejde med AI for at forbedre kliniske processer. I juli i år foreslog DeepMind og et tværinstitutionelt forskerhold i fællesskab et AI-system kaldet Complementary Driven Clinical Workflow Delay (CoDoC). Diagnosticeringsprocessen diagnosticeres først af et prædiktivt AI-system, derefter bedømmes det af et andet AI-system på baggrund af det foregående resultat, og hvis der er tvivl, stilles diagnosen endeligt af en kliniker for at forbedre diagnostisk nøjagtighed og balancere effektiviteten. Når det kommer til screening for brystkræft, reducerede CoDoC antallet af falsk positive med 25 % med den samme falsk negative rate, samtidig med at klinikernes arbejdsbyrde reduceredes med 66 % sammenlignet med den nuværende "double-read arbitration"-proces i Storbritannien. Med hensyn til TB-klassificering blev antallet af falsk positive reduceret med 5 til 15 procent med den samme falsk negative rate sammenlignet med uafhængig AI og kliniske arbejdsgange.

Tilsvarende introducerede Annie Y. Ng et al. fra Kheiron Company i London, Storbritannien, yderligere AI-læsere (i samarbejde med menneskelige undersøgere) for at gennemgå resultaterne, når der ikke var nogen tilbagekaldelsesresultater i den dobbeltlæste voldgiftsproces, hvilket forbedrede problemet med misset detektion i tidlig screening for brystkræft, og processen havde næsten ingen falske positiver. Et andet studie, ledet af et team på University of Texas McGovern Medical School og udført på fire slagtilfældecentre, anvendte computertomografi angiografi (CTA)-baseret AI-teknologi til at automatisere detektionen af ​​​​store vaskulære okklusive iskæmiske slagtilfælde (LVO). Klinikere og radiologer modtager realtidsadvarsler på deres mobiltelefoner inden for få minutter efter, at CT-billeddannelse er afsluttet, hvilket underretter dem om den mulige tilstedeværelse af LVO. Denne AI-proces forbedrer arbejdsgangene på hospitalet for akut iskæmisk slagtilfælde, hvilket reducerer tiden fra dør til lyske fra indlæggelse til behandling og giver muligheder for vellykket redning. Resultaterne er offentliggjort i JAMA Neurology.

En AI-sundhedsmodel til universel gavn

2023 vil også byde på en masse godt arbejde, der bruger medicinsk kunstig intelligens til at finde funktioner, der er usynlige for det menneskelige øje, ud fra mere tilgængelige data, hvilket muliggør universel diagnose og tidlig screening i stor skala. I begyndelsen af ​​året offentliggjorde Nature Medicine undersøgelser udført af Zhongshan Eye Center på Sun Yat-sen University og Second Affiliated Hospital på Fujian Medical University. Ved at bruge smartphones som applikationsterminaler brugte de tegneserielignende videobilleder til at fremkalde børns blik og registrere børns blikadfærd og ansigtstræk, og analyserede yderligere unormale modeller ved hjælp af deep learning-modeller for med succes at identificere 16 øjensygdomme, herunder medfødt grå stær, medfødt ptose og medfødt grøn stær, med en gennemsnitlig screeningsnøjagtighed på mere end 85%. Dette giver et effektivt og let populariseret teknisk middel til storstilet tidlig screening af synsnedsættelse hos spædbørn og relaterede øjensygdomme.

Ved årets udgang rapporterede Nature Medicine om arbejde udført af mere end 10 medicinske og forskningsinstitutioner verden over, herunder Shanghai Institute of Pancreatic Disease og First Affiliated Hospital of Zhejiang University. Forfatteren anvendte kunstig intelligens til screening for bugspytkirtelkræft hos asymptomatiske personer på fysiske undersøgelsescentre, hospitaler osv. for at detektere læsionstræk i almindelige CT-billeder, der er vanskelige at detektere med det blotte øje alene, for at opnå effektiv og ikke-invasiv tidlig påvisning af bugspytkirtelkræft. Ved gennemgang af data fra mere end 20.000 patienter identificerede modellen også 31 tilfælde af klinisk oversete læsioner, hvilket forbedrede de kliniske resultater betydeligt.

Deling af medicinske data

I 2023 er der dukket mange flere perfekte datadelingsmekanismer og succesfulde cases op rundt om i verden, hvilket sikrer samarbejde på tværs af flere centre og dataåbenhed under forudsætning af at beskytte databeskyttelse og -sikkerhed.

For det første har AI-forskere ved hjælp af selve AI-teknologien bidraget til delingen af ​​medicinske data. Qi Chang og andre fra Rutgers University i USA udgav en artikel i Nature Communications, hvor de foreslår en føderal læringsramme, DSL, baseret på distribuerede syntetiske, kontradiktoriske netværk, som bruger generativ AI til at træne de specifikke genererede data fra multicentre og derefter erstatter de reelle data fra multicentre med de genererede data. Sikre AI-træning baseret på big data fra flere centre, samtidig med at databeskyttelse beskyttes. Det samme team open source et datasæt med genererede patologiske billeder og deres tilsvarende annoteringer. Segmenteringsmodellen, der trænes på det genererede datasæt, kan opnå lignende resultater som de reelle data.

Dai Qionghai-teamet fra Tsinghua University har udgivet en artikel om npj Digital Health, der foreslår Relay Learning, som bruger big data fra flere steder til at træne AI-modeller under forudsætning af lokal datasuverænitet og ingen netværksforbindelse på tværs af steder. Det balancerer datasikkerhed og bekymringer om privatlivets fred med stræben efter AI-ydeevne. Det samme team udviklede og validerede efterfølgende i fællesskab CAIMEN, et pan-mediastinalt tumordiagnosesystem til CT-scanning af thorax, baseret på føderal læring, i samarbejde med First Affiliated Hospital of Guangzhou Medical University og 24 hospitaler over hele landet. Systemet, som kan anvendes på 12 almindelige mediastinale tumorer, opnåede 44,9 procent bedre nøjagtighed, når det blev brugt alene, end når det blev brugt af menneskelige eksperter alene, og 19 procent bedre diagnosenøjagtighed, når menneskelige eksperter blev assisteret af det.

På den anden side er der adskillige initiativer i gang for at opbygge sikre, globale, store medicinske datasæt. I november 2023 offentliggjorde Agustina Saenz og andre fra Institut for Biomedicinsk Informatik på Harvard Medical School online i Lancet Digital Health en global ramme for deling af medicinske billeddata kaldet Artificial Intelligence Data for All Healthcare (MAIDA). De arbejder sammen med sundhedsorganisationer over hele verden for at give omfattende vejledning om dataindsamling og anonymisering ved hjælp af den amerikanske Federal Demonstration Partner (FDP)-skabelon til at standardisere datadeling. De planlægger gradvist at frigive datasæt indsamlet i forskellige regioner og kliniske miljøer rundt om i verden. Det første datasæt forventes at blive frigivet i begyndelsen af ​​2024, og der kommer flere, efterhånden som partnerskabet udvides. Projektet er et vigtigt forsøg på at opbygge et globalt, storstilet og mangfoldigt sæt af offentligt tilgængelige AI-data.

I kølvandet på forslaget har UK Biobank sat et eksempel. UK Biobank offentliggjorde nye data den 30. november fra helgenomsekventeringen af ​​sine 500.000 deltagere. Databasen, som offentliggør den komplette genomsekvens for hver af de 500.000 britiske frivillige, er den største komplette database over det menneskelige genom i verden. Forskere over hele verden kan anmode om adgang til disse anonymiserede data og bruge dem til at undersøge det genetiske grundlag for sundhed og sygdom. Genetiske data har altid været meget følsomme i forhold til verifikation tidligere, og denne historiske præstation fra UK Biobank beviser, at det er muligt at opbygge en åben, privatlivsfri global storskaladatabase. Med denne teknologi og database er medicinsk AI uundgåeligt til at indvarsle det næste spring.

Verifikation og evaluering af medicinsk AI

Sammenlignet med den hurtige udvikling af medicinsk AI-teknologi i sig selv er udviklingen af ​​verifikation og evaluering af medicinsk AI lidt langsom. Validering og evaluering inden for det generelle AI-felt ignorerer ofte de reelle behov for AI hos klinikere og patienter. Traditionelle randomiserede kontrollerede kliniske forsøg er for besværlige til at matche den hurtige iteration af AI-værktøjer. At forbedre verifikations- og evalueringssystemet, der er egnet til medicinske AI-værktøjer, så hurtigt som muligt, er det vigtigste for at fremme medicinsk AI og virkelig tage et spring fra forskning og udvikling til klinisk landing.

I Googles forskningsartikel om Med-PaLM, offentliggjort i Nature, offentliggjorde teamet også MultiMedQA-evalueringsbenchmarket, som bruges til at vurdere store sprogmodellers evne til at tilegne sig klinisk viden. Benchmarket kombinerer seks eksisterende professionelle medicinske spørgsmåls- og svardatasæt, der dækker professionel medicinsk viden, forskning og andre aspekter, samt et online søgedatabase med medicinske spørgsmål, der tager højde for online spørgsmål og svar mellem læger og patienter og forsøger at uddanne AI til en kvalificeret læge ud fra mange aspekter. Derudover foreslår teamet en ramme baseret på menneskelig vurdering, der tager højde for flere dimensioner af fakta, forståelse, ræsonnement og mulig bias. Dette er en af ​​de mest repræsentative forskningsindsatser for at evaluere AI inden for sundhedspleje, der er offentliggjort i år.

Men betyder det faktum, at store sprogmodeller viser et højt niveau af kodning af klinisk viden, at store sprogmodeller er kompetente til kliniske opgaver i den virkelige verden? Ligesom en medicinstuderende, der består den professionelle lægeeksamen med en perfekt score, stadig er langt fra at være en solooverlæge, er de evalueringskriterier, som Google har foreslået, muligvis ikke et perfekt svar på emnet medicinsk AI-evaluering af AI-modeller. Allerede i 2021 og 2022 har forskere foreslået rapporteringsretningslinjer som Decid-AI, SPIRIT-AI og INTRPRT i håb om at vejlede den tidlige udvikling og validering af medicinsk AI under forudsætning af at tage hensyn til faktorer som klinisk praktisk anvendelighed, sikkerhed, menneskelige faktorer og gennemsigtighed/fortolkelighed. For nylig offentliggjorde tidsskriftet Nature Medicine en undersøgelse foretaget af forskere fra Oxford University og Stanford University om, hvorvidt man skal bruge "ekstern validering" eller "tilbagevendende lokal validering" til at validere AI-værktøjer.

AI-værktøjers upartiske natur er også en vigtig evalueringsretning, der har fået opmærksomhed i år fra både Science- og NEJM-artikler. AI udviser ofte bias, fordi den er begrænset til træningsdata. Denne bias kan afspejle social ulighed, som yderligere udvikler sig til algoritmisk diskrimination. National Institutes of Health lancerede for nylig Bridge2AI-initiativet, der anslås at koste 130 millioner dollars, for at opbygge forskellige datasæt (i overensstemmelse med målene for MAIDA-initiativet nævnt ovenfor), der kan bruges til at validere medicinske AI-værktøjers upartiskhed. Disse aspekter tages ikke i betragtning af MultiMedQA. Spørgsmålet om, hvordan man måler og validerer medicinske AI-modeller, kræver stadig en omfattende og dybdegående diskussion.

I januar udgav Nature Medicine en debatartikel med titlen "The Next Generation of Evidence-Based Medicine" af Vivek Subbiah fra University of Texas MD Anderson Cancer Center, der gennemgik begrænsningerne ved kliniske forsøg, som blev afsløret i forbindelse med COVID-19-pandemien, og påpegede modsætningen mellem innovation og overholdelse af den kliniske forskningsproces. Endelig påpeger den en fremtid med omstrukturering af kliniske forsøg – den næste generation af kliniske forsøg, der bruger kunstig intelligens, det vil sige brugen af ​​kunstig intelligens fra et stort antal historiske forskningsdata, data fra den virkelige verden, multimodale kliniske data og data fra bærbare enheder for at finde nøgleevidens. Betyder det, at AI-teknologi og kliniske valideringsprocesser for AI kan være gensidigt forstærkende og udvikle sig i takt med hinanden i fremtiden? Dette er det åbne og tankevækkende spørgsmål i 2023.

Regulering af medicinsk kunstig intelligens

Udviklingen af ​​AI-teknologi stiller også udfordringer for reguleringen af ​​AI, og politikere verden over reagerer omhyggeligt og forsigtigt. I 2019 offentliggjorde FDA for første gang et forslag til reguleringsramme for softwareændringer til medicinsk udstyr med kunstig intelligens (diskussionsudkast), der detaljerede sin potentielle tilgang til præmarkedsgennemgang af AI- og maskinlæringsdrevne softwareændringer. I 2021 foreslog FDA "Kunstig intelligens/maskinlæringsbaseret software som en handlingsplan for medicinsk udstyr", som præciserede fem specifikke reguleringsforanstaltninger for medicinsk AI. I år genudsendte FDA præmarkedsindsendelsen for enhedssoftwarefunktioner for at give information om anbefalinger til præmarkedsindsendelse til FDA's evaluering af sikkerheden og effektiviteten af ​​enhedssoftwarefunktioner, herunder nogle softwareenhedsfunktioner, der bruger maskinlæringsmodeller trænet gennem maskinlæringsmetoder. FDA's reguleringspolitik har udviklet sig fra et indledende forslag til praktisk vejledning.

Efter offentliggørelsen af ​​det europæiske sundhedsdataområde i juli sidste år har EU endnu engang vedtaget loven om kunstig intelligens. Førstnævnte har til formål at udnytte sundhedsdata bedst muligt til at levere sundhedspleje af høj kvalitet, reducere uligheder og understøtte data til forebyggelse, diagnose, behandling, videnskabelig innovation, beslutningstagning og lovgivning, samtidig med at det sikres, at EU-borgerne har større kontrol over deres personlige sundhedsdata. Sidstnævnte gør det klart, at det medicinske diagnosesystem er et højrisiko-AI-system, og det er nødvendigt med målrettet, stærkt tilsyn, livscyklustilsyn og tilsyn før evaluering. Det Europæiske Lægemiddelagentur (EMA) har offentliggjort et udkast til refleksionsoplæg om brugen af ​​AI til at støtte lægemiddeludvikling, regulering og anvendelse med vægt på at forbedre AI's troværdighed for at sikre patientsikkerhed og integriteten af ​​kliniske forskningsresultater. Samlet set tager EU's reguleringstilgang gradvist form, og de endelige implementeringsdetaljer kan blive mere detaljerede og strenge. I skarp kontrast til EU's strenge regulering gør Storbritanniens AI-reguleringsplan det klart, at regeringen planlægger at anlægge en blød tilgang og ikke vedtage nye lovforslag eller oprette nye regulatorer for nu.

I Kina har Medical Device Technical Review Center (NMPA) under National Medical Products Administration tidligere udstedt dokumenter som "Review Points of Deep Learning Assisted Decision Software", "Guiding Principles for the Registration Review of Artificial Intelligence Medical Devices (Draft for Comment)" og "Circular on Guiding Principles for the Classification and Definition of Artificial Intelligence Medical Software Products (nr. 47 i 2021)". I år blev "Resumé af de første resultater af klassificeringen af ​​medicinsk udstyrsprodukter i 2023" igen udgivet. Denne serie af dokumenter gør definitionen, klassificeringen og reguleringen af ​​medicinske softwareprodukter inden for kunstig intelligens klarere og nemmere at betjene og giver klar vejledning til produktpositionering og registreringsstrategier for forskellige virksomheder i branchen. Disse dokumenter giver en ramme og ledelsesbeslutninger for den videnskabelige regulering af medicinsk udstyr inden for kunstig intelligens. Det er værd at se frem til, at dagsordenen for China Medical Artificial Intelligence Conference, der blev afholdt i Hangzhou fra 21. til 23. december, opretter et særligt forum om digital medicinsk styring og udvikling af offentlige hospitaler af høj kvalitet samt et forum for standardisering af industrien inden for testning og evaluering af medicinsk udstyr inden for kunstig intelligens. På det tidspunkt vil embedsmænd fra National Development and Reform Commission og NMPA deltage i mødet og kan frigive nye oplysninger.

Konklusion

I 2023 begyndte medicinsk AI at blive integreret i hele den medicinske upstream- og downstream-proces, der dækker hospitalsdataindsamling, fusion, analyse, diagnose og behandling samt screening i lokalsamfundet, og der samarbejdes organisk med læger/sygdomsbekæmpelsespersonale, hvilket viser potentialet til at bringe velvære til menneskers sundhed. Brugbar forskning i medicinsk AI begynder at gry. I fremtiden afhænger fremskridtene inden for medicinsk AI ikke kun af selve den teknologiske udvikling, men kræver også fuldt samarbejde fra industrien, universiteterne og den medicinske forskning samt støtte fra beslutningstagere og regulatorer. Dette tværfaglige samarbejde er nøglen til at opnå AI-integrerede medicinske tjenester og vil helt sikkert fremme udviklingen af ​​menneskers sundhed.


Opslagstidspunkt: 30. dec. 2023