Des que IBM Watson va començar el 2007, els humans han estat perseguint contínuament el desenvolupament de la intel·ligència artificial (IA) mèdica. Un sistema d'IA mèdica útil i potent té un enorme potencial per remodelar tots els aspectes de la medicina moderna, permetent una atenció més intel·ligent, precisa, eficient i inclusiva, aportant benestar als treballadors mèdics i als pacients, i millorant així considerablement la salut humana. En els darrers 16 anys, tot i que els investigadors d'IA mèdica s'han acumulat en diversos camps petits, en aquesta etapa, encara no han pogut portar la ciència-ficció a la realitat.
Aquest any, amb el desenvolupament revolucionari de la tecnologia d'IA com ara ChatGPT, la IA mèdica ha fet grans progressos en molts aspectes. Avenç sense precedents en la capacitat de la IA mèdica: la revista Nature ha llançat contínuament la investigació del model de llenguatge gran mèdic i del model bàsic d'imatges mèdiques; Google publica Med-PaLM i el seu successor, assolint un nivell d'expert en les preguntes de l'examen de metges dels EUA. Les principals revistes acadèmiques se centraran en la IA mèdica: Nature publica les perspectives sobre el model bàsic de la IA mèdica general; Després d'una sèrie de revisions de la IA en medicina a principis d'aquest any, el New England Journal of Medicine (NEJM) va publicar la seva primera revisió de salut digital el 30 de novembre i va llançar el primer número de la subrevista NEJM NEJM AI el 12 de desembre. El sòl d'aterratge de la IA mèdica està més madur: la subrevista JAMA va publicar la iniciativa global de compartició de dades d'imatges mèdiques; la Food and Drug Administration (FDA) dels EUA està desenvolupant esborranys de directrius per a la regulació de la IA mèdica.
A continuació, revisem els progressos significatius que han fet investigadors d'arreu del món en la direcció d'una IA mèdica útil el 2023.
Model bàsic d'IA mèdica
La construcció d'un model bàsic d'IA mèdica és, sens dubte, el focus de recerca més candent d'aquest any. Les revistes Nature han publicat articles de revisió sobre el model bàsic universal de l'atenció mèdica i el model de llenguatge ampli de l'atenció mèdica durant l'any. Medical Image Analysis, la revista més important del sector, ha revisat i ha anticipat els reptes i les oportunitats de la recerca de models bàsics en l'anàlisi d'imatges mèdiques, i ha proposat el concepte de "pedigrí del model bàsic" per resumir i guiar el desenvolupament de la recerca de models bàsics d'IA mèdica. El futur dels models bàsics d'IA per a l'atenció mèdica s'està aclarint. A partir dels exemples reeixits de models de llenguatge ampli com ara ChatGPT, utilitzant mètodes de preentrenament autosupervisats més avançats i una gran acumulació de dades d'entrenament, els investigadors en el camp de la IA mèdica intenten construir 1) models base específics de malalties, 2) models base generals i 3) models grans multimodals que integrin una àmplia gamma de modes amb paràmetres massius i capacitats superiors.
Model d'IA d'adquisició de dades mèdiques
A més dels grans models d'IA que tenen un paper important en les tasques posteriors d'anàlisi de dades clíniques, en l'adquisició de dades clíniques posteriors també ha sorgit la tecnologia representada pels models d'IA generatius. El procés, la velocitat i la qualitat de l'adquisició de dades es poden millorar significativament mitjançant algoritmes d'IA.
A principis d'aquest any, Nature Biomedical Engineering va publicar un estudi de la Universitat de l'Estret de Turquia que se centrava en l'ús de la IA generativa per resoldre el problema del diagnòstic assistit per imatge patològica en aplicacions clíniques. Els artefactes en teixit de seccions congelades durant la cirurgia són un obstacle per a una avaluació diagnòstica ràpida. Tot i que el teixit inclòs en formalina i parafina (FFPE) proporciona una mostra de més qualitat, el seu procés de producció requereix molt de temps i sovint triga entre 12 i 48 hores, cosa que el fa inadequat per al seu ús en cirurgia. Per tant, l'equip de recerca va proposar un algoritme anomenat AI-FFPE, que pot fer que l'aspecte del teixit a la secció congelada sigui similar al FFPE. L'algoritme va corregir amb èxit els artefactes de les seccions congelades, va millorar la qualitat de la imatge i va conservar les característiques clínicament rellevants alhora. En la validació clínica, l'algoritme AI-FFPE millora significativament la precisió diagnòstica dels patòlegs per als subtipus de tumors, alhora que escurça considerablement el temps de diagnòstic clínic.
Cell Reports Medicine presenta un treball de recerca d'un equip de la Tercera Facultat Clínica de la Universitat de Jilin, el Departament de Radiologia de l'Hospital Zhongshan afiliat a la Universitat de Fudan i la Universitat de Ciència i Tecnologia de Xangai [25]. Aquest estudi proposa un marc de treball de fusió d'aprenentatge profund i reconstrucció iterativa d'ús general (Híbrid DL-IR) amb una alta versatilitat i flexibilitat, que mostra un excel·lent rendiment de reconstrucció d'imatges en ressonància magnètica ràpida, TC de baixa dosi i PET ràpid. L'algoritme pot aconseguir una exploració multiseqüència d'un sol òrgan per RM en 100 segons, reduir la dosi de radiació a només el 10% de la imatge de TC i eliminar el soroll, i pot reconstruir petites lesions a partir de l'adquisició de PET amb una acceleració de 2 a 4 vegades, alhora que redueix l'efecte dels artefactes de moviment.
IA mèdica en col·laboració amb treballadors mèdics
El ràpid desenvolupament de la IA mèdica també ha portat els professionals mèdics a considerar i explorar seriosament com col·laborar amb la IA per millorar els processos clínics. El juliol d'aquest any, DeepMind i un equip de recerca multiinstitucional van proposar conjuntament un sistema d'IA anomenat Complementary Driven Clinical Workflow Delay (CoDoC). El procés de diagnòstic primer es diagnostica mitjançant un sistema d'IA predictiu, després es jutja mitjançant un altre sistema d'IA sobre el resultat anterior i, si hi ha dubtes, finalment un metge fa el diagnòstic per millorar la precisió diagnòstica i l'eficiència de l'equilibri. Pel que fa al cribratge del càncer de mama, CoDoC va reduir les taxes de falsos positius en un 25% amb la mateixa taxa de falsos negatius, alhora que va reduir la càrrega de treball dels metges en un 66%, en comparació amb el procés actual d'"arbitratge de doble lectura" al Regne Unit. Pel que fa a la classificació de la tuberculosi, les taxes de falsos positius es van reduir entre un 5 i un 15% amb la mateixa taxa de falsos negatius en comparació amb la IA independent i els fluxos de treball clínics.
De la mateixa manera, Annie Y. Ng et al., de Kheiron Company a Londres, Regne Unit, van introduir lectors d'IA addicionals (en cooperació amb examinadors humans) per tornar a examinar els resultats quan no hi havia resultats de recuperació en el procés d'arbitratge de doble lectura, cosa que va millorar el problema de la detecció perduda en el cribratge precoç del càncer de mama, i el procés gairebé no va tenir falsos positius. Un altre estudi, dirigit per un equip de la Facultat de Medicina McGovern de la Universitat de Texas i realitzat en quatre centres d'ictus, va aplicar tecnologia d'IA basada en angiografia per tomografia computada (ACT) per automatitzar la detecció d'ictus isquèmic oclusiu vascular gran (OVV). Els clínics i radiòlegs reben alertes en temps real als seus telèfons mòbils pocs minuts després de completar les imatges de la TC, notificant-los la possible presència d'OVV. Aquest procés d'IA millora els fluxos de treball a l'hospital per a l'ictus isquèmic agut, reduint el temps porta-engonal des de l'ingrés fins al tractament i proporcionant oportunitats per a un rescat reeixit. Les troballes es publiquen a JAMA Neurology.
Un model d'atenció mèdica amb IA per a un benefici universal
El 2023 també veurem molta bona feina que utilitza la IA mèdica per trobar característiques invisibles a l'ull humà a partir de dades més fàcilment disponibles, permetent un diagnòstic universal i un cribratge precoç a escala. A principis d'any, Nature Medicine va publicar estudis realitzats pel Centre Oftalmològic Zhongshan de la Universitat Sun Yat-sen i el Segon Hospital Afiliat de la Universitat Mèdica de Fujian. Utilitzant telèfons intel·ligents com a terminals d'aplicacions, van utilitzar imatges de vídeo semblants a dibuixos animats per induir la mirada dels nens i registrar el comportament de la mirada i els trets facials dels nens, i van analitzar més a fons models anormals mitjançant models d'aprenentatge profund per identificar amb èxit 16 malalties oculars, incloent cataractes congènites, ptosi congènita i glaucoma congènit, amb una precisió mitjana de cribratge de més del 85%. Això proporciona un mitjà tècnic eficaç i fàcil de popularitzar per al cribratge precoç a gran escala de la discapacitat de la funció visual infantil i malalties oculars relacionades.
A finals d'any, Nature Medicine va publicar un treball realitzat per més de 10 institucions mèdiques i de recerca d'arreu del món, incloent-hi l'Institut de Malalties Pancreàtiques de Xangai i el Primer Hospital Afiliat de la Universitat de Zhejiang. L'autor va aplicar la IA al cribratge del càncer de pàncrees en persones asimptomàtiques en centres d'exploració física, hospitals, etc., per detectar les característiques de lesió en imatges de TC simples que són difícils de detectar només a simple vista, per tal d'aconseguir una detecció precoç eficient i no invasiva del càncer de pàncrees. En revisar dades de més de 20.000 pacients, el model també va identificar 31 casos de lesions clínicament passades per alt, cosa que va millorar significativament els resultats clínics.
Compartició de dades mèdiques
El 2023, han sorgit molts més mecanismes perfectes de compartició de dades i casos d'èxit arreu del món, garantint la cooperació multicèntrica i l'obertura de dades sota la premissa de protegir la privadesa i la seguretat de les dades.
En primer lloc, amb l'ajuda de la pròpia tecnologia d'IA, els investigadors de la IA han contribuït a l'intercanvi de dades mèdiques. Qi Chang i altres de la Universitat Rutgers dels Estats Units van publicar un article a Nature Communications, proposant un marc d'aprenentatge federal DSL basat en xarxes antagònica sintètiques distribuïdes, que utilitza IA generativa per entrenar les dades generades específiques de multicentres i després substitueix les dades reals dels multicentres per les dades generades. Garantir l'entrenament de la IA basat en big data multicèntric i, alhora, protegir la privadesa de les dades. El mateix equip també ha publicat de codi obert un conjunt de dades d'imatges patològiques generades i les seves anotacions corresponents. El model de segmentació entrenat sobre el conjunt de dades generat pot aconseguir resultats similars a les dades reals.
L'equip de Dai Qionghai de la Universitat de Tsinghua va publicar un article sobre npj Digital Health, proposant Relay Learning, que utilitza big data multi-site per entrenar models d'IA sota la premissa de la sobirania de dades locals i sense connexió de xarxa entre llocs. Equilibra les preocupacions sobre seguretat i privadesa de les dades amb la recerca del rendiment de la IA. Posteriorment, el mateix equip va desenvolupar i validar conjuntament CAIMEN, un sistema de diagnòstic de tumors panmediastínics per TC de tòrax basat en l'aprenentatge federal, en col·laboració amb el Primer Hospital Afiliat de la Universitat Mèdica de Guangzhou i 24 hospitals de tot el país. El sistema, que es pot aplicar a 12 tumors mediastínics comuns, va aconseguir una precisió del 44,9% millor quan s'utilitzava sol que quan l'utilitzaven només experts humans, i una precisió del 19% millor quan hi assistien experts humans.
D'altra banda, s'estan duent a terme diverses iniciatives per crear conjunts de dades mèdiques segurs, globals i a gran escala. El novembre de 2023, Agustina Saenz i altres persones del Departament d'Informàtica Biomèdica de la Facultat de Medicina de Harvard van publicar en línia a Lancet Digital Health un marc global per compartir dades d'imatges mèdiques anomenat Artificial Intelligence Data for All Healthcare (MAIDA). Estan treballant amb organitzacions sanitàries d'arreu del món per proporcionar una guia completa sobre la recopilació de dades i la desidentificació, utilitzant la plantilla del Soci de Demostració Federal dels Estats Units (FDP) per estandarditzar l'intercanvi de dades. Tenen previst publicar gradualment conjunts de dades recollides en diferents regions i entorns clínics d'arreu del món. Es preveu que el primer conjunt de dades es publiqui a principis de 2024, i n'hi haurà més a mesura que la col·laboració s'ampliï. El projecte és un intent important de construir un conjunt global, a gran escala i divers de dades d'IA disponibles públicament.
Arran de la proposta, el Biobanc del Regne Unit ha donat exemple. El 30 de novembre, el Biobanc del Regne Unit va publicar noves dades de la seqüenciació del genoma complet dels seus 500.000 participants. La base de dades, que publica la seqüència completa del genoma de cadascun dels 500.000 voluntaris britànics, és la base de dades completa del genoma humà més gran del món. Investigadors de tot el món poden sol·licitar accés a aquestes dades anonimitzades i utilitzar-les per investigar la base genètica de la salut i la malaltia. Les dades genètiques sempre han estat molt sensibles per a la seva verificació en el passat, i aquest assoliment històric del Biobanc del Regne Unit demostra que és possible construir una base de dades global a gran escala, oberta i sense privadesa. Amb aquesta tecnologia i base de dades, la IA mèdica està destinada a marcar el següent pas.
Verificació i avaluació de la IA mèdica
En comparació amb el ràpid desenvolupament de la tecnologia d'IA mèdica en si mateixa, el desenvolupament de la verificació i l'avaluació de la IA mèdica és lleugerament lent. La validació i l'avaluació en el camp general de la IA sovint ignoren les necessitats reals dels clínics i els pacients per a la IA. Els assajos clínics controlats aleatoris tradicionals són massa laboriosos per igualar la ràpida iteració de les eines d'IA. Millorar el sistema de verificació i avaluació adequat per a les eines d'IA mèdica el més aviat possible és el més important per promoure que la IA mèdica realment superi la investigació i el desenvolupament fins a l'aterratge clínic.
En l'article de recerca de Google sobre Med-PaLM, publicat a Nature, l'equip també va publicar el punt de referència d'avaluació MultiMedQA, que s'utilitza per avaluar la capacitat dels models de llenguatge gran per adquirir coneixement clínic. El punt de referència combina sis conjunts de dades de preguntes i respostes mèdiques professionals existents, que cobreixen el coneixement mèdic professional, la recerca i altres aspectes, així com un conjunt de dades de base de dades de preguntes mèdiques de cerca en línia, que considera les preguntes i respostes en línia entre metge i pacient, intentant entrenar la IA per convertir-la en un metge qualificat des de molts aspectes. A més, l'equip proposa un marc basat en l'avaluació humana que té en compte múltiples dimensions de fet, comprensió, raonament i possible biaix. Aquest és un dels esforços de recerca més representatius per avaluar la IA en l'atenció mèdica publicats aquest any.
Tanmateix, el fet que els models de llenguatge gran mostrin un alt nivell de coneixement clínic de codificació, vol dir que els models de llenguatge gran són competents per a tasques clíniques del món real? De la mateixa manera que un estudiant de medicina que aprova l'examen de metge professional amb una puntuació perfecta encara està lluny de ser un metge en cap solitari, els criteris d'avaluació proposats per Google poden no ser una resposta perfecta al tema de l'avaluació de la IA mèdica per a models d'IA. Ja el 2021 i el 2022, investigadors han proposat directrius d'informes com ara Decid-AI, SPIRIT-AI i INTRPRT, amb l'esperança de guiar el desenvolupament i la validació primerencs de la IA mèdica sota la condició de considerar factors com la practicitat clínica, la seguretat, els factors humans i la transparència/interpretabilitat. Recentment, la revista Nature Medicine va publicar un estudi realitzat per investigadors de la Universitat d'Oxford i la Universitat de Stanford sobre si cal utilitzar "validació externa" o "validació local recurrent" per validar les eines d'IA.
La naturalesa imparcial de les eines d'IA també és una direcció d'avaluació important que ha rebut atenció aquest any tant d'articles de Science com del NEJM. La IA sovint presenta biaix perquè es limita a les dades d'entrenament. Aquest biaix pot reflectir la desigualtat social, que evoluciona encara més cap a la discriminació algorítmica. Els Instituts Nacionals de Salut van llançar recentment la iniciativa Bridge2AI, que es calcula que costarà 130 milions de dòlars, per crear conjunts de dades diversos (d'acord amb els objectius de la iniciativa MAIDA esmentada anteriorment) que es puguin utilitzar per validar la imparcialitat de les eines d'IA mèdica. MultiMedQA no considera aquests aspectes. La qüestió de com mesurar i validar els models d'IA mèdica encara necessita una discussió extensa i profunda.
Al gener, Nature Medicine va publicar un article d'opinió titulat "The Next Generation of Evidence-Based Medicine" de Vivek Subbiah, del MD Anderson Cancer Center de la Universitat de Texas, que revisava les limitacions dels assajos clínics exposades en el context de la pandèmia de la COVID-19 i assenyalava la contradicció entre la innovació i l'adherència al procés de recerca clínica. Finalment, assenyala un futur de reestructuració dels assajos clínics: la propera generació d'assajos clínics que utilitzen intel·ligència artificial, és a dir, l'ús de la intel·ligència artificial a partir d'un gran nombre de dades de recerca històrica, dades del món real, dades clíniques multimodals i dades de dispositius portàtils per trobar proves clau. Vol dir això que la tecnologia d'IA i els processos de validació clínica de la IA poden reforçar-se mútuament i coevolucionar en el futur? Aquesta és la pregunta oberta i que fa reflexionar el 2023.
Regulació de la IA mèdica
L'avanç de la tecnologia de la IA també planteja reptes a la regulació de la IA, i els responsables polítics de tot el món hi responen amb cura i cura. El 2019, la FDA va publicar per primera vegada un Marc Regulador Proposta per a Canvis de Programari en Dispositius Mèdics d'Intel·ligència Artificial (Esborrany de Discussió), detallant el seu possible enfocament per a la revisió prèvia a la comercialització de modificacions de programari basades en la IA i l'aprenentatge automàtic. El 2021, la FDA va proposar el "Pla d'Acció de Programari Basat en Intel·ligència Artificial/Aprenentatge Automàtic com a Dispositiu Mèdic", que aclaria cinc mesures reguladores mèdiques específiques de la IA. Aquest any, la FDA va tornar a publicar la Presentació Precomercialització per a les Característiques del Programari del Dispositiu per proporcionar informació sobre les recomanacions de presentació prèvia a la comercialització per a l'avaluació per part de la FDA de la seguretat i l'eficàcia de les característiques del programari del dispositiu, incloses algunes característiques del dispositiu de programari que utilitzen models d'aprenentatge automàtic entrenats mitjançant mètodes d'aprenentatge automàtic. La política reguladora de la FDA ha evolucionat des d'una proposta inicial fins a una guia pràctica.
Després de la publicació de l'Espai Europeu de Dades de Salut el juliol de l'any passat, la UE ha tornat a promulgar la Llei d'Intel·ligència Artificial. La primera té com a objectiu fer el millor ús de les dades de salut per proporcionar una atenció mèdica d'alta qualitat, reduir les desigualtats i donar suport a les dades per a la prevenció, el diagnòstic, el tractament, la innovació científica, la presa de decisions i la legislació, alhora que garanteix que els ciutadans de la UE tinguin un major control sobre les seves dades de salut personals. La segona deixa clar que el sistema de diagnòstic mèdic és un sistema d'IA d'alt risc i que necessita adoptar una supervisió sòlida i específica, una supervisió de tot el cicle de vida i una supervisió prèvia a l'avaluació. L'Agència Europea de Medicaments (EMA) ha publicat un esborrany de document de reflexió sobre l'ús de la IA per donar suport al desenvolupament, la regulació i l'ús de fàrmacs, amb èmfasi en millorar la credibilitat de la IA per garantir la seguretat dels pacients i la integritat dels resultats de la recerca clínica. En general, l'enfocament regulador de la UE està prenent forma gradualment, i els detalls finals de la implementació poden ser més detallats i estrictes. En marcat contrast amb la regulació estricta de la UE, el pla regulador de la IA del Regne Unit deixa clar que el govern té previst adoptar un enfocament suau i no promulgar nous projectes de llei ni establir nous reguladors per ara.
A la Xina, el Centre de Revisió Tècnica de Dispositius Mèdics (NMPA) de l'Administració Nacional de Productes Mèdics ha publicat anteriorment documents com ara "Punts de revisió del programari de decisió assistida per aprenentatge profund", "Principis rectors per a la revisió del registre de dispositius mèdics d'intel·ligència artificial (esborrany per a comentaris)" i "Circular sobre els principis rectors per a la classificació i definició de productes de programari mèdic d'intel·ligència artificial (núm. 47 el 2021)". Aquest any, s'ha tornat a publicar el "Resum dels primers resultats de la classificació de productes de dispositius mèdics del 2023". Aquesta sèrie de documents fa que la definició, classificació i regulació dels productes de programari mèdic d'intel·ligència artificial sigui més clara i fàcil d'operar, i proporciona una guia clara per al posicionament del producte i les estratègies de registre de diverses empreses del sector. Aquests documents proporcionen un marc i decisions de gestió per a la regulació científica dels dispositius mèdics d'IA. Cal esperar que l'agenda de la Conferència d'Intel·ligència Artificial Mèdica de la Xina, celebrada a Hangzhou del 21 al 23 de desembre, estableixi un fòrum especial sobre governança mèdica digital i desenvolupament d'alta qualitat d'hospitals públics i un fòrum de desenvolupament de la indústria de l'estandardització de la tecnologia de proves i avaluació de dispositius mèdics d'intel·ligència artificial. En aquell moment, funcionaris de la Comissió Nacional de Desenvolupament i Reforma i la NMPA assistiran a la reunió i podrien publicar nova informació.
Conclusió
El 2023, la IA mèdica va començar a integrar-se en tot el procés mèdic, tant aigües amunt com aigües avall, cobrint la recopilació, la fusió, l'anàlisi, el diagnòstic i el tractament de dades hospitalàries, i el cribratge comunitari, i a col·laborar orgànicament amb els treballadors mèdics/de control de malalties, demostrant el potencial de portar benestar a la salut humana. La recerca útil en IA mèdica comença a sorgir. En el futur, el progrés de la IA mèdica no només depèn del desenvolupament tecnològic en si, sinó que també necessita la plena cooperació de la indústria, la universitat i la recerca mèdica i el suport dels responsables polítics i reguladors. Aquesta col·laboració interdisciplinària és la clau per aconseguir serveis mèdics integrats en IA i, sens dubte, promourà el desenvolupament de la salut humana.
Data de publicació: 30 de desembre de 2023




