Por Andres Myers os médicos se reúnen con docenas de pacientes todos los días y hacen recomendaciones críticas relacionadas con la salud basadas en notas, descripciones de pacientes, resultados de pruebas e información de diagnóstico recopilada en esas reuniones. Toda esta información textual normalmente se acumula en la historia clínica electrónica (EHR) del paciente. El gran volumen de información contenida en los registros médicos electrónicos se ha convertido en un punto de inflexión en la medicina moderna. La mayoría de los médicos ahora dependen de breves resúmenes de notas extensas y registros médicos para gestionar la atención al paciente. “La carga clínica de la documentación médica es alta y requiere mucho tiempo. Y esto tiene consecuencias para los pacientes”, afirma Dave Van Veen , candidato a doctorado en ingeniería eléctrica y primer autor de un nuevo estudio en la revista Nature Medicine , que está explorando las posibilidades del resumen asistido por IA. "Los médicos tienen menos tiempo para atender al paciente y siempre existe la posibilidad de cometer un error al resumir información de la HCE". En el estudio, Van Veen y sus colegas de la Universidad de Stanford adaptaron ocho grandes modelos de lenguaje (LLM) al texto clínico y compararon sus habilidades de resumido con las de expertos médicos humanos. La mayoría de las veces, dicen los investigadores, los médicos preferían los resúmenes generados por la IA a los realizados por humanos. “La IA a menudo genera resúmenes comparables o mejores que los escritos por expertos médicos. Esto demuestra el potencial de los LLM para integrarse en el flujo de trabajo clínico y reducir la carga de documentación”, afirma el autor principal del estudio, Akshay Chaudhari , profesor de radiología y, por cortesía, de ciencia de datos biomédicos. "Este desarrollo y validación de tecnología puede permitir a los médicos dedicar más tiempo a los pacientes que a la HCE". Manzanas a manzanas Resumir registros médicos es un trabajo difícil, de gran trascendencia y orientado a los detalles, incluso para profesionales médicos experimentados. “Creemos que la IA tiene un gran potencial para servir como ayuda para acelerar la carga de casos del médico y también para reducir errores. Pasar más tiempo con el paciente y una mayor precisión podría conducir a una mejor atención al paciente”, afirma Van Veen. En su estudio, Chaudhari, Van Veen y sus colegas trabajaron con ocho LLM establecidos y los adaptaron para resumir una variedad de información médica textual: informes de radiología, preguntas de pacientes, notas de progreso y diálogos médico-paciente. Luego, en pruebas ciegas, un panel de 10 médicos comparó los resúmenes generados por los LLM con mejor desempeño con los creados por expertos médicos humanos, calificando los resúmenes según su “integridad, corrección y concisión”. "En la mayoría de los casos, los resúmenes de los LLM mejor adaptados fueron calificados como buenos o mejores que los creados por humanos", dice Van Veen. Casi la mitad de las veces (45%), los evaluadores pensaron que los resúmenes generados por IA eran al menos tan buenos como los producidos por humanos. Más de un tercio de las veces (36%), los juzgaron “superiores”. No hay lugar para el error Sabiendo que se ha hablado mucho de la tendencia de la IA a “alucinar” (a, en esencia, inventar información que no es cierta), los investigadores estaban interesados en explorar si la IA introduciría información fabricada en sus resúmenes. De ser así, sería un gran golpe contra la IA, considerando las graves consecuencias del entorno médico. "Resulta que los humanos también a veces se equivocan y que el mejor modelo, aunque no es perfecto, produce menos casos de información inventada que incluso los expertos médicos humanos", dice Van Veen. "Lejos de introducir imprecisiones, los LLM podrían terminar reduciendo la información fabricada en la práctica clínica". Van Veen y sus colegas ahora perfeccionarán sus modelos y eventualmente trabajarán para llevar la asistencia de IA a entornos clínicos del mundo real. "Manténganse al tanto. Estamos cerca de probar los LLM en entornos del mundo real y ayudar a los médicos a dedicar menos tiempo a la documentación para que puedan brindar una mejor atención a los pacientes”, afirma Van Veen. Los autores que contribuyen al estudio incluyen: Cara Van Uden, Louis Blankemeier, Jean-Benoit Delbrouck, Asad Aali, Christian Bluethgen, Anuj Pareek, Malgorzata Polacin, Eduardo Pontes Reis, Anna Seehofnerová, Nidhi Rohatgi, Poonam Hosamani, William Collins, Neera Ahuja, Curtis P Langlotz, Jason Hom, Sergios Gatidis y John Pauly. El apoyo financiero para este estudio es cortesía de los créditos de Microsoft Azure OpenAI, Accelerate Foundation Models Academic Research (AFMAR), One Medical, National Institute of Health (NIH), Agency for Healthcare Research and Quality, Gordon and Betty Moore Foundation y el National Institute. de Imagenología Biomédica y Bioingeniería. Liga al estudio: Los modelos de lenguaje grande adaptados pueden superar a los expertos médicos en el resumen de textos clínicos https://www.nature.com/articles/s41591-024-02855-5