No ano passado, no evento anual da Google Health, The Check Up, apresentámos o Med-PaLM 2, o nosso grande modelo de linguagem afinado para a área da saúde. Desde aí, o modelo tornou-se disponível para um conjunto de clientes globais e organizações parceiras que estão a criar soluções para uma variedade de utilizações – incluindo a simplificação da passagem de turnos entre enfermeiros e o apoio à documentação dos médicos. No final do ano passado, apresentamos o MedLM, uma família de modelos fundacionais para cuidados de saúde baseados no Med-PaLM 2, e disponibilizamo-lo de forma mais ampla através da plataforma Vertex AI da Google Cloud.
Desde então, o nosso trabalho em IA generativa aplicada à saúde tem progredido – desde as novas formas como estamos a treinar os nossos modelos de IA de saúde até às nossas investigações mais recentes sobre a aplicação da IA na indústria da saúde.
Novas modalidades nos modelos aplicados à saúde
A medicina é uma disciplina multimodal; é constituída por diferentes tipos de informações armazenadas em vários formatos — tais como imagens radiológicas, resultados laboratoriais, dados genéticos, contexto ambiental e muito mais. Para obter uma compreensão mais completa da saúde de uma pessoa, precisamos desenvolver uma tecnologia que compreenda todas estas informações.
Estamos a trazer novas capacidades para os nossos modelos na esperança de tornar a IA generativa mais útil para organizações de saúde e para a saúde das pessoas. Acabamos de apresentar o MedLM para o Raio-X ao Tórax, que tem o potencial de ajudar a transformar os fluxos de trabalho de radiologia, auxiliando na classificação dos Raio-X ao Tórax para uma variedade de casos de uso. Estamos a começar pelos Raio-X ao Tórax porque estes exames são essenciais na detecção das doenças pulmonares e cardíacas. O MedLM para os Raio-X ao Tórax já está disponível para trusted testers em preview experimental na Google Cloud.
Investigação no aperfeiçoamento dos nossos modelos para o domínio médico
Aproximadamente 30% do volume de dados mundial é gerado pela indústria da saúde – e, está a crescer 36% ao ano. Isto inclui grandes quantidades de texto, imagens, áudio e vídeo. Além disso, informações importantes sobre o historial dos pacientes ficam muitas vezes arquivadas, o que dificulta a rápida localização das informações relevantes.
Pelas razões mencionadas, estamos a investigar como uma versão do modelo Gemini, ajustada para o domínio médico, pode desbloquear novas capacidades para um raciocínio avançado, para a compreensão de um grande volume de contexto e para o processamento de múltiplas modalidades. A nossa investigação recente resultou num desempenho excepcional (91%) no benchmark de questões do tipo US Medical Licensing Exam (USMLE) e num conjunto de dados de vídeo chamado MedVidQA.
E como os nossos modelos Gemini são multimodais, conseguimos aplicar este modelo afinado a outros benchmarks clínicos, incluindo a resposta a perguntas sobre imagens de Raio-X ao Tórax e informações genéticas. Também estamos a ver resultados promissores nos nossos modelos ajustados para tarefas complexas, como a geração de relatórios para imagens 2D, como raios-X, bem como imagens 3D, como tomografias computadorizadas cerebrais – o que representa uma mudança radical na nossas capacidades de IA médica. Embora este trabalho se encontre ainda numa fase de investigação, há potencial para a IA generativa em radiologia trazer capacidades de assistência às organizações de saúde.
Um grande modelo de Linguagem pessoal de saúde para coaching e recomendações personalizadas
A Fitbit e o Google Research estão a trabalhar em conjunto para construir um grande modelo de linguagem pessoal para a saúde que pode potencializar recursos personalizados de saúde e de bem-estar na aplicação móvel Fitbit, ajudando as pessoas a obter ainda mais insights e recomendações a partir dos dados dos seus dispositivos Fitbit e Pixel. Este modelo está a ser ajustado para proporcionar capacidades de coaching personalizadas, como mensagens e orientações acionáveis, que podem ser individualizadas com base em metas pessoais de saúde e bem estar. Por exemplo, este modelo pode ser capaz de analisar variações nos seus padrões e qualidade do sono e, em seguida, sugerir recomendações sobre como o utilizador pode alterar a intensidade do seu treino com base nestes insights.
Este modelo está a ser desenvolvido com base nos modelos Gemini e ajustado com base num conjunto diversificado e não identificado de sinais de saúde provenientes de estudos de caso de pesquisa de alta qualidade. Os estudos estão a ser recolhidos e validados em parceria com formadores credenciados e especialistas em bem-estar, permitindo que o modelo exiba capacidades de raciocínio profundas sobre dados fisiológicos e comportamentais. Por exemplo, estamos a testar o desempenho usando testes práticos semelhantes a exames de certificação em medicina do sono e estamos a constatar que o nosso modelo tem atualmente um bom desempenho. Vamos continuar a iterar e a aprender à medida que construímos este novo grande modelo de linguagem de saúde pessoal e, em breve, vamos partilhar mais investigações.
Um novo estudo para compreender melhor as capacidades de assistência da IA
A IA generativa já está a funcionar como uma ferramenta de apoio para os médicos, ajudando-os nas tarefas administrativas, tais como a documentação, que normalmente é algo que depende de muitas horas de trabalho. Não vamos parar por aqui – estamos a desenvolver, atualmente, o nosso trabalho com parceiros para explorar o que é possível.
No início deste ano, apresentamos o AMIE (Articulate Medical Intelligence Explorer), um sistema de IA de pesquisa construído com base num grande modelo de linguagem e otimizado para raciocínio de diagnóstico e conversas clínicas. Exploramos o desempenho da AMIE ao simular consultas com pacientes baseadas em texto, adaptando uma estrutura bem conhecida de “Exames Clínicos Estruturados por Objetivos” ao tipo de interface de utilizador familiar a milhões de pessoas que usam sistemas de IA generativa. Numa comparação aleatória com médicos reais de cuidados primários que realizaram as mesmas consultas de texto simuladas, a AMIE obteve uma classificação superior ou igual a estas consultas quando medidas em termos de características, como a precisão diagnóstica, empatia e explicação útil. Os próximos passos serão testar este processo com uma organização de saúde para verificar a sua utilidade para os médicos e pacientes.
Os cuidados de saúde apresentam alguns dos desafios mais complexos da sociedade. Estamos a trabalhar juntamente com os nossos parceiros para saber como a IA pode superar esses problemas e melhorar o atendimento.
Publicado por Yossi Matias, Global Lead of AI for Health, Climate and Education, Google