Topo

Para onde o mundo vai

Tecnologia que grava consulta médica deverá revelar a saúde do paciente

Mônica Matsumoto

13/12/2019 04h00

Chokniti Khongchum/ Pixabay

Durante a consulta médica, o paciente faz relatos e o médico conduz as perguntas para descobrir os sintomas e fatos relevantes para a investigação médica. Você gostaria de ter a sua consulta médica gravada em áudio? E o profissional de saúde? Além do conteúdo de texto, a voz ainda tem nuances, titubeios, cadência… e tudo isso também pode ser usado! Quais as possibilidades que se abrem com essas gravações?

Na semana passada, a Amazon lançou em seu evento Re:invent um serviço que permite a transcrição de áudio em texto. Ou seja, a consulta toda é gravada e depois transformada automaticamente em texto por um interpretador de voz. Nesse serviço da Amazon, o interpretador se especializou em termos difíceis, como nome de remédios e procedimentos, que são próprios do contexto médico. Assim, o que antes ia para a ficha médica, agora pode ir para o prontuário eletrônico do paciente, o texto ou áudio todo.

Essa ferramenta pode ser usada, basicamente, de duas formas: para transcrever o áudio da consulta toda, ou para transcrever o áudio do médico fazendo seu relatório da consulta. Guardar a transcrição da consulta toda é praticamente um feito inédito, que só é possível pelos avanços do prontuário eletrônico. O laudo por voz, por sua vez, já é usado por algumas especialidades médicas como a radiologia. Como transcrever demora mais tempo que falar, gravar o áudio é muito mais rápido que digitar.

Os desdobramentos

O vice-presidente de inteligência artificial da Amazon AWS Matt Wood afirma que "o objetivo principal é dar ao médico mais tempo para gastar onde é mais importante: com o paciente", ou seja, ao invés de ficar digitando no computador relatórios, o médico pode passar mais tempo com o paciente ou atender mais pacientes.

Com certeza, nos tempos atuais, a produtividade do médico é muito importante. Pensar onde o profissional de saúde gasta seu tempo e o workflow para atendimento do paciente são métricas de eficiência e qualidade do atendimento. Não apenas por objetividade, é claro, mas também é uma forma de economizar recursos e aumentar o lucro da indústria de saúde. A tentativa da indústria é sempre melhorar onde o médico adiciona mais valor na cadeia produtiva, considerando o preço da consulta e procedimentos. 

Uma tendência hoje é ter laudo estruturado, com um formato já definido, com campos de informação essenciais para serem preenchidos, e textos de descrições de achados e evidência bem padronizados. 

A gravação da consulta como um todo vai na corrente oposta, pois a conversa não é algo super objetivo e estruturado. Afinal, o que fazer com horas de conversa livre. Em um primeiro momento parece ótimo ter toda a informação, mas quem vai ler ou ouvir toda essa prosa? O próximo passo está claro: serão serviços automáticos para extrair as informações mais relevantes da consulta. Ou seja, organizadores computacionais de informação médica. 

Uma vez organizados, esses dados podem ser usados para investigação científica. Por exemplo, pode-se descobrir que o relato de tais e tais sintomas pode prever que um tratamento médico funcionará bem. Olhando as consultas passadas, pode-se fazer inferências estatisticamente embasadas. Como ferramenta de pesquisa, parece um campo bem promissor.

Em situações de maior risco, como cirurgias, essas gravações poderiam ser usadas como uma caixa-preta nos vôos, que serve para entender acertos e falhas, e também proteger pacientes e médicos em casos judiciais. 

Além da transcrição da voz

A transcrição da voz é uma boa ferramenta, mas ela não capta tudo. A voz ainda engloba a cadência, o tom, as pausas, a forma de se expressar… tudo isso pode trazer informações para o médico. A voz pode revelar o ânimo do paciente, se o paciente está ofegante, se há conexão entre ideias, entre outras coisas. 

Alguns estudos já tentam desvendar na análise de fala essas características, principalmente no campo da saúde mental. Como exemplo de ferramenta diagnóstica, temos o caso de uma cientista brasileira da UFRN, Natália Mota. Ela conseguiu desvendar por análise de voz o diagnóstico de um transtorno mental importante, a esquizofrenia. A cientista usou a análise computacional da fala, para avaliar a organização da comunicação do paciente. Quando o paciente relata um sonho, após um surto psicótico, basta apenas 30 segundos de fala para diferenciar um paciente com esquizofrenia, o que antes demoraria meses ou anos para confirmar. Por esse trabalho, Natália foi indicada para o prêmio Nature 2019 de pesquisa, na categoria pesquisa inspiradora.

Com uma visão positiva, acredito que ferramentas de transcrição de voz e de análise de fala podem trazer grandes avanços para a ciência e para a prática médica. E, por mais que a análise dos dados possa ser automatizada, existem limites claros para as tecnologias atuais.

A parte humana da conversa, entretanto, ninguém pode substituir. Aliás, nada melhor do que a mãe ou alguém muito próximo para reconhecer o seu tom de voz! O médico também tenta captar essas nuances na conversa. Em instantes já sabem se você está doente, cansado, animado ou feliz. 

Sobre os autores

Daniel Schultz é cientista, professor de microbiologia e membro do núcleo de ciências computacionais em Dartmouth (EUA). Estuda a dinâmica dos processos celulares, com foco na evolução de bactérias resistentes a antibióticos. É formado em engenharia pelo ITA, doutor em química pela Universidade da Califórnia San Diego e pós-doutorado em biologia sistêmica em Harvard. Possui trabalhos de alto impacto publicados em várias áreas, da física teórica à biologia experimental, e busca integrar essas várias áreas do conhecimento para desvendar os detalhes de como funciona a vida ao nível microscópico.

Monica Matsumoto é cientista e professora de Engenharia Biomédica no ITA. Curiosa, ela tem interesse em áreas multidisciplinares e procura conectar pesquisadores em diferentes campos do conhecimento. Monica é formada em engenharia pelo ITA e doutora em ciências pela USP, e trabalhou em diferentes instituições como InCor/HCFMUSP, UPenn e EyeNetra.

Shridhar Jayanthi é Agente de Patentes com registro no escritório de patentes norte-americano (USPTO) e tem doutorado em Engenharia Elétrica pela Universidade de Michigan (EUA) e diploma de Engenheiro de Computação pelo ITA. Atualmente, ele trabalha com empresas de alta tecnologia para facilitar obtenção de patentes e, nas (poucas) horas vagas, é um estudante de problemas na intersecção entre direito, tecnologia e sociedade. Antes disso, Shridhar teve uma vida acadêmica com passagens pela Rice, MIT, Michigan, Pennsylvania e no InCor/USP, e trabalhou com pesquisa em áreas diversas da matemática, computação e biologia sintética.

Sobre o blog

Novidades da ciência e tecnologia, trazidas por brasileiros espalhados pelo mundo fazendo pesquisa de ponta. Um espaço para discussões sobre os rumos que as novas descobertas e inovações tecnológicas podem trazer para a sociedade.