A aprendizagem computacional está a ajudar a criar uma ferramenta de diagnóstico para o glaucoma, desenvolvida pela Altice Labs, em parceria com o Centro Cirúrgico de Coimbra. Analisados os primeiros mil olhos, os algoritmos conseguiram taxas de acerto muito promissoras. Passámos para a fase de ajuste do modelo, principalmente para os casos “suspeito de glaucoma”

A inteligência artificial (IA), tecnologia que permite às máquinas simularem a inteligência humana e a capacidade de resolver problemas, tem protagonizado um papel muito importante em inúmeras aplicações de diversas áreas, tais como a comunicação, a educação, o entretenimento e, especialmente, a saúde. A utilização de IA em contextos clínicos é uma realidade cada vez mais presente e tem demonstrado muito potencial, por exemplo, ao nível de processos de diagnóstico.

O glaucoma, patologia caracterizada pela danificação do nervo ótico, constitui uma das principais causas de cegueira irreversível em todo o mundo, pelo que é crítico a sua deteção num estado precoce. Não obstante esta necessidade, o facto de o glaucoma ser uma doença assintomática numa fase inicial – dificulta um diagnóstico e, consequente, atuação atempados. Esta dificuldade, juntamente com a complexidade inerente ao processo de diagnóstico do glaucoma, que é influenciado pela subjetividade dos especialistas, constituem uma motivação para o desenvolvimento de ferramentas de diagnóstico inovadoras e acessíveis, nomeadamente através da integração de machine learning (ML) ou aprendizagem computacional.

A aprendizagem computacional é um ramo da IA dedicado ao estudo de algoritmos capazes de aprender a partir de um conjunto de dados, isto é, a partir de um conjunto de informações/características sobre um determinado contexto, e de se generalizarem perante informações novas. Da mesma forma que os seres humanos aprendem com base em experiências passadas, a agir em conformidade em situações futuras, podendo ainda assim cometer erros, que podem ser mais ou menos graves, também os algoritmos, que são sequências finitas de instruções seguidas para resolver um problema, podem aprender.

A utilização de ML para a automação do diagnóstico de glaucoma pressupõe quatro fases de trabalho: a leitura e ingestão dos dados, a seleção das características mais importantes, a aplicação de algoritmos e a avaliação do seu desempenho.

Os dados utilizados neste projeto são fornecidos pelo Centro Cirúrgico de Coimbra à Altice Labs sob a forma de exames anonimizados realizados aos pacientes. Estes exames contêm imagens com valores medidos sobre várias partes de um olho, tais como a retina macular e as camadas de células ganglionares e de fibras nervosas, e ainda o campo visual.

Depois de lidas as informações presentes nos exames, através de uma tecnologia que permite converter as imagens em texto, estas são organizadas numa tabela, onde cada linha está associada a um paciente/olho e cada coluna corresponde a uma característica medida sobre o respetivo olho. Além disso, é conhecido o diagnóstico atribuído por um especialista a cada olho, que pode ser não glaucoma (quando o olho não tem glaucoma), suspeito de glaucoma (quando não há certezas sobre a presença de glaucoma, mas existem indicadores que apontam nesse sentido) ou glaucoma (quando o olho tem glaucoma).

Após a organização dos dados e o seu pré-processamento, no qual se procede, por exemplo, à quantificação de valores em falta, são selecionadas as características mais importantes para o problema, através de análises estatísticas e da recolha de feedback dos especialistas. 

Atualmente, o conjunto de dados utilizado é constituído por 52 características, associadas a 974 olhos, dos quais 64% são não glaucomas, 16% são suspeitos de glaucoma e 20% são glaucomas. Depois de construído o conjunto de dados final, chega o momento de aplicar algoritmos capazes de prever um diagnóstico. Do variado leque de algoritmos, os mais utilizados têm sido algoritmos baseados em “árvores”, que são estruturas que permitem separar, sucessivamente, os olhos do conjunto de dados que lhes está subjacente, através de perguntas, estabelecidas pelo próprio algoritmo, sobre as características que constituem o conjunto de dados, de modo que consiga separar, o mais possível, olhos com diagnósticos diferentes.

A aplicação de um algoritmo exige que o conjunto de dados original seja dividido em dois subconjuntos, o conjunto de treino e o conjunto de teste. Inicialmente, as características e o diagnóstico dos olhos do conjunto de treino são submetidos ao algoritmo, para que este aprenda as características associadas a cada diagnóstico, de onde resulta um modelo treinado. Seguidamente, os olhos do conjunto de teste são submetidos a este modelo, sem o respetivo diagnóstico associado, para que o modelo preveja o respetivo diagnóstico.

A última fase do processo consiste em avaliar o desempenho do modelo através da comparação dos diagnósticos previstos com os verdadeiros diagnósticos. Nos melhores resultados obtidos até ao momento, as taxas de acerto dos casos não glaucoma, suspeito de glaucoma e glaucoma são, respetivamente, de 91%, 37% e 90%. Isto significa que o modelo utilizado tem muito sucesso na previsão dos não glaucomas e dos glaucomas, mas alguma dificuldade na deteção dos suspeitos de glaucoma.

O facto de os suspeitos de glaucoma estarem em menor número no conjunto de dados, do diagnóstico da maioria dos olhos ser não glaucoma e de estatisticamente os dois diagnósticos serem muito semelhantes faz com que os modelos aprendam melhor as características dos não glaucomas, do que as dos suspeitos e, consequentemente, tendam a confundir os segundos com os primeiros. A adoção de técnicas no sentido de contrariar este comportamento já está em curso.

O principal objetivo com o trabalho desenvolvido na Altice Labs é a inclusão dos algoritmos na prática clínica diária, que pode ser feita no sentido do rastreio da patologia ou no sentido de fornecer uma segunda opinião aos especialistas. Independentemente do caminho a seguir, e de uma possível evolução do trabalho atual da previsão de um diagnóstico para a previsão do risco para a patologia, a utilização de algoritmos num contexto clínico só faz sentido se as relações humanas não ficarem comprometidas, isto é, se a comunicação entre médicos e pacientes continuar a ser assegurada.

Rita Oliveira
(Junior Data Scientist, Altice Labs)

Maria Manuel Castro
(Senior Data Scientist, Altice Labs)

Luís Cortesão
(Senior Data Scientist, Altice Labs)

Deixar um Comentário