A inteligência artificial (IA) tem se tornado tema de crescente interesse nas pesquisas médicas, e vem sendo cada vez mais aplicada na Dermatologia. Um dos principais ramos da IA é o Deep Learning, tecnologia predominante no processamento de dados complexos e de alta dimensão.1 O Deep Learning utiliza redes neurais artificiais que aprendem automaticamente as relações entre dados de entrada, como imagens, e saídas, como diagnósticos, sem necessidade de programação detalhada por humanos. Inspiradas no funcionamento do cérebro, as redes neurais ajustam a intensidade de suas conexões à medida que aprendem padrões essenciais, como características visuais, facilitando a previsão de resultados.2
Nesse contexto, o ChatGPT é um exemplo de modelo avançado de linguagem que utiliza técnicas de Deep Learning. Pertencente à série de modelos de transformadores de pré‐treinamento generativo (GPT), desenvolvidos pela OpenAI, o ChatGPT destaca‐se como um dos maiores modelos de linguagem disponíveis atualmente, com acesso público e gratuito desde 2023.3
O ChatGPT já foi testado em provas de título de diferentes especialidades médicas, como Oftalmologia (Canadá), Dermatologia (Reino Unido) e na prova de Título de Especialista em Dermatologia (TED) no Brasil.4,5 No estudo que avaliou o ChatGPT no TED, a acurácia foi de 75,34%. Outro estudo no Reino Unido, com questões do Specialty Certificate Examination in Dermatology, obteve acurácia de 63,1% usando o ChatGPT 3.5, e 90,5% com o ChatGPT 4.0.6
Este estudo visa explorar a performance diagnóstica do ChatGPT em cenários clínicos dermatológicos publicados na seção “Qual o seu diagnóstico?” dos Anais Brasileiros de Dermatologia. Foi realizado estudo observacional retrospectivo para avaliar a performance do ChatGPT 4.0 em casos clínicos dermatológicos publicados entre 2019 e 2023. Foram incluídos casos com informações clínicas completas, imagens, exames laboratoriais, anatomopatológicos e imuno‐histoquímicos, seguidos de perguntas com múltipla escolha. Casos sem múltipla escolha foram excluídos.
A interação com o ChatGPT 4.0 seguiu esta sequência: a) digitar “Gostaria que você respondesse o diagnóstico correto do caso clínico a seguir” e apertar Enter; b) colar o caso clínico completo, incluindo upload de imagens e legendas; c) colar a pergunta “Qual o seu diagnóstico” e as quatro alternativas, apertar Enter; d) aguardar a resposta da IA e compará‐la com a dos autores de cada caso.
As respostas do ChatGPT 4.0 foram comparadas com a opção correta pré‐definida nos ABD, categorizando‐as como “corretas” ou “incorretas”. Em seguida, os casos foram classificados de acordo com o método de diagnóstico (clínico, anatomopatológico, microbiológico). O desempenho da IA foi avaliado pela proporção de diagnósticos corretos em relação ao total de casos analisados.
Foram selecionados 25 casos, e a IA diagnosticou corretamente 21, resultando em acurácia de 84%. A figura 1 mostra o desempenho do ChatGPT categorizado por métodos diagnósticos, com melhor desempenho em casos resolvidos clinicamente ou por diagnóstico anatomopatológico e menor precisão nos que exigiam método microbiológico.
O estudo avaliou a performance do ChatGPT 4.0 em diagnósticos dermatológicos com múltipla escolha, com quatro opções pré‐determinadas para cada caso clínico. Diferente de um teste de acurácia diagnóstica tradicional, em que a IA forneceria um diagnóstico aberto, aqui ela selecionou a opção correta entre alternativas limitadas. Isso não permite afirmar que a acurácia diagnóstica da IA foi testada, mas sim sua performance em um contexto específico.
Diversas barreiras para a aplicação da IA em Dermatologia são discutidas, incluindo problemas técnicos como a falta de generalização, padronização de imagens e a integração de dados clínicos complexos, além de questões éticas e regulatórias, como a aceitação da tecnologia e a responsabilidade legal em casos de erro.7
Os erros da IA no estudo estavam associados a diagnósticos envolvendo a integração de dados clínicos, anatomopatológicos e microbiológicos, sugerindo limitações da IA na integração de diferentes fontes de informação em casos atípicos.
Portanto, a prática médica, especialmente em uma especialidade complexa como a Dermatologia, envolve contínuo processo de aprendizado e aprimoramento, tanto para profissionais humanos quanto para modelos de inteligência artificial.
Suporte financeiroNenhum.
Contribuição dos autoresMatheus Alves Pacheco: Concepção e o desenho do estudo; redação do artigo ou revisão crítica do conteúdo intelectual importante.
Athos Paulo Santos Martini: Redação do artigo ou revisão crítica do conteúdo intelectual importante.
Conflito de interessesNenhum.
Como citar este artigo: Pacheco MA, Martini APS. Using ChatGPT 4.0 for diagnosis in Dermatology: performance analysis in clinical cases from Anais Brasileiros de Dermatologia. An Bras Dermatol. 2025;100:501143.
Trabalho realizado no Hospital Universitário da Universidade Federal de Santa Catarina, Florianópolis, SC, Brasil.