Tamanho da fonte:
MODELO DE APRENDIZADO DE MÁQUINA PARA CLASSIFICAÇÃO DE MENSAGENS DE USUÁRIOS DO SISTEMA DE SAÚDE QUANTO À PRESENÇA DE NECESSIDADES DE SAÚDE
Última alteração: 2024-01-07
Resumo
O envio de mensagens eletrônicas é uma forma de comunicação usada em diversos serviços, incluindo os da área da saúde. Neste trabalho, é proposto um sistema de busca ativa de pacientes, em que mensagens são recebidas e classificadas em mensagens que são respondidas automaticamente ou mensagens que devem ser direcionadas para serem respondidas por um humano, em função de necessidades de saúde. A base de dados utilizada neste trabalho é uma base com as duas classes desbalanceadas. Para lidar com esse problema, foi utilizado o ChatGPT 3.5 para gerar mais exemplos da classe minoritária na base de dados. Foram comparados 3 cenários: o primeiro com dados na base original desbalanceada, o segundo com a base de dados de mensagens sintéticas geradas pelo ChatGPT e o terceiro com mensagens do ChatGPT, mas contendo linguagem coloquial e erros de português. Em todos os modelos foi utilizado o algoritmo XGBoost. O cenário onde o XGBoost apresentou melhor capacidade de discriminação entre as mensagens foi aquele treinado na base de dados com mensagens sintéticas sem erros de português.
Palavras-chave
Processamento de Linguagem Natural; classificação de texto; GPT
Texto completo:
PDF