CONTECSI - International Conference on Information Systems and Technology Management - ISSN 2448-1041, 20th CONTECSI - INTERNATIONAL CONFERENCE ON INFORMATION SYSTEMS AND TECHNOLOGY MANAGEMENT VIRTUAL

Tamanho da fonte: 
MODELO DE APRENDIZADO DE MÁQUINA PARA CLASSIFICAÇÃO DE MENSAGENS DE USUÁRIOS DO SISTEMA DE SAÚDE QUANTO À PRESENÇA DE NECESSIDADES DE SAÚDE
Adriana Camargo de Brito, Gustavo Torres Custodio, Rogerio Silicani Ribeiro, Rubens Carvalho Silveira, Renata Luciria Monteiro, Rodrigo Cabrera Castaldoni

Última alteração: 2024-01-07

Resumo


O envio de mensagens eletrônicas é uma forma de comunicação usada em diversos serviços, incluindo os da área da saúde. Neste trabalho, é proposto um sistema de busca ativa de pacientes, em que mensagens são recebidas e classificadas em mensagens que são respondidas automaticamente ou mensagens que devem ser direcionadas para serem respondidas por um humano, em função de necessidades de saúde. A base de dados utilizada neste trabalho é uma base com as duas classes desbalanceadas. Para lidar com esse problema, foi utilizado o ChatGPT 3.5 para gerar mais exemplos da classe minoritária na base de dados. Foram comparados 3 cenários: o primeiro com dados na base original desbalanceada, o segundo com a base de dados de mensagens sintéticas geradas pelo ChatGPT e o terceiro com mensagens do ChatGPT, mas contendo linguagem coloquial e erros de português. Em todos os modelos foi utilizado o algoritmo XGBoost. O cenário onde o XGBoost apresentou melhor capacidade de discriminação entre as mensagens foi aquele treinado na base de dados com mensagens sintéticas sem erros de português.

Palavras-chave


Processamento de Linguagem Natural; classificação de texto; GPT