Informações do Trabalho
Titulo
Geração automática de mensagem de commit utilizando o GPT
Subtítulo
Autor
THIAGO DE OLIVEIRA ABREU
Orientador
GLEIPH GHIOTTO LIMA DE MENEZES
Resumo
As mensagens de commit são resumos de mudanças nos artefatos de software importantes para o entendimento e manutenibilidade do código. Entretanto, escrevê-las demanda tempo e uma boa elaboração na escolha de palavras que consigam descrever com precisão o motivo da modificação. Diversas abordagens já propuseram maneiras de gerar automaticamente as mensagens de commit. De maneira geral, as propostas utilizam inteligência artificial em conjunto com técnicas de processamento de linguagem natural. Também utilizam dados dos repositórios públicos do GitHub para estabelecer um conjunto de dados de treinamento para a inteligência artificial. Porém, a maioria das abordagens conta apenas com dados retirados de repositórios Java, tirando de foco outras linguagens de programação altamente utilizadas atualmente. Além disso, existem modelos de linguagem de grande porte capazes de serem explorados para a tarefa de geração de mensagens de commit, como o GPT-4. Portanto, neste trabalho avaliou-se o GPT-4 na geração automática das mensagens de commit e buscou-se avaliar como a inserção do histórico de mensagens de commit impacta a qualidade dos resultados. Como base de comparação, foi feita uma busca na literatura pelo modelo de geração de mensagens de commit com o melhor resultado e que fosse reprodutível, sendo o CoRec o modelo escolhido. A base de dados utilizada é composta por projetos escritos em JavaScript, uma linguagem de programação altamente utilizada. Os resultados mostraram que o GPT-4 (B-Norm de 12,63%) teve um desempenho superior ao modelo CoRec (B-Norm de 11,54%) e que a inclusão do histórico de mensagens de commit aumentou a eficácia do GPT-4, alcançando um B-Norm de 15%.
Ano:
2024
Palavras-Chave
Commit, Geração automática de mensagens, GPT, Aprendizado de máquina, Rede neural de recorrência
Obter PDF
Obter arquivos extras
Obter Bibtex