Please use this identifier to cite or link to this item: http://repositoriosenaiba.fieb.org.br/handle/fieb/1894
Title: Avaliação de algoritmos de aprendizado de máquina na classificação de lançamentos bancários: um estudo aplicado ao Ministério Público do Estado da Bahia
Authors: Santos, Jucimar Cerqueira dos
Lima, Marcelo da Silva
Pinto, Marcus Vinicius Caetano
metadata.dc.contributor.advisor: Graça, Tacito Henrique da Silva
Keywords: Lançamentos bancários;Aprendizado de máquina;SVM;Análise de dados;Setor público;BERT
Issue Date: 31-Jul-2024
Citation: SANTOS, Jucimar Cerqueira dos; LIMA, Marcelo da Silva; PINTO, Marcus Vinicius Caetano. Avaliação de algoritmos de aprendizado de máquina na classificação de lançamentos bancários: um estudo aplicado ao Ministério Público do Estado da Bahia. Orientador: Tacito Henrique da Silva Graça. 2024. 35 f. Artigo (Especialização em Data Science & Analytics) – Centro Universitário SENAI CIMATEC, Salvador, 2024.
metadata.dc.description.resumo: Este trabalho investigou a eficácia de diversos algoritmos de aprendizado de máquina na tarefa de classificação de lançamentos bancários, utilizando dados recebidos de instituições financeiras pelo Ministério Público do Estado da Bahia (MPBA). O objetivo geral do estudo foi fortalecer a capacidade de investigação do MPBA através da automação e aperfeiçoamento do processo de classificação e análise de transações financeiras. A metodologia empregada focou em uma abordagem comparativa do desempenho, na execução da tarefa proposta, de técnicas tradicionais de aprendizado de máquina: Regressão Logística, Support Vector Machine (SVM), Árvore de Decisão e K-Nearest Neighbors (KNN) e, também, de variados ajustes do modelo pré-treinado BERT. Os dados utilizados neste estudo foram anonimizados em adequação às exigências legais e rigorosamente explorados e dimensionados visando o atendimento das demandas técnicas e à capacidade computacional disponível. Os principais resultados revelaram que, de forma geral, os modelos estudados apresentaram ótimo desempenho na classificação dos lançamentos bancários. O modelo SVM, com a configuração apropriada, atingiu o F1-score de 88,54% no conjunto de dados de teste, superando os demais modelos testados. Este estudo contribui significativamente para a adoção de soluções de inteligência artificial no setor público, propondo os fundamentos de um modelo escalável que pode ser aplicado em outras instituições públicas para a análise de dados financeiros. A aplicação dessas técnicas não apenas aprimora as operações existentes, mas também abre novas avenidas para a inovação no tratamento e análise de grandes volumes de dados em órgãos governamentais.
Abstract: This study investigated the effectiveness of several machine learning algorithms in the task of classifying bank transactions, using data received from financial institutions by the Public Prosecutor's Office of the State of Bahia (MPBA). The general objective of the study was to strengthen the MPBA's investigative capacity by automating and improving the process of classifying and analyzing financial transactions. The methodology employed focused on a comparative approach to the performance, in executing the proposed task, of traditional machine learning techniques: Logistic Regression, Support Vector Machine (SVM), Decision Tree and K-Nearest Neighbors (KNN) and also of various adjustments of the pre-trained BERT model. The data used in this study were anonymized in accordance with legal requirements and rigorously explored and dimensioned in order to meet the technical demands and the available computational capacity. The main results revealed that, in general, the models studied presented excellent performance in classifying bank transactions. The SVM model, with the appropriate configuration, achieved an F1-score of 88.54% on the test dataset, outperforming the other models tested. This study contributes significantly to the adoption of artificial intelligence solutions in the public sector, proposing the foundations of a scalable model that can be applied in other public institutions for the analysis of financial data. The application of these techniques not only improves existing operations, but also opens new avenues for innovation in the processing and analysis of large volumes of data in government agencies.
Description: "Todos os direitos reservados. É permitida a reprodução parcial ou total desta obra, desde que citada a fonte e que não seja para venda ou qualquer fim comercial."
URI: http://repositoriosenaiba.fieb.org.br/handle/fieb/1894
Appears in Collections:Artigos (Pós-Graduação) Especialização em Data Science & Analytics

Files in This Item:
File Description SizeFormat 
ARTIGO_JUCIMAR CERQUEIRA DOS SANTOS.pdfARTIGO / ESPECIALIZAÇÃO / SENAI CIMATEC1.82 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.