Please use this identifier to cite or link to this item: http://repositoriosenaiba.fieb.org.br/handle/fieb/1168
Title: Modelo computacional de adaptação em aprendizagem por reforço da abordagem supervisionada para semi-supervisionada e iterativa para reconhecimento de ações humanas em vídeos
Other Titles: Computational model of adaptation in reinforcement learning supervised to semi-supervised and iterative approach to recognition of human actions in videos
Authors: Santos, Lucas Lisboa dos
metadata.dc.contributor.advisor: Nascimento, Erick Giovani Sperandio
metadata.dc.contributor.advisor-co: Winkler, Ingrid
metadata.dc.contributor.referees: Monteiro, Roberto Luiz Souza
Barreto, Marcos Ennes
Oliveira, Ewerton Lopes Silva de
Keywords: Aprendizagem profunda de máquinas;Reconhecimento de ações humanas;Aprendizado semi-supervisionado;Segmentação de ação
Issue Date: 21-Dec-2021
Publisher: Centro Universitário SENAI CIMATEC
Citation: SANTOS, Lucas Lisboa dos; NASCIMENTO, Erick Giovani Sperandio (orientador); WINKLER, Ingrid (coorientadora). Modelo computacional de adaptação em aprendizagem por reforço da abordagem supervisionada para semi-supervisionada e iterativa para reconhecimento de ações humanas em vídeos. Salvador, 2021. 82 f. Dissertação (Mestrado em Modelagem Computacional e Tecnologia Industrial ) - Centro Universitário SENAI CIMATEC, Salvador, 2021.
Abstract: Esta pesquisa investiga a tarefa de reconhecimento de ações humanas com o auxílio da Inteligência Artificial e, principalmente, suas abordagens de aprendizagem profunda combinadas com aprendizagem por reforço. Observa-se que essas abordagens, geralmente, necessitam de um grande volume de dados rotulados para sua construção, dependência limitadora já que se faz necessário um procedimento manual de anotação, que, em geral, é muito custoso. Essa tarefa, maçante e árdua, é responsável por considerável parte da alocação do tempo em projetos de aprendizagem de máquina, pois um conjunto de dados pode ter centenas de vídeos e cada vídeo pode ter milhares de quadros. Diante disso, nosso objetivo é desenvolver um modelo que possa dar suporte a tarefa de anotação de dados quando o conjunto de dados não está completamente anotado, atribuindo um rótulo válido aos dados não anotados. A pesquisa propõe, portanto, a criação do Modelo RL-SSI, que consiste na adaptação de uma abordagem supervisionada para semi-supervisionada e iterativa, a partir de uma metodologia aplicada à aprendizagem por reforço para o reconhecimento de ações humanas em vídeos. Como experimento, aplicamos o RL-SSI à técnica proposta por Liu e Jiang (2018), a qual possui uma abordagem supervisionada e utiliza 100% dos dados rotulados. Nesses experimentos foram utilizados os conjuntos de dados JIGSAWS e Breakfast. Para avaliar o RL-SSI, foram utilizadas as métricas acurácia, F-Score (F1) e Edit Score. Os experimentos com o JIGSAWS permitiram analisar os resultados do RL-SSI diante dos encontrados por Liu e Jiang (2018), demonstrando que a proposta superou todas as métricas quantitativas, utilizando apenas 65% dos dados rotulados. Já o experimento com o Breakfast buscou analisar a eficácia do RL-SSI em outro conjunto de dados e em comparação com os resultados do SSTDA, uma técnica auto supervisionada. Como resultado, o RL-SSI superou o SSTDA ao obter acurácia de 66,44% contra 65,8%, por outro lado, o RL-SSI foi superado pela métrica de segmentação F1@10 ao obter 67,33% contra 69,3%. Apesar disso, nosso experimento utilizou apenas 55,8% dos dados rotulados, enquanto o SSTDA, 65%. Desta forma, verifica-se que a proposta possui importante caráter inovativo ao demonstrar-se bem sucedida em seu propósito de construir soluções para diminuir a necessidade de dados totalmente rotulados, visto que, ao ser testada em diferentes conjuntos de dados, apresentou desempenho superior à técnica supervisionada e equiparável à técnica auto supervisionada. ABSTRACT: This research investigates the task of recognizing human actions with the help of of Artificial Intelligence and especially its deep learning approaches combined with reinforcement learning. It is observed that these approaches generally need a large volume of labeled data for their construction, dependency limiting since a manual annotation procedure is necessary, which, in general, it is very costly. This task, tedious and arduous, is responsible for a considerable part of the allocation of time in machine learning projects, as a set of data can have hundreds of videos and each video can have thousands of frames. That said, our goal is to develop a model that can support the annotation task of data when the dataset is not fully annotated by assigning a label valid for unannotated data. The research therefore proposes the creation of the RL-SSI Model, which consists of adapting a supervised to a semi-supervised approach and iterative, from a methodology applied to reinforcement learning for the recognition of human actions in videos. As an experiment, we apply the RL-SSI to the technique proposed by Liu and Jiang (2018), which has a supervised and uses 100% of the labeled data. In these experiments, sets of JIGSAWS and Breakfast data. To evaluate the RL-SSI, the metrics accuracy, F-Score (F1) and Edit Score. Experiments with JIGSAWS allowed us to analyze the RL-SSI results compared to those found by Liu and Jiang (2018), demonstrating that the proposal outperformed all quantitative metrics, using only 65% ​​of the data labeled. The experiment with Breakfast, on the other hand, sought to analyze the effectiveness of the RL-SSI in another dataset and compared to the results of the SSTDA, a self-supervised technique. As a result, the RL-SSI outperformed the SSTDA by achieving an accuracy of 66.44% against 65.8%, on the other hand, the RL-SSI was surpassed by the segmentation metric F1@10 when obtaining 67.33% against 69.3%. Despite this, our experiment used only 55.8% of the labeled data, while the SSTDA, 65%. In this way, it appears that the proposal has an important innovative character as it proves to be successful in its purpose of build solutions to reduce the need for fully labeled data, since, when tested in different sets of data, it presented superior performance to the technique supervised and comparable to the self-supervised technique.
URI: http://repositoriosenaiba.fieb.org.br/handle/fieb/1168
Appears in Collections:Dissertações de Mestrado (PPG MCTI)

Files in This Item:
There are no files associated with this item.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.