Modelo computacional de adaptação em aprendizagem por reforço da  abordagem supervisionada para semi-supervisionada e iterativa para  reconhecimento de ações humanas em vídeos

Santos, Lucas Lisboa dos

Please use this identifier to cite or link to this item: http://repositoriosenaiba.fieb.org.br/handle/fieb/1168

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Nascimento, Erick Giovani Sperandio	-
dc.contributor.author	Santos, Lucas Lisboa dos	-
dc.date.accessioned	2022-02-21T22:15:31Z	-
dc.date.available	2022-02-21T22:15:31Z	-
dc.date.issued	2021-12-21	-
dc.identifier.citation	SANTOS, Lucas Lisboa dos. Modelo computacional de adaptação em aprendizagem por reforço da abordagem supervisionada para semi-supervisionada e iterativa para reconhecimento de ações humanas em vídeos. Orientador: Erick Giovani Sperandio Nascimento. 2021. 82 f. Dissertação (Mestrado em Modelagem Computacional e Tecnologia Industrial ) – Centro Universitário SENAI CIMATEC, Salvador, 2021.	pt_BR
dc.identifier.uri	http://repositorio.universidadesenaicimatec.edu.br/handle/fieb/1168	-
dc.description.abstract	Esta pesquisa investiga a tarefa de reconhecimento de ações humanas com o auxílio da Inteligência Artificial e, principalmente, suas abordagens de aprendizagem profunda combinadas com aprendizagem por reforço. Observa-se que essas abordagens, geralmente, necessitam de um grande volume de dados rotulados para sua construção, dependência limitadora já que se faz necessário um procedimento manual de anotação, que, em geral, é muito custoso. Essa tarefa, maçante e árdua, é responsável por considerável parte da alocação do tempo em projetos de aprendizagem de máquina, pois um conjunto de dados pode ter centenas de vídeos e cada vídeo pode ter milhares de quadros. Diante disso, nosso objetivo é desenvolver um modelo que possa dar suporte a tarefa de anotação de dados quando o conjunto de dados não está completamente anotado, atribuindo um rótulo válido aos dados não anotados. A pesquisa propõe, portanto, a criação do Modelo RL-SSI, que consiste na adaptação de uma abordagem supervisionada para semi-supervisionada e iterativa, a partir de uma metodologia aplicada à aprendizagem por reforço para o reconhecimento de ações humanas em vídeos. Como experimento, aplicamos o RL-SSI à técnica proposta por Liu e Jiang (2018), a qual possui uma abordagem supervisionada e utiliza 100% dos dados rotulados. Nesses experimentos foram utilizados os conjuntos de dados JIGSAWS e Breakfast. Para avaliar o RL-SSI, foram utilizadas as métricas acurácia, F-Score (F1) e Edit Score. Os experimentos com o JIGSAWS permitiram analisar os resultados do RL-SSI diante dos encontrados por Liu e Jiang (2018), demonstrando que a proposta superou todas as métricas quantitativas, utilizando apenas 65% dos dados rotulados. Já o experimento com o Breakfast buscou analisar a eficácia do RL-SSI em outro conjunto de dados e em comparação com os resultados do SSTDA, uma técnica auto supervisionada. Como resultado, o RL-SSI superou o SSTDA ao obter acurácia de 66,44% contra 65,8%, por outro lado, o RL-SSI foi superado pela métrica de segmentação F1@10 ao obter 67,33% contra 69,3%. Apesar disso, nosso experimento utilizou apenas 55,8% dos dados rotulados, enquanto o SSTDA, 65%. Desta forma, verifica-se que a proposta possui importante caráter inovativo ao demonstrar-se bem sucedida em seu propósito de construir soluções para diminuir a necessidade de dados totalmente rotulados, visto que, ao ser testada em diferentes conjuntos de dados, apresentou desempenho superior à técnica supervisionada e equiparável à técnica auto supervisionada. ABSTRACT: This research investigates the task of recognizing human actions with the help of of Artificial Intelligence and especially its deep learning approaches combined with reinforcement learning. It is observed that these approaches generally need a large volume of labeled data for their construction, dependency limiting since a manual annotation procedure is necessary, which, in general, it is very costly. This task, tedious and arduous, is responsible for a considerable part of the allocation of time in machine learning projects, as a set of data can have hundreds of videos and each video can have thousands of frames. That said, our goal is to develop a model that can support the annotation task of data when the dataset is not fully annotated by assigning a label valid for unannotated data. The research therefore proposes the creation of the RL-SSI Model, which consists of adapting a supervised to a semi-supervised approach and iterative, from a methodology applied to reinforcement learning for the recognition of human actions in videos. As an experiment, we apply the RL-SSI to the technique proposed by Liu and Jiang (2018), which has a supervised and uses 100% of the labeled data. In these experiments, sets of JIGSAWS and Breakfast data. To evaluate the RL-SSI, the metrics accuracy, F-Score (F1) and Edit Score. Experiments with JIGSAWS allowed us to analyze the RL-SSI results compared to those found by Liu and Jiang (2018), demonstrating that the proposal outperformed all quantitative metrics, using only 65% of the data labeled. The experiment with Breakfast, on the other hand, sought to analyze the effectiveness of the RL-SSI in another dataset and compared to the results of the SSTDA, a self-supervised technique. As a result, the RL-SSI outperformed the SSTDA by achieving an accuracy of 66.44% against 65.8%, on the other hand, the RL-SSI was surpassed by the segmentation metric F1@10 when obtaining 67.33% against 69.3%. Despite this, our experiment used only 55.8% of the labeled data, while the SSTDA, 65%. In this way, it appears that the proposal has an important innovative character as it proves to be successful in its purpose of build solutions to reduce the need for fully labeled data, since, when tested in different sets of data, it presented superior performance to the technique supervised and comparable to the self-supervised technique.	pt_BR
dc.language.iso	pt_BR	pt_BR
dc.publisher	Centro Universitário SENAI CIMATEC	pt_BR
dc.rights	acesso aberto	pt_BR
dc.rights.uri	"Todos os direitos reservados. É permitida a reprodução parcial ou total desta obra, desde que citada a fonte e que não seja para venda ou qualquer fim comercial."	pt_BR
dc.subject	Aprendizagem profunda de máquinas	pt_BR
dc.subject	Reconhecimento de ações humanas	pt_BR
dc.subject	Aprendizado semi-supervisionado	pt_BR
dc.subject	Segmentação de ação	pt_BR
dc.title	Modelo computacional de adaptação em aprendizagem por reforço da abordagem supervisionada para semi-supervisionada e iterativa para reconhecimento de ações humanas em vídeos	pt_BR
dc.title.alternative	Computational model of adaptation in reinforcement learning supervised to semi-supervised and iterative approach to recognition of human actions in videos	pt_BR
dc.type	Dissertação	pt_BR
dc.embargo.terms	aberto	pt_BR
dc.publisher.country	brasil	pt_BR
dc.publisher.departament	Centro Universitário SENAI CIMATEC	pt_BR
dc.publisher.program	Programa de Pós-Graduação Stricto Sensu	pt_BR
dc.publisher.initials	SENAI CIMATEC	pt_BR
dc.contributor.advisor-co	Winkler, Ingrid	-
dc.contributor.referees	Monteiro, Roberto Luiz Souza	-
dc.contributor.referees	Barreto, Marcos Ennes	-
dc.contributor.referees	Oliveira, Ewerton Lopes Silva de	-
Appears in Collections:	Dissertações de Mestrado (PPG MCTI)

Files in This Item:

There are no files associated with this item.

Show simple item record