Please use this identifier to cite or link to this item: http://repositoriosenaiba.fieb.org.br/handle/fieb/1730
Title: Uma nova abordagem de inteligência artificial baseada em autoaprendizagem profunda para manutenção preditiva em um ambiente de produção de petróleo e gás Offshore
Other Titles: A new artificial intelligence approach based on deep self-learning for predictive maintenance in an Offshore oil and gas production environment
Authors: Figueirêdo, Ilan Sousa
metadata.dc.contributor.advisor: Nascimento, Erick Giovani Sperandio
metadata.dc.contributor.advisor-co: Guarieiro, Lílian Lefol Nani
metadata.dc.contributor.referees: Santos, Alex Álisson Bandeira
Pessoa, Fernando Luiz Pellegrini
Oliveira, Fábio Borges de
Vargas, Ricardo Emanuel Vaz
Keywords: Aprendizado profundo;Séries temporais multivariadas;Diagnóstico de falhas;Autoaprendizagem
Issue Date: 16-Feb-2023
Publisher: Centro Universitário SENAI CIMATEC
Citation: FIGUEIRÊDO, Ilan Souza. Uma nova abordagem de inteligência artificial baseada em autoaprendizagem profunda para manutenção preditiva em um ambiente de produção de petróleo e gás Offshore. Orientador: Erick Sperandio Nascimento. 2023. 142 f. Tese (Doutorado em Modelagem Computacional e Tecnologia Industrial) – Centro Universitário SENAI CIMATEC, Salvador, 2023.
metadata.dc.description.resumo: Atualmente, a indústria passa por uma transição da Indústria 3.0 para a Indústria 4.0, também chamada de "Quarta Revolução Industrial". Essa mudança está associada à integração entre sistemas físicos e digitais dos ambientes de manufatura. Essa integração permite a aquisição, armazenamento, processamento e análise de uma grande quantidade de dados de diversos processos industriais. A título de exemplo, histórico de dados de uma linha de produção industrial contém informações sobre processos, equipamentos, eventos e alarmes que são essenciais para uma tomada de decisão assertiva. Logo, quando processados e analisados, podem trazer informações e conhecimentos valiosos sobre o estado de integridade dos ativos. Dessa forma, as Redes Neurais Artificiais (RNA) tornam-se tecnologias chaves para o desenvolvimento de soluções da manutenção preditiva para a Indústria 4.0, uma vez que possuem a capacidade de processar grande volume de dados para suporte a tomada de decisão. No entanto, dados rotulados são escassos ou até inexistentes na indústria, pois há uma limitação de tempo quanto à capacidade dos especialistas em processar tal quantidade de dados. Nesse contexto, o objetivo desta tese foi pesquisar, estudar e desenvolver um modelo de autoaprendizagem profunda para classificar falhas em séries temporais multivariadas. A autoaprendizagem é uma combinação de aprendizagem de máquina não supervisionada e supervisionada. A principal vantagem é a não necessidade de dados rotulados na etapa de treinamento do modelo. A abordagem proposta foi desenvolvida e validada utilizando dados reais e públicos da Petrobras, conhecida como base 3W. Esses dados possuem o histórico de falhas de produção de óleo e gás (O&G) de poços offshore. Logo, o desenvolvimento do modelo contém quatro principais etapas. Primeiramente, separou-se aleatoriamente uma pequena porção de dados não rotulados da base. Posteriormente, utilizou-se a aprendizagem de máquina não supervisionada para pseudo-rotulagem dos dados por meio do reconhecimento de padrões anômalos e normais. Em seguida, inicia-se o ciclo iterativo de desenvolvimento da aprendizagem de máquina profunda supervisionada. Nesse ciclo, o modelo é treinado com dados pseudo-rotulados. Após o treinamento, realiza-se predições em novos conjuntos de dados não rotulados para gerar novos pseudo-rótulos. Os novos dados não rotulados são acrescentados gradativamente a cada iteração de treinamento do ciclo. Para tanto, por meio dos dados de probabilidade da função de ativação Softmax, uma Camada de Confiança foi projetada para pseudo-rotulagem nas predições mais confiáveis. Por fim, o modelo finaliza o desenvolvimento quando o critério de parada for cumprido e interromper o loop de treinamento. Como resultado, inicialmente, tem-se um conjunto de dados rotulados e um modelo que pode ser aprimorado com mais dados não rotulados. Inclusive, através de novos ciclos de desenvolvimento, pode-se utilizar Transfer Learning para ensinar outros tipos de falhas ao modelo e transformá-lo em multiclasse. Portanto, o modelo proposto foi capaz de classificar a iminência de múltiplas falhas de O&G em séries temporais multivariadas. O modelo semi-supervisionado de autoaprendizagem profunda apresentou um desempenho equiparável à aprendizagem profunda supervisionada. Os modelos semi supervisionados e supervisionados apresentaram acurácia de 96% e 99%, respectivamente. Desse modo, o modelo proposto apresentou recursos para viabilizar a aprendizagem de máquina em um ambiente operacional industrial, uma vez que foi superada a carência de dados anotados.
Abstract: Currently, the industry is undergoing a transition from Industry 3.0 to Industry 4.0, also called the "Fourth Industrial Revolution". This change is associated with the integration between physical and digital systems in manufacturing environments. This integration allows the acquisition, storage, processing and analysis of a large amount of data from various industrial processes. For example, historical data from an industrial production line contains information about processes, equipment, events and alarms that are essential for assertive decision making. Therefore, when processed and analyzed, they can bring valuable information and knowledge about the state of integrity of the assets. In this way, Artificial Neural Networks (ANN) become key technologies for the development of predictive maintenance solutions for Industry 4.0, since they have the ability to process large volumes of data to support decision making. However, labeled data is scarce or even non-existent in the industry, as there is a time constraint on the ability of specialists to process such an amount of data. In this context, the objective of this thesis was to research, study and develop a deep self-learning model to classify failures in multivariate time series. Self-learning is a combination of unsupervised and supervised machine learning. The main advantage is no need for labeled data in the model training step. The proposed approach was developed and validated using real and public data from Petrobras, known as the 3W base. This data has the history of oil and gas (O&G) production failures from offshore wells. Therefore, the development of the model contains four main steps. First, a small portion of unlabeled data from the database was randomly separated. Subsequently, unsupervised machine learning was used to pseudo-label the data through the recognition of anomalous and normal patterns. Then the supervised deep machine learning iterative development cycle begins. In this cycle, the model is trained with pseudo-labeled data. After training, predictions are performed on new unlabeled datasets to generate new pseudo-labels. New unlabeled data is gradually added to each training iteration of the cycle. For that, through the probability data of the Softmax activation function, a Confidence Layer was designed for pseudo-labeling in the most reliable predictions. Finally, the model ends development when the stopping criterion is met and breaks the training loop. As a result, initially, we have a labeled dataset and a model that can be improved with more unlabeled data. Even, through new development cycles, Transfer Learning can be used to teach other types of failures to the model and transform it into a multiclass. Therefore, the proposed model was able to classify the imminence of multiple O&G failures in multivariate time series. The semi-supervised deep self-learning model performed on par with supervised deep learning. The semi-supervised and supervised models showed an accuracy of 96% and 99%, respectively. Thus, the proposed model presented resources to enable machine learning in an industrial operational environment, since the lack of annotated data was overcome.
URI: http://repositoriosenaiba.fieb.org.br/handle/fieb/1730
Appears in Collections:Teses de Doutorado (PPG MCTI)

Files in This Item:
File Description SizeFormat 
Tese_ILAN SOUSA FIGUEIRÊDO.pdfTESE / DOUTORADO / SENAI CIMATEC19.31 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.