Please use this identifier to cite or link to this item: http://repositoriosenaiba.fieb.org.br/handle/fieb/1191
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorNascimento, Erick Giovani Sperandio-
dc.contributor.authorLima, André Luis da Cunha Dantas-
dc.date.accessioned2022-04-12T23:29:05Z-
dc.date.available2022-04-12T23:29:05Z-
dc.date.issued2021-04-28-
dc.identifier.citationLIMA, André Luis da Cunha Dantas; NASCIMENTO, Erick Giovani Sperandio (orientador). Manutenção preditiva aplicada a ambientes de missão crítica de supercomputação utilizando inteligência artificial. Salvador, BA, 2021. 109 f. Dissertação (Mestrado em Gestão e Tecnologia Industrial) - Centro Universitário SENAI CIMATEC, Salvador, 2021.pt_BR
dc.identifier.urihttp://repositoriosenaiba.fieb.org.br/handle/fieb/1191-
dc.description.abstractOs ambientes de missão crítica de supercomputação (AMCS) estão diretamente relacionados com equipamentos robustos, de alta performance, instalados em ambientes redundantes de operações ininterruptas e que não podem apresentar falhas. Entretanto, o crescimento em escala dos sistemas HPC (High Performance Computing) refletem no tamanho e na sua complexidade em mantê-los controlados, monitorados e disponíveis para a continuidade do negócio. Obter informações prévias em tempo hábil sobre uma possível falha no equipamento proporciona à gestão da manutenção uma abordagem inteligente, otimizada e de custos reduzidos para programações de manutenções mais assertivas. Diante do crescimento e disponibilidade do poder computacional e armazenamento de dados, técnicas de inteligência artificial têm sido aplicadas em equipamentos industriais e dispositivos de computação visando identificar anormalidades de operação e predizer o tempo de vida útil remanescente (Remaining Useful Life - RUL) do equipamento com desempenho superior a manutenção preditiva tradicional. Nesse sentido, esta pesquisa tem como objetivo desenvolver um modelo computacional aplicado à manutenção preditiva em AMCS utilizando técnicas de Inteligência Artificial visando predizer a vida útil remanescente do equipamento antes da ocorrência da falha, utilizando dados históricos reais não rotulados, coletados por sensores ativos de um sistema de refrigeração líquido direto de um supercomputador do Centro de Supercomputação. Um modelo híbrido foi desenvolvido utilizando uma rede neural multivariada baseada na combinação FCN+LSTM+MLP (Fully Convolutional Neural network + Long Short Term Memory + Multilayer Perceptron), e seu desempenho foi avaliado em um conjunto de dados de teste nunca antes apresentado à rede, com registros de falhas no sistema de refrigeração que resultaram numa parada do supercomputador do AMCS. Ao avaliar o desempenho, o valor médio das métricas de coeficiente de correlação Pearson foi de 0,87, R² score igual a 0,77 e Fator de 2 igual a 0,89, com taxas de erros de NMSE (Normalized Mean Square Error) de 0,79, considerando o valor de RUL predito e o valor de RUL observado para os momentos de comportamento de pré-falha do equipamento. Para auxiliar o processo de monitoramento do operador do supercomputador utilizando esta rede de predição RUL, também foi desenvolvida uma rede neural híbrida de classificação, utilizando FCN+LSTM+MLP, para identificar o estado operacional do AMCS quanto à situação normal ou pré-falha, fornecendo resultados de valor médio de acurácia de 0,989, precision de 0,989, sensitivity de 0,993, specificity de 0,989 e F1-score igual 0,987. Os modelos desenvolvidos obtiveram sucesso com bom desempenho para determinação do estado operacional do AMCS (normal e pré-falha) e para a previsão do RUL (quando em estado operacional de pré-falha), aumentando a capacidade do AMCS e de sua gestão em se antecipar a situação de falhas, reduzindo custos de manutenção, desligamentos do sistema e interrupção do fluxo de operações, aumentando ainda mais sua disponibilidade e tempo de operação.pt_BR
dc.description.abstractABSTRACT:Mission-critical supercomputing environments (MCSE) are directly related to robust, high performance equipment, installed in redundant environments of uninterrupted operations without failures. However, the growth in scale of HPC (High Performance Computing) systems reflects their size and complexity, especially those controlled, monitored and available for business progress. Obtaining timely information about a possible equipment failure in a timely manner provides maintenance management with an intelligent, optimized and cost-effective approach to more assertive maintenance schedules. From the growth perspective, availability of computational power and data storage, artificial intelligence techniques have been applied to industrial equipment and computing devices in order to identify operating abnormalities and predict the remaining useful lifetime (Remaining Useful Life - RUL) of the equipment outperforming traditional predictive maintenance. In this sense, this research aims to develop a computational model designed for predictive maintenance in MCSE using Artificial Intelligence Complete techniques to predict the remaining useful life of the equipment before the occurrence of the failure, using real non-labeled historical data, collected by active sensors of a liquid cooling system direct from a supercomputer at the Supercomputing Center. The hybrid model was developed using a multivariate neural network based on the combination FCN + LSTM + MLP (Fully Convolutional Neural network + Long Short Term Memory + Multilayer Perceptron), and its performance was evaluated in a test data set never before the network, with fault records in the cooling system that resulted in a stop of the supercomputer. When evaluating performance, the average value of the Pearson correlation coefficient metrics was 0.87, an R² score equal to 0.77 and a Factor of 2 equal to 0.89, with error rates of NMSE (normalized mean squared error) 0.79, considering the predicted RUL value and the observed RUL value for the moments of pre-failure behavior of the equipment. Assisting the monitoring process of the supercomputer operator using this RUL prediction network, a hybrid neural classification network was also developed, using FCN + LSTM + MLP, to identify the operational status of the MCSE regarding the normal or pre-failure situation, providing average value of the accuracy of 0.989, precision of 0.989, sensitivity of 0.993, specificity of 0.989 and F1 score equal to 0.987. The developed models were successful with good performance for determining the operational status of the MCSE (normal and pre-failure) and for the prediction of the RUL (when in pre-failure operational state), increasing the capacity of the MCSE and its management in anticipating the failure situation, reducing maintenance costs, system shutdowns and interruption of operation, further increasing its availability and operating time.pt_BR
dc.language.isopt_BRpt_BR
dc.publisherCentro Universitário SENAI CIMATECpt_BR
dc.rightsacesso abertopt_BR
dc.rights.uri"Todos os direitos reservados. É permitida a reprodução parcial ou total desta obra, desde que citada a fonte e que não seja para venda ou qualquer fim comercial."pt_BR
dc.subjectManutenção preditivapt_BR
dc.subjectSupercomputaçãopt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectDeep learningpt_BR
dc.titleManutenção preditiva aplicada a ambientes de missão crítica de supercomputação utilizando Inteligência Artificiapt_BR
dc.title.alternativePredictive maintenance applied to mission-critical environments of supercomputing using artificial intelligencept_BR
dc.typedissertaçãopt_BR
dc.embargo.termsabertopt_BR
dc.publisher.countrybrasilpt_BR
dc.publisher.departamentCentro Universitário SENAI CIMATECpt_BR
dc.publisher.programPrograma de Pós-Graduação Stricto Sensupt_BR
dc.publisher.initialsSENAI CIMATECpt_BR
dc.contributor.advisor-coCosta, Genaro Fernandes de CarvalhO-
dc.contributor.refereesGuarieiro, Erick Giovani Sperandio-
dc.contributor.refereesCosta, Genaro Fernandes de Carvalho-
Appears in Collections:Dissertações de Mestrado (PPG GETEC)

Files in This Item:
There are no files associated with this item.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.