Please use this identifier to cite or link to this item: http://repositoriosenaiba.fieb.org.br/handle/fieb/731
Title: Um modelo computacional para extração textual e construção de redes sociais e complexas
Other Titles: A computational model for text extraction and construction of complex social networks
Authors: Braga, Patrícia Freitas
metadata.dc.contributor.advisor: Pereira, Hernane Borges de Barros
metadata.dc.contributor.referees: Pacheco, Roberto C. S.
Moret, Marcelo A.
Keywords: Mineração de texto;expressão regular;Rede complexa;Rede social
Issue Date: Sep-2010
Publisher: Faculdade de Tecnologia SENAI CIMATEC
Abstract: As redes complexas estão presentes em diversos níveis, desde redes biológicas até redes sociais, sendo as redes de colaboração científica o foco de estudo desta dissertação . Visando subsidiar o estudo acerca da dinâmica da difusão do conhecimento, este trabalho de mestrado objetivou apresentar uma modelagem computacional para extração de dados de textos para a construção de redes sociais e complexas a partir da detecção destas estruturas implícitas nos textos, sendo estas redes construídas com base em relações de colaboração científica em autoria de publicações. Considerando que boa parte das informações se encontram em repositórios textuais digitais, o modelo provê métodos para otimização na obtenção destes dados de textos e geração de redes a partir destes. Atualmente, há poucos trabalhos que realizem mineração de textos para coleta de dados específicos e que construa redes complexas destes dados minerados. Este trabalho apresenta as etapas processuais do modelo, que envolve mineração dos textos e obtenção das redes, e apresenta os resultados obtidos a partir da utilização do modelo proposto, utilizando como procedimento experimental, a construção das redes de colaboração em produções científicas no contexto de programas de pós-graduação. Na avaliação dos resultados obtidos a partir do trabalho experimental, no aspecto de criticidade do modelo, constatou-se que a dependência de conhecimento mínimo para minerar textos está associado com a precisão dos resultados obtidos da extração dos dados. Quanto a construção das redes, todas foram geradas corretamente e a partir destas, propriedades de redes sociais e complexas puderam ser analisadas. ABSTRACT: Complex networks are present in various levels, from biological networks to social networks, being the scientific collaboration networks the focus of study in this thesis. Aiming to support the study of the dynamics of diffusion of knowledge, this master’s thesis aims to present a computational model for extracting data from texts to build social and complex networks from the detection of these structures implicit in the texts, which are networks built based on relations of scientific collaboration in authorship of publications.Whereas much of the information are in textual digital repositories, the model provides methods for optimization in obtaining these data and generating texts from these networks. Currently, there are few jobs that perform text mining to collect specific data and build complex networks from data. This work presents the procedural steps of the model, which involves text mining and obtaining the network and will present the results obtained by the use of the proposed model, using the experimental procedure, the construction of networks of collaboration in scientific production in the context of post-graduation. The evaluation of the results obtained of the experiemental work, int the critical aspect of the model, found that the dependence of minimum knowledge to text mining is associated with the accuracy of the results of data extraction. As the construction of networks, all corretamente were generated and from these, properties of complicated networks were analyzed.
URI: http://repositoriosenaiba.fieb.org.br/handle/fieb/731
Appears in Collections:Dissertações de Mestrado (PPG MCTI)

Files in This Item:
File Description SizeFormat 
Dissertacao Patrícia.pdf2.79 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.