Back to Search Start Over

An inference engine for identity relations in knowledge graphs

Authors :
Alcantara, Williams Lourenço de
Costa, Evandro de Barros
Brito, Patrick Henrique da Silva
Freitas, Frederico Luiz Gonçalves de
Perkusich, Mirko Barbosa
Source :
Repositório Institucional da Universidade Federal de Alagoas (UFAL), Universidade Federal de Alagoas (UFAL), instacron:UFAL
Publication Year :
2019
Publisher :
Universidade Federal de Alagoas, 2019.

Abstract

The growing demand for realtime information access requires high cost – financial and computational – for data integration due to lack of standardization, resulting in problems during modeling and display data. The Knowledge Graphs were used to deal these problems. By providing a structured, scalable and understandable machine model, the creation and maintenance are vulnerable to errors due to automatic reasoning difficulties in large data from different domains – which can produce inaccurate, erroneous or incomplete results – mainly related with ambiguity. The problems are normally caused by ambiguous relationships and by inaccuracy in determining Identity Relations (IR) in a domain. Recent studies compare all attributes without considering that some of them can be more relevant. This work applied an automatic IR detection mechanism which execute an automatic selection of relevant attributes for a domain from entropy analysis and statistical correlation between the attributes. The proposed solution was applied in 12 real datasets that include software development activities. The characters which were automatically selected obtained better IR detection accuracy than the criteria recommended by a domain expert. CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior A crescente demanda por acesso a informações em tempo real tem demandado um alto custo – financeiro e computacional – para a integração de dados devido à ausência de padronização, o que normalmente resulta em problemas durante a modelagem e representação de dados. Grafos de Conhecimento (GC) tem sido um dos mecanismos utilizados para abordar tais problemas. Apesar de fornecerem um modelo estruturado, escalável e compreensível por máquina, a sua criação e manutenção são vulneráveis a erros em razão da dificuldade de raciocínio automático em um grande volume de dados de diferentes domínios – que pode gerar resultados imprecisos, errados ou incompletos – principalmente relacionados à ambiguidade. Normalmente, os problemas causados pela ocorrência de relações ambíguas são derivados da imprecisão ao determinar uma Relação de Identidade (IR) em um domínio, pois os trabalhos existentes na literatura realizam comparação de todos os atributos sem considerar que alguns podem ser mais relevantes. Assim, este trabalho propõe um mecanismo automático para detecção de IR capaz de realizar seleção automática de atributos relevantes de um domínio a partir de análises de entropia e correlação estatística entre os atributos. A solução proposta foi aplicada em 12 conjuntos de dados reais que contém atividades de desenvolvimento de software, sendo que os atributos selecionados automaticamente obtiveram melhor acurácia na detecção de IR do que os atributos relevantes definidos por um especialista do domínio.

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Repositório Institucional da Universidade Federal de Alagoas (UFAL), Universidade Federal de Alagoas (UFAL), instacron:UFAL
Accession number :
edsair.od......3056..6260b16785ee397a49e0cf2f73163734