Rodyti trumpą aprašą

dc.contributor.authorŽitnik, S.
dc.contributor.authorŠubelj, Lovr
dc.contributor.authorLavbič, Dejan
dc.contributor.authorVasilecas, Olegas
dc.contributor.authorBajec, Marko
dc.date.accessioned2023-09-18T19:44:32Z
dc.date.available2023-09-18T19:44:32Z
dc.date.issued2013
dc.identifier.issn0868-4952
dc.identifier.other(BIS)VGT02-000026498
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/142906
dc.description.abstractDue to numerous public information sources and services, many methods to combine heterogeneous data were proposed recently. However, general end-to-end solutions are still rare, especially systems taking into account different context dimensions. Therefore, the techniques often prove insufficient or are limited to a certain domain. In this paper we briefly review and rigorously evaluate a general framework for data matching and merging. The framework employs collective entity resolution and redundancy elimination using three dimensions of context types. In order to achieve domain independent results, data is enriched with semantics and trust. However, the main contribution of the paper is evaluation on five public domain-incompatible datasets. Furthermore, we introduce additional attribute, relationship, semantic and trust metrics, which allow complete framework management. Besides overall results improvement within the framework, metrics could be of independent interest.eng
dc.description.abstractAtsižvelgiant i tai, kad egzistuoja skaitlingas kiekis viešai prieinamų informacijos šaltinių ir paslaugų, pasiūlyta nemažai metodų skirtų tokių paprastai heterogeninių duomenų sujungimui. Tačiau bendro pobūdžio šaltinis – gavėjas sprendimai vis dar gana retai pateikiami, ypatingai tais atvejais, kai dėmesin reikia priimti skirtingų kontekstų aspektus. Be to, tokie sprendimai dažnai nepakankamai išbandyti arba pritaikyti tik specifinėms dalykinėms sritims. Straipsnyje trumpai apžvelgtas ir išsamiai ivertintas pasiūlytas bendro pobūdžio susiejimo ir suliejimo karkasas. Jis naudoja bendrąją esybių rezoliuciją ir pertekliškumo šalinimą naudojant tris kontekstų tipų aspektus. Siekiant gauti nuo dalykinės srities nepriklausomus rezultatus, analizuojami duomenys praturtinami semantikos ir pasitikėjimo atributais. Tačiau pagrindinis straipsnio indelis susijęs su penkių viešai prieinamų tarpusavyje nesuderintų domenų duomenų rinkinių įvertinimų. Be to, mes įvedėme papildoma atributą, ryšį bei semantikos ir pasitikėjimo metriką, kas įgalina užtikrinti pilną pasiūlyto karkaso valdymą. Papildomai prie to, kad naudojant karkasą pagerėjo rezultatai, pasiūlytos metrikos gali būti atskirai teikiamos kaip svarbus tyrimų rezultatas.lit
dc.formatPDF
dc.format.mediumtekstas / txt
dc.language.isoeng
dc.relation.isreferencedbyScopus
dc.relation.isreferencedbyINSPEC
dc.relation.isreferencedbyScience Citation Index Expanded (Web of Science)
dc.source.urihttps://doi.org/10.15388/Informatica.2013.388
dc.titleGeneral context-aware data matching and merging framework
dc.title.alternativeBendras kontekstui jautrus duomen u susiejimo bei suliejimo karkasas
dc.typeStraipsnis Web of Science DB / Article in Web of Science DB
dcterms.references0
dc.type.pubtypeS1 - Straipsnis Web of Science DB / Web of Science DB article
dc.contributor.institutionUniversity of Ljubljana
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.contributor.facultyFundamentinių mokslų fakultetas / Faculty of Fundamental Sciences
dc.subject.researchfieldN 009 - Informatika / Computer science
dc.subject.researchfieldT 007 - Informatikos inžinerija / Informatics engineering
dc.subject.enEntity resolution
dc.subject.enRedundancy elimination
dc.subject.enSemantic elevation
dc.subject.enTrust
dc.subject.enOntologies
dcterms.sourcetitleInformatica
dc.description.issueno.1
dc.description.volumeVol. 24
dc.publisher.nameMatematikos ir informatikos institutas
dc.publisher.cityVilnius
dc.identifier.doi000317997900008
dc.identifier.doi10.15388/Informatica.2013.388
dc.identifier.elaba4024585


Šio įrašo failai

Thumbnail

Šis įrašas yra šioje (-se) kolekcijoje (-ose)

Rodyti trumpą aprašą