Show simple item record

dc.contributor.authorRamanauskaitė, Simona
dc.contributor.authorGriazev, Kiril
dc.date.accessioned2023-09-18T20:46:22Z
dc.date.available2023-09-18T20:46:22Z
dc.date.issued2018
dc.identifier.issn1648-8776
dc.identifier.urihttps://etalpykla.vilniustech.lt/handle/123456789/152493
dc.description.abstractData mining from web pages becomes more frequently adapted in business areas. However on the one hand while analyzing the current situation, we observe that solutions for mining structured data from web pages exists. On the other hand we see that a scientific dataset for unstructured data that would allow create and test new data selection methods does not exist. This limits the development and research of unstructured web data therefore we propose a method for HTML code block similarity estimation. The method combines both data and structure comparison and allows quantitative similarity presentation of two HTML code blocks.eng
dc.description.abstractDuomenų gavyba iš interneto tinklalapių vis dažniau naudojama organizacijų darbinėje veikloje. Tačiau analizuojant šiuo metu esamą situaciją pastebima, kad egzistuoja metodų ir įrankių pasiūla, kurie gali duomenis atrinkti iš struktūrizuotų puslapių, tuo tarpu nestruktūrizuotiems net nėra mokslinio duomenų rinkinio, kuriuo vadovaujantis būtų galima kurti ir testuoti naujus duomenų atrankos metodus. Šiame darbe siekiama pakeisti šią situaciją, kaip pirmą žingsnį link restruktūrizuotų duomenų rinkinio sukūrimo, pateikiant metodą, skirtą HTML kodo blokų panašumui įvertinti. Šis metodas apima duomenų ir struktūros panašumo vertinimą ir leis kiekybiškai įvertinti dviejų HTML kodo blokų panašumo lygį.lit
dc.formatPDF
dc.format.extentp. 30-36
dc.format.mediumtekstas / txt
dc.language.isoeng
dc.relation.isreferencedbyCEEOL – Central and Eastern European Online Library
dc.relation.isreferencedbyIndex Copernicus
dc.titleSimilarity estimation for HTML code blocks
dc.title.alternativeHTML kodo blokų panašumo vertinimas
dc.typeStraipsnis kitoje DB / Article in other DB
dcterms.references11
dc.type.pubtypeS3 - Straipsnis kitoje DB / Article in other DB
dc.contributor.institutionVilniaus Gedimino technikos universitetas
dc.contributor.facultyFundamentinių mokslų fakultetas / Faculty of Fundamental Sciences
dc.subject.researchfieldT 007 - Informatikos inžinerija / Informatics engineering
dc.subject.vgtuprioritizedfieldsIK0303 - Dirbtinio intelekto ir sprendimų priėmimo sistemos / Artificial intelligence and decision support systems
dc.subject.ltspecializationsL106 - Transportas, logistika ir informacinės ir ryšių technologijos (IRT) / Transport, logistic and information and communication technologies
dc.subject.ltHTML
dc.subject.ltduomenų panašumas
dc.subject.ltpanašumo vertinimas
dc.subject.enHTML
dc.subject.endata similarity
dc.subject.ensimilarity estimation
dcterms.sourcetitleJaunųjų mokslininkų darbai = Journal of young scientists
dc.description.issueNr. 48 (1)
dc.publisher.nameŠiaulių universiteto leidykla
dc.publisher.cityŠiauliai
dc.identifier.elaba30453004


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record