Automatinis vaizdų aprašų generavimas

Brusokas, Žygimantas

dc.contributor.author	Brusokas, Žygimantas
dc.date.accessioned	2023-09-18T09:11:53Z
dc.date.available	2023-09-18T09:11:53Z
dc.date.issued	2021
dc.identifier.uri	https://etalpykla.vilniustech.lt/handle/123456789/111026
dc.description.abstract	Baigiamojo darbo tikslas - realizuoti automatinio vaizdų aprašų generavimo modelį, remiantis mokslinių publikacijų analize, ir palyginti gautus rezultatus, kuomet yra naudojami skirtingi šio modelio parametrai. Teorinėje dalyje nagrinėjami automatinių vaizdų aprašų generavimo metodai, duomenų rinkiniai ir automatiškai sugeneruotų aprašų įvertinimams naudojamos metrikos. Praktinėje baigiamojo darbo dalyje realizuotas automatinis vaizdų aprašų generavimas, remiantis teorijoje apžvelgtu transformatoriaus modeliu. Taip pat pateikiami rezultatai, gauti naudojant skirtingus modelio parametrus. Išnagrinėjus teorinius automatinių vaizdų generavimo ir transformatoriaus modelio aspektus bei realizavus šį modelį pateiktos baigiamojo darbo išvados. Darbą sudaro 4 dalys: įvadas, 4 skyriai, išvados, literatūros sąrašas. Darbo apimtis – 50 p. teksto be priedų, 14 pav., 4 lent., 68 bibliografiniai šaltiniai. Atskirai pridedami darbo priedai.	lit
dc.description.abstract	Main goal of this master’s thesis is to implement image captioning model based on the analysis of scientific publications and to compare the obtained results when different parameters of the model are used. The theory part analyses the methods of generating automatic image descriptions, datasets and metrics used for the evaluation of automatically generated descriptions. In the practical part of this master’s thesis image captioning model is implemented using transformer architecture. The results obtained using different model parameters are presented. After analyzing the theoretical aspects of image captioning, transformer model and implementing this model, the conclusions of master’s thesis are presented. Thesis consists of 4 parts: introduction, 4 chapters, conclusion, list of literature. Scope of work – 50 pages of text, 14 pictures, 4 tables, 68 bibliographic sources. Attachments are included separately.	eng
dc.format	PDF
dc.format.extent	72 p.
dc.format.medium	tekstas / txt
dc.language.iso	lit
dc.rights	Prieinamas tik institucijos intranete
dc.source.uri	https://talpykla.elaba.lt/elaba-fedora/objects/elaba:95617440/datastreams/MAIN/content
dc.title	Automatinis vaizdų aprašų generavimas
dc.title.alternative	Image Captioning
dc.type	Magistro darbas / Master thesis
dcterms.references	0
dc.type.pubtype	ETD_MGR - Magistro darbas / Master thesis
dc.contributor.institution	Vilniaus Gedimino technikos universitetas
dc.subject.researchfield	T 007 - Informatikos inžinerija / Informatics engineering
dc.subject.studydirection	B04 - Informatikos inžinerija / Informatics engineering
dc.subject.lt	gilus mokymasis
dc.subject.lt	vaizdų aprašų generavimas
dc.subject.lt	vaizdų apdorojimas.
dc.subject.en	deep learning
dc.subject.en	image captioning
dc.subject.en	computer vision.
dc.identifier.elaba	95617440

Files in this item

Name:: Žygimantas Brusokas.pdf
Size:: 2.712Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Magistrų darbai / Master theses [2734]

Show simple item record