• Lietuvių
    • English
  • English 
    • Lietuvių
    • English
  • Login
View Item 
  •   DSpace Home
  • Baigiamieji darbai (ETD) / Graduation works (ETD)
  • Magistrų darbai / Master theses
  • View Item
  •   DSpace Home
  • Baigiamieji darbai (ETD) / Graduation works (ETD)
  • Magistrų darbai / Master theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Automatinis vaizdų aprašų generavimas

View/Open
Žygimantas Brusokas.pdf (2.712Mb)
Date
2021
Author
Brusokas, Žygimantas
Metadata
Show full item record
Abstract
Baigiamojo darbo tikslas - realizuoti automatinio vaizdų aprašų generavimo modelį, remiantis mokslinių publikacijų analize, ir palyginti gautus rezultatus, kuomet yra naudojami skirtingi šio modelio parametrai. Teorinėje dalyje nagrinėjami automatinių vaizdų aprašų generavimo metodai, duomenų rinkiniai ir automatiškai sugeneruotų aprašų įvertinimams naudojamos metrikos. Praktinėje baigiamojo darbo dalyje realizuotas automatinis vaizdų aprašų generavimas, remiantis teorijoje apžvelgtu transformatoriaus modeliu. Taip pat pateikiami rezultatai, gauti naudojant skirtingus modelio parametrus. Išnagrinėjus teorinius automatinių vaizdų generavimo ir transformatoriaus modelio aspektus bei realizavus šį modelį pateiktos baigiamojo darbo išvados. Darbą sudaro 4 dalys: įvadas, 4 skyriai, išvados, literatūros sąrašas. Darbo apimtis – 50 p. teksto be priedų, 14 pav., 4 lent., 68 bibliografiniai šaltiniai. Atskirai pridedami darbo priedai.
 
Main goal of this master’s thesis is to implement image captioning model based on the analysis of scientific publications and to compare the obtained results when different parameters of the model are used. The theory part analyses the methods of generating automatic image descriptions, datasets and metrics used for the evaluation of automatically generated descriptions. In the practical part of this master’s thesis image captioning model is implemented using transformer architecture. The results obtained using different model parameters are presented. After analyzing the theoretical aspects of image captioning, transformer model and implementing this model, the conclusions of master’s thesis are presented. Thesis consists of 4 parts: introduction, 4 chapters, conclusion, list of literature. Scope of work – 50 pages of text, 14 pictures, 4 tables, 68 bibliographic sources. Attachments are included separately.
 
Issue date (year)
2021
URI
https://etalpykla.vilniustech.lt/handle/123456789/111026
Collections
  • Magistrų darbai / Master theses [2734]

 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjects / KeywordsInstitutionFacultyDepartment / InstituteTypeSourcePublisherType (PDB/ETD)Research fieldStudy directionVILNIUS TECH research priorities and topicsLithuanian intelligent specializationThis CollectionBy Issue DateAuthorsTitlesSubjects / KeywordsInstitutionFacultyDepartment / InstituteTypeSourcePublisherType (PDB/ETD)Research fieldStudy directionVILNIUS TECH research priorities and topicsLithuanian intelligent specialization

My Account

LoginRegister