Elektroninių dokumentų ženklinimo ir jų nutekinimo prevencijos metodų tyrimas
Abstract
Kiekvienais metais daugėja įsilaužimų į organizacijų sistemas, duomenų praradimo ar informacijos nutekėjimo incidentų. Todėl labai svarbu skirti didelį dėmesį svarbių dokumentų apsaugai ir jų identifikavimui organizacijos tinkle, kad svarbi ir konfidenciali informacija nenutekėtų tretiesiems asmenims. Šiame darbe analizuojamos teksto analizės technikos, kurios yra naudojamos sistemose, kurios siekia užtikrinti duomenų nepraradimą. Esant informacijos trūkumui apie šių sistemų naudojamas teksto analizės technikas ir kurios iš jų yra efektyviausios, pateikiamos šešios siūlomos teksto analizės technikos remiantis daliniu dokumentų turinio sutapimu, skaičiuojant maišos funkcijas dokumentų turiniui. Sukonstravus šešis maišos funkcijų skaičiavimo technikų prototipus, remiantis siūlomomis realizacijomis, atlikti bandymai ir eksperimentai su paruoštais testiniais dokumentais. Gauti rezultatai palyginti ir suformuluotos išvados. Every year the number of data loss or information leakage incidents in organizations’ systems increases. Therefore, it is crucial to focus more on the security of important documents and their identification in the organization’s network in order to avoid sensitive and confidential information leakage to third parties. In this thesis, text analysis techniques which are used by data security systems are analyzed. As the information of the texts analysis techniques used by security systems and their effectiveness is lacking, six text analysis techniques are offered based on partial documents coincidence and counting of hash functions. Six prototypes of the computing hash functions techniques were created and, on the basis of proposed realizations, tests and experiments with prepared documents were conducted. The results were compared and conclusions obtained.