1. Digitalizacija i obrada slike i teksta u sustavima za optičko prepoznavanje znakova u domeni bibliotekarstva
- Author
-
Kmetič, Stela and Seljan, Sanja
- Subjects
pretprocesiranje ,optical character recognition ,greyscale ,poboljšanje slike ,binarizacija ,image enhancement ,siva skala ,binarization ,DRUŠTVENE ZNANOSTI. Informacijske i komunikacijske znanosti. Knjižničarstvo ,SOCIAL SCIENCES. Information and Communication Sciences. Library Science ,optičko prepoznavanje znakova ,preprocessing - Abstract
U svijetu koji ide prema digitalizaciji svega, pa tako i tekstualnih podataka koji nisu izvorno digitalni, optičko prepoznavanje znakova ima centralnu ulogu. Takvi sustavi danas još nisu usavršeni, te ne postoji sustav koji ima 100%-tnu točnost prepoznavanja znakova. Donja granica za isplativost korištenja sustava za optičko prepoznavanje znakova često se citira kao 99,95%, a kako bismo se približili toj vrijednosti potrebna je i ljudska intervencija u raznim fazama rada sustava. Najčešće se takva intervencija predlaže u fazi pretprocesiranja slika prije korištenja istih u sustavima za optičko prepoznavanje znakova. Ovaj rad daje pregled procesa digitalizacije tekstualnog gradiva, pregled povijesti razvitka sustava za optičko prepoznavanje znakova, te kratak opis danas najpoznatijih i najefikasnijih takvih sustava na tržištu. Također istražuje i sve faze rada sustava za optičko prepoznavanje znakova, s naglaskom na razne metode pretprocesiranja, te njihovu implementaciju i efikasnost u poboljšavanju rezultata očitanja znakova u sustavima Tesseract i Google Document AI. In a world that seems to be going towards digitising everything, including non-digitally native textual data, optical character recognition plays a central role. Optical character recognition systems haven't yet been perfected - a system with an accuracy rate of 100% in all cases is, as of the writing of this thesis, non-existent. 99.95% is often cited as the bottom barrier for accuracy necessary for the usage of optical character recognition systems to be cost-effective. To get near that number, human intervention is often necessary in many phases of an optical character recognition system’s work cycle. In literature, interventions are most often recommended in the phase of preprocessing, e.g., before we even feed an image to an optical character recognition system. This thesis gives a brief summary of the process of digitising textual materials, the history of optical character recognition and the most popular and effective optical character recognition systems available today. It also explores all phases of an optical character recognition system's work cycle, with emphasis on preprocessing implementation and efficiency in increasing the rate of recognition in Tesseract and Google Document AI.
- Published
- 2023