...
Zbog arhivske svrhe i pravne valjanosti dokumenta, tekst prepoznat u postupku OCR-a potrebno je spremiti u sloju ispod slike teksta kako bi se sačuvao izvorni izgled dokumenta i istovremeno dobila mogućnost označavanja teksta.
Upotreba alata Abby FineReader – smjernice za naknadno OCR-iranje PDF dokumenata
U nastavku se nalazi prikaz koraka za naknadno OCR-iranje PDF dokumenata u alatu AbbyFineReader (komercijalni alat):
- Za naknadno OCR-iranje skenirane PDF datoteke u alatu Abby FineReader (PDF pohranjen kao slika, ne kao tekst), klikom na Tools u alatnoj traci potrebno je odabrati OCR Editor.
- Otvara se novi prozor za izradu projekta.
- Ponuđena je mogućnost odabira jezika koje(g) će alat koristiti za prepoznavanje/OCR-iranje te mogućnost automatskog prepoznavanja jezika prilikom OCR-a.
- Za otvaranje PDF datoteke unutar prozora za izradu projekta, moguće je koristiti metodu drag and drop pri čemu će alat automatski početi s optičkim prepoznavanjem stranica PDF-a, odnosno s postupkom OCR-a.
- Po završetku OCR-a, prikazat će se obavijest da je proces završen.
- Moguće je pregledati svaki dio PDF datoteke pri čemu korisnik može provjeriti je li alat ispravno prepoznao dijelove PDF-a; je li tekstualni sadržaj prepoznao kao tekst, slikovni sadržaj kao sliku, tablične podatke kao tablicu itd.
- Po završetku projekta, potrebno je odabrati opciju Save – Save as Searchable PDF Document.
- Prikazat će se prozor s odabirom gumba Options. Klikom na Options, bit će ponuđena mogućnost spremanja PDF/A inačice dokumenta.
Besplatni alati za ažuriranje metapodataka PDF datoteka
...