Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
  • PDF datoteka treba imati upisane ispravne metapodake poput autora i naslova jer  tražilice i baze podataka te podatke nerijetko koriste za indeksiranje. Metapodaci su u PDF čitaču Adobe Reader vidljivi kroz izbornik: File > Properties. U programu za obradu teksta Microsoft Word se metapodaci uređuju pomoću opcije Properties. Upute za ažuriranje metapodataka PDF datoteka pomoću besplatnih alata nalaze se niže na stranici. 
  • PDF datoteka ne smije imati uključenu enkripciju jer to značajno ograničava mogućnost budućih migracija na druge formate ili verzije PDF-a. Iz tog razloga i neke baze (npr. WoS) nisu sklone preuzimanju i korištenju PDF datoteka koje imaju uključenu bilo kakvu enkripciju. U PDF čitaču Adobe Reader postavke sigurnosti vidljive su kroz izbornik: File > Properties > Security. Vrijednost opcije Security Method mora biti postavljena na No Security.

  • PDF datoteku je potrebno kreirati koristeći PDF/A inačicu PDF formata. PDF/A inačica namijenjena je za dugoročno čuvanje elektroničkih dokumenata. Specificirana je standardom ISO 19005 i osigurava samodostatnost dokumenta na način da sve vanjske resurse potrebne za reprodukciju dokumenta (npr. fontove) uključi u PDF datoteku kako bi se dokument mogao reproducirati bez obzira na promjene tehnologije i neovisno o platformi. PDF/A ujedno isključuje mogućnost enkripcije te pokretanja programskih skripti i izvršnih datoteka.

...

Zbog arhivske svrhe i pravne valjanosti dokumenta, tekst prepoznat u postupku OCR-a potrebno je spremiti u sloju ispod slike teksta kako bi se sačuvao izvorni izgled dokumenta i istovremeno dobila mogućnost označavanja teksta.

Upotreba alata Abby FineReader – smjernice za naknadno OCR-iranje PDF dokumenata

U nastavku se nalazi prikaz koraka za naknadno OCR-iranje PDF dokumenata u alatu AbbyFineReader (komercijalni alat):

  • Za naknadno OCR-iranje skenirane PDF datoteke u alatu Abby FineReader (PDF pohranjen kao slika, ne kao tekst), klikom na Tools u alatnoj traci potrebno je odabrati OCR Editor.
  • Otvara se novi prozor za izradu projekta.
  • Ponuđena je mogućnost odabira jezika koje(g) će alat koristiti za prepoznavanje/OCR-iranje te mogućnost automatskog prepoznavanja jezika prilikom OCR-a.
  • Za otvaranje PDF datoteke unutar prozora za izradu projekta, moguće je koristiti metodu drag and drop pri čemu će alat automatski početi s optičkim prepoznavanjem stranica PDF-a, odnosno s postupkom OCR-a.
  • Po završetku OCR-a, prikazat će se obavijest da je proces završen.
  • Moguće je pregledati svaki dio PDF datoteke pri čemu korisnik može provjeriti je li alat ispravno prepoznao dijelove PDF-a; je li tekstualni sadržaj prepoznao kao tekst, slikovni sadržaj kao sliku, tablične podatke kao tablicu itd.
  • Po završetku projekta, potrebno je odabrati opciju SaveSave as Searchable PDF Document.
  • Prikazat će se prozor s odabirom gumba Options. Klikom na Options, bit će ponuđena mogućnost spremanja PDF/A inačice dokumenta.

Besplatni alati za ažuriranje metapodataka PDF datoteka

...