BookTranslator
BookTranslator

Kako prevesti PDF, ne da bi izgubili oblikovanje (vodnik za 2026)

Celovit vodnik za prevajanje PDF-jev ob ohranjanju postavitve, tabel, slik in pisav. Preizkusili smo vse metode in orodja, da bi ugotovili, kaj dejansko deluje.

BookTranslator

BookTranslator Team

Vodniki za prevajanje11 min read

Hiter odgovor: uporabite pravi potek dela za PDF, ki ga imate

Če želite prevesti PDF brez izgube oblikovanja, najprej preverite, ali PDF vsebuje besedilo, ki ga je mogoče označiti. Če ga vsebuje, uporabite namenski prevajalnik PDF-jev, kot je BookTranslator prevajalnik PDF-jev. Če ga ne vsebuje, najprej zaženite OCR, nato pa prevedite PDF, obdelan z OCR. Besedila ne kopirajte in lepite v splošni prevajalnik, če želite, da končni dokument ohrani stolpce, tabele, slike, napise, glave, noge strani in vrstni red strani.

Tukaj je praktična tabela odločanja:

Vrsta PDF-jaNajvarnejši potek delaČemu se izogniti
PDF z besedilom, ki ga je mogoče označitiNaložite v prevajalnik PDF-jev, nato preverite postavitevKopiranju in lepljenju v besedilno polje.
Skenirani PDFNajprej OCR, nato prevodNalaganju strani, ki vsebujejo le slike, v prevajalnik samo za besedilo.
Znanstveni članekUporabite prevajalnik PDF-jev, nato preverite enačbe, citate, tabele in slikeSlepemu pretvarjanju v DOCX.
Preprost enostranski PDFGoogle Translate je lahko dovolj, če postavitev ni pomembnaDomnevi, da je izhod pripravljen za predstavitev.
PDF v dolžini knjigeUporabite potek dela za dokumente s pregledom terminologijeRočnim pozivom v klepetu stran za stranjo.

Če izbirate med orodji, uporabite primerjavo najboljših prevajalnikov PDF-jev. Če je vaša datoteka sken, pojdite neposredno na vodnik za OCR skeniranih PDF-jev.

Zakaj se oblikovanje PDF-ja med prevajanjem poruši

PDF-ji niso shranjeni kot dokumenti Word. Datoteka DOCX ima odstavke, naslove, sezname in tabele kot urejive strukture. PDF je bližje fiksnemu platnu. Besedilo je na strani postavljeno na določene koordinate, pogosto v majhnih fragmentih. PDF je morda videti kot običajen dokument, vendar je v ozadju lahko sestavljen iz blokov besedila, sklicev na pisave, slik, mask in koordinat.

Prevod spremeni dolžino besedila. Tu se postavitev začne rušiti.

Iz izvornega v ciljni jezikPogost učinek na postavitev
Iz angleščine v nemščino ali španščinoBesedilo se pogosto razširi, zato polja prekipijo.
Iz angleščine v kitajščino ali japonščinoBesedilo se pogosto skrči, zato se pojavi prazen prostor.
Iz angleščine v arabščino ali hebrejščinoSmer pisave in poravnava zahtevata posebno obravnavo.
Kateri koli jezik z dolgimi zloženkamiNaslovi in tabele lahko prekipijo.
Katera koli skenirana stranBesedila za prevod morda sploh ni, dokler ne steče OCR.

Dober potek dela za prevajanje PDF-jev mora opraviti pet nalog:

  1. Prepoznati vrstni red branja.
  2. Ločiti glavno besedilo, glave, napise, tabele in opombe pod črto.
  3. Prevajati smiselne bloke besedila, ne naključnih fragmentov.
  4. Prilagoditi prevedeno besedilo nazaj na stran.
  5. Izrisati uporaben izhodni PDF za pregled.

Večina neuspešnih potekov dela opravi le srednji korak: izlušči besedilo in ga prevede. Zato so besede lahko pravilne, dokument pa postane neuporaben.

Metoda 1: uporabite namenski prevajalnik PDF-jev

Najboljše za: dolge PDF-je, dokumente za stranke, poročila, knjige, priročnike in akademske datoteke.

To je najbolj zanesljiva izhodiščna točka, kadar je oblikovanje pomembno. Namenski prevajalnik PDF-jev je zasnovan okoli težave dokumenta: vrstni red branja, ohranjanje postavitve, struktura strani in pregled izhoda.

Uporabite ta potek dela:

  1. Odprite PDF in potrdite, da lahko označite besedilo.
  2. Datoteko naložite v prevajalnik PDF-jev.
  3. Izberite izvorni in ciljni jezik.
  4. Prevedite dokument.
  5. Primerjajte izhod z izvirnikom na straneh s tabelami, naslovi, napisi, opombami pod črto in slikami.
  6. Opravite končni človeški pregled, če je dokument pravni, medicinski, finančni, akademski ali namenjen objavi.

Kaj ta metoda najbolje ohrani:

  • Strukturo strani
  • Združevanje odstavkov
  • Naslove
  • Slike
  • Napise
  • Tabele, ki niso preveč razdrobljene
  • Vrstni red branja v običajnih večstolpčnih postavitvah

Kaj je še vedno treba pregledati:

  • Goste tabele
  • Drobne opombe pod črto
  • Enačbe
  • Ročno napisane opombe
  • Zelo ozka besedilna polja
  • Vgrajene pisave nizke kakovosti
  • Napake OCR pri skeniranih datotekah

Če želite pred izbiro primerjati možnosti orodij, uporabite našo primerjavo orodij za prevajanje PDF-jev.

Metoda 2: uporabite Google Translate za hitro razumevanje

Najboljše za: kratke PDF-je, pri katerih postavitev ni pomembna.

Google Translate je uporaben, kadar morate samo razumeti, kaj dokument pravi. Ni pa to najvarnejši potek dela, kadar potrebujete končen prevedeni PDF.

Običajen potek dela:

  1. Odprite Google Translate.
  2. Izberite možnost za nalaganje dokumenta.
  3. Naložite PDF.
  4. Izberite izvorni in ciljni jezik.
  5. Prevedite in preglejte izhod.

Kje deluje:

  • Kratki PDF-ji z navadnim besedilom
  • Osebno branje
  • Hitro razumevanje
  • Preprosti dopisi ali pisma

Kje odpove:

  • Večstolpčna poročila
  • Tabele
  • Slike in napisi
  • Skenirani PDF-ji brez OCR
  • Datoteke, pri katerih je postavitev strani pomembna
  • Dokumenti, ki potrebujejo dosledno terminologijo na mnogih straneh

Če posebej poskušate uporabiti Google, preberite celoten vodnik za prevajanje PDF-jev z Google Translate. Pojasnjuje spletno metodo, obvod prek Google Docs in opozorilne znake, ki jih preverite, preden izhodu zaupate.

Metoda 3: uporabite ChatGPT za besedilo, ne za končno postavitev PDF-ja

Najboljše za: kratke odseke, delo z glosarjem, nadzor tona in pregled prevoda.

ChatGPT lahko pomaga pri prevajanju vsebine PDF-ja, kadar ima dostop do besedila. Posebej uporaben je, kadar vprašanje ni le »kaj to pomeni?«, temveč »kako naj to zveni v ciljnem jeziku?«

Dobri primeri uporabe ChatGPT-ja:

  • Prevedite zahtevnejši odstavek.
  • Prilagodite ton določenemu občinstvu.
  • Zgradite glosar pred prevajanjem dolgega dokumenta.
  • Preglejte prevod in označite nerodne formulacije.
  • Pojasnite tehnični odlomek v drugem jeziku.

Slabi primeri uporabe ChatGPT-ja:

  • Poustvarjanje celotne postavitve PDF-ja.
  • Prevajanje dolge knjige stran za stranjo.
  • Ohranjanje tabel, napisov in številk strani.
  • Obravnava skeniranih PDF-jev brez zanesljivega koraka OCR.
  • Ustvarjanje končne datoteke, ki jo je mogoče deliti brez ročnega pregleda.

Za kratke odseke uporabite ta poziv:

Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].

Za celoten potek dela s ChatGPT-jem in pozive uporabite vodnik za prevajanje PDF-jev s ChatGPT-jem.

Metoda 4: najprej pretvorite PDF v DOCX

Najboljše za: dokumente, ki jih nameravate urejati ali ročno na novo postaviti.

Pretvorba PDF-ja v DOCX lahko pomaga, kadar potrebujete urejivo besedilo. Ni pa samodejno boljša za oblikovanje. Pravzaprav je lahko prav korak pretvorbe tisti, kjer nastane škoda na postavitvi.

Pretvorbo uporabite, kadar:

  • Potrebujete obsežno urejanje prevedenega besedila.
  • Nameravate končno postavitev ročno zgraditi na novo.
  • Je PDF preprost in večinoma besedilni.
  • Potrebujete delovno različico, ne končnega PDF-ja.

Pretvorbi se izognite, kadar:

  • Ima izvirni PDF kompleksne tabele.
  • Ima dokument dvostolpčno akademsko postavitev.
  • Datoteka uporablja veliko napisov, opomb pod črto ali stranskih opomb.
  • Se mora končni izhod ujemati z izvirnikom stran za stranjo.

Preden pretvorite celoten dokument, preizkusite eno zahtevno stran. Če pretvorba v DOCX pokvari to stran, bo prevedeni izhod podedoval to škodo.

Metoda 5: pri skeniranih PDF-jih najprej izvedite OCR

Najboljše za: fotokopije, PDF-je, ki vsebujejo le slike, stare knjige, skenirane pogodbe in dokumente, skenirane s telefonom.

Skenirani PDF vsebuje slike besedila, ne besedila. Orodja za prevajanje pikslov ne morejo zanesljivo prevajati. Najprej potrebujejo OCR, da ustvarijo besedilni sloj.

Uporabite ta potek dela:

  1. Poskusite označiti besedilo v PDF-ju.
  2. Če označevanje ne deluje, zaženite OCR.
  3. Izberite pravilen jezik OCR.
  4. Preglejte izluščeno besedilo.
  5. Prevedite PDF, obdelan z OCR.
  6. Preglejte področja, občutljiva na OCR: številke, imena, tabele, opombe pod črto in besedilo z nizkim kontrastom.

Pogosta napaka je preskok 4. koraka. Napake OCR postanejo prevajalske napake. Če OCR prebere »rn« kot »m« ali »0« kot »O«, bo prevajalnik zvesto prevedel napačen vhod.

Za celoten potek dela OCR uporabite vodnik za prevajanje skeniranih PDF-jev.

Pregledi pred in po prevodu, ki zares štejejo

Ni treba, da vsako stran pregledate z enako stopnjo podrobnosti. Izberite strani, pri katerih je največja verjetnost, da se bodo pokvarile.

Element straniKaj primerjati po prevoduZnak napake
Naslovna stranNaslov, podnaslov, imena avtorjev, razmikiBesedilo se prekriva ali pa so imena spremenjena.
Kazalo vsebineNaslovi, številčenje, sklici na straniPovezave ali številke manjkajo.
Dvostolpčni odsekVrstni red branja in meje stolpcevLevi in desni stolpec se zlijeta.
TabelaOznake vrstic, številke, enote, opombe pod črtoCelice se premaknejo ali pa prelomov vrstic ni več.
Napis slikeNapis ostane pri slikiNapisi se premaknejo k napačni sliki.
Opomba pod črtoOznake in besedilo opomb pod črto se ujemajoOpomba pod črto postane glavno besedilo.
CitatImena avtorjev, letnice, oklepajiLočila v citatu se napačno spremenijo.
Stran z enačbamiEnačba ostane nedotaknjena, okoliško besedilo pa je prevedenoFormula je spremenjena ali napačno ponovno prepisana.

Pri akademskih dokumentih preberite tudi naš vodnik za prevajanje znanstvenih raziskovalnih člankov, kjer so glavno tveganje enačbe, citati in dvostolpčne postavitve.

Kontrolni seznam za ohranjanje postavitve

Uporabite ta kontrolni seznam pred nalaganjem in po prenosu:

  • Ali lahko v izvornem PDF-ju označite besedilo?
  • Ali je datoteka sken, digitalni PDF ali PDF z besedilom prek slike?
  • Ali so v njej tabele z združenimi celicami?
  • Ali vsebuje dvostolpčne odseke?
  • Ali so napisi vezani na slike?
  • Ali so glave in noge strani pomembne ali zgolj dekorativne?
  • Ali vsebuje ročno napisane opombe ali žige?
  • Ali vsebuje enačbe, citate ali bloke kode?
  • Ali se ciljni jezik bistveno razširi ali skrči?
  • Ali je treba izhod deliti kot končan PDF?

Če je odgovor na zadnje vprašanje da, se ne zanašajte na potek dela za prevajanje navadnega besedila.

Pogoste napake in popravki

NapakaZakaj se zgodiPopravek
Stolpci se zlijejo v en odstavekOrodje bere po koordinatah namesto po logičnem vrstnem reduUporabite prevajalnik PDF-jev ali preizkusite boljši potek izluščanja.
Tabele postanejo navadno besediloMeje tabel niso zaznaneTabele preglejte ročno ali znova sestavite ključne tabele.
Skenirane strani ostanejo neprevedenePDF nima besedilnega slojaNajprej zaženite OCR.
Besedilo se prekrivaCiljni jezik se razširi prek prvotnega prostoraUporabite orodje, ki obvlada postavitev, nato pregledajte tesna območja.
Napisi se premaknejoSlika in napis nista obravnavana kot celotaStrani s slikami preverite ročno.
Opombe pod črto postanejo glavno besediloKorak izluščanja izgubi hierarhijoPreglejte strani z opombami pod črto in citate.
Imena ali številke se spremenijoPrevajalski model jih obravnava kot navadno besediloDodajte glosar ali preglejte visoko tvegane entitete.
Izhod je videti pravilen, a pomen niPostavitev je preživela, jezik pa neZa pomembne odseke uporabite dvojezični pregled.

Priporočen potek dela za večino uporabnikov

  1. Preverite, ali je v PDF-ju mogoče označiti besedilo.
  2. Če je skeniran, zaženite OCR in preglejte besedilni sloj.
  3. Naložite PDF v prevajalnik PDF-jev.
  4. Prevedite celoten dokument.
  5. Najprej preglejte najzahtevnejše strani: tabele, stolpce, slike, opombe pod črto in citate.
  6. Za preverjanje ubeseditve uporabite ChatGPT ali človeškega pregledovalca, ne kot mehanizem za postavitev.
  7. Izvirni PDF, prevedeni PDF in morebitni glosar hranite skupaj za prihodnje posodobitve.

Ta potek dela ohranja vsako orodje v pravi vlogi: OCR bere skene, prevajanje PDF-jev ohranja strukturo dokumenta, človeški ali LLM-pregled pa izboljša jezik.

FAQ

Kateri je najboljši način za prevod PDF-ja brez izgube oblikovanja?

Za PDF-je, v katerih je mogoče označiti besedilo, uporabite namenski prevajalnik PDF-jev. Če je PDF skeniran, najprej zaženite OCR, nato prevedite PDF, obdelan z OCR. Začnite z prevajalnikom PDF-jev, če potrebujete, da končna datoteka ostane oblikovan PDF.

Zakaj se oblikovanje PDF-ja poruši, ko ga prevedem?

PDF-ji shranjujejo besedilo na fiksni strani, pogosto kot postavljene fragmente namesto kot urejive odstavke. Prevod spremeni dolžino besedila, orodje pa mora znova sestaviti postavitev strani. Osnovni prevajalniki običajno besedilo le izluščijo in prevedejo, postavitve pa ne obnovijo dobro.

Ali lahko Google Translate ohrani postavitev PDF-ja?

Lahko je uporaben za hitro razumevanje, ni pa zanesljiv za ohranjanje končne postavitve. Tabele, stolpci, slike, napisi in skenirane strani so pogoste točke odpovedi. Če vseeno želite preizkusiti ta potek dela, uporabite vodnik za prevajanje PDF-jev z Google Translate.

Ali lahko ChatGPT prevede PDF in ohrani oblikovanje?

ChatGPT lahko prevede ali izboljša besedilo, vendar ga ne smete obravnavati kot orodje za ohranjanje postavitve PDF-ja. Uporabite ga za kratke odlomke, delo z glosarjem in pregled. Za končno postavitev dokumenta uporabite prevajalnik PDF-jev.

Kaj naj naredim s skeniranim PDF-jem?

Najprej zaženite OCR. Nato pred prevajanjem preglejte izluščeno besedilo. Skenirane datoteke so podrobno obravnavane v vodniku za prevajanje skeniranih PDF-jev.

Ali naj PDF pred prevajanjem pretvorim v Word?

Samo če nameravate dokument ročno urejati ali znova postaviti. Pretvorba lahko poškoduje postavitev strani, še preden se prevajanje sploh začne. Če želite ohraniti postavitev, najprej preizkusite pot prevajanja PDF-ja.