BookTranslator
BookTranslator

Ako preložiť PDF bez straty formátovania (sprievodca pre rok 2026)

Kompletný sprievodca prekladaním PDF pri zachovaní rozloženia, tabuliek, obrázkov a písiem. Otestovali sme každú metódu a nástroj, aby sme zistili, čo skutočne funguje.

BookTranslator

BookTranslator Team

Návody na preklad11 min read

Rýchla odpoveď: Použite správny postup pre PDF, ktoré máte

Ak chcete preložiť PDF bez straty formátovania, najprv skontrolujte, či PDF obsahuje text, ktorý možno označiť. Ak áno, použite špecializovaný prekladač PDF, napríklad Prekladač PDF BookTranslator. Ak nie, najprv spustite OCR a až potom preložte PDF spracované pomocou OCR. Nekopírujte text do bežného prekladača, ak potrebujete, aby si finálny dokument zachoval stĺpce, tabuľky, obrázky, popisy, hlavičky, päty a poradie strán.

Tu je praktická rozhodovacia tabuľka:

Typ PDFNajbezpečnejší postupČomu sa vyhnúť
PDF s označiteľným textomNahrajte do Prekladača PDF a potom skontrolujte rozloženieKopírovanie a vkladanie do textového poľa.
Naskenované PDFNajprv OCR, potom prekladNahrávanie stránok obsahujúcich iba obrázky do prekladača určeného len pre text.
Akademická prácaPoužite prekladač PDF a potom skontrolujte rovnice, citácie, tabuľky a obrázkyBezhlavá konverzia do DOCX.
Jednoduché jednostranové PDFGoogle Translate môže stačiť, ak na rozložení nezáležíPredpoklad, že výstup je pripravený na prezentáciu.
Knižné PDFPoužite dokumentový postup s kontrolou terminológieManuálne chatové prompty po jednotlivých stranách.

Ak vyberáte medzi nástrojmi, pozrite si porovnanie najlepších prekladačov PDF. Ak je váš súbor sken, prejdite rovno na sprievodcu OCR pre naskenované PDF.

Prečo sa pri preklade rozpadá formátovanie PDF

PDF sa neukladajú ako dokumenty Wordu. Súbor DOCX obsahuje odseky, nadpisy, zoznamy a tabuľky ako upraviteľné štruktúry. PDF je bližšie k pevnej ploche. Text je na stránke umiestnený na konkrétnych súradniciach, často v malých fragmentoch. PDF môže vyzerať ako bežný dokument, ale interne môže ísť o sadu textových blokov, odkazov na písma, obrázkov, masiek a súradníc.

Preklad mení dĺžku textu. Práve tam sa rozloženie láme.

Zdrojový a cieľový jazykBežný vplyv na rozloženie
Z angličtiny do nemčiny alebo španielčinyText sa často rozšíri, takže polia pretekajú.
Z angličtiny do čínštiny alebo japončinyText sa často skracuje, takže vzniká prázdne miesto.
Z angličtiny do arabčiny alebo hebrejčinySmer písma a zarovnanie si vyžadujú špeciálne spracovanie.
Ľubovoľný jazyk s dlhými zloženými výrazmiNadpisy a tabuľky môžu pretekať.
Ľubovoľná naskenovaná stranaKým sa nespustí OCR, nemusí existovať žiadny text na preklad.

Dobrý postup prekladu PDF musí zvládnuť päť úloh:

  1. Zistiť poradie čítania.
  2. Oddeliť hlavný text, hlavičky, popisy, tabuľky a poznámky pod čiarou.
  3. Preložiť súvislé textové bloky, nie náhodné útržky.
  4. Vložiť preložený text späť na stránku.
  5. Vygenerovať použiteľné výstupné PDF na kontrolu.

Väčšina neúspešných postupov zvládne len prostredný krok: extrahuje text a preloží ho. Preto môžu byť slová správne, zatiaľ čo dokument sa stane nepoužiteľným.

Metóda 1: Použite špecializovaný prekladač PDF

Najvhodnejšie pre: dlhé PDF, klientské dokumenty, reporty, knihy, manuály a akademické súbory.

Toto je najspoľahlivejší východiskový bod, keď záleží na formátovaní. Špecializovaný prekladač PDF je navrhnutý okolo problému dokumentu: poradia čítania, zachovania rozloženia, štruktúry stránok a kontroly výstupu.

Použite tento postup:

  1. Otvorte PDF a potvrďte, že môžete označiť text.
  2. Nahrajte súbor do Prekladača PDF.
  3. Vyberte zdrojový a cieľový jazyk.
  4. Preložte dokument.
  5. Porovnajte výstup s originálom na stranách s tabuľkami, nadpismi, popismi, poznámkami pod čiarou a obrázkami.
  6. Urobte záverečnú ľudskú kontrolu, ak ide o právny, medicínsky, finančný, akademický alebo publikovateľný dokument.

Čo táto metóda zachováva najlepšie:

  • Štruktúru stránok
  • Zoskupenie odsekov
  • Nadpisy
  • Obrázky
  • Popisy
  • Tabuľky, ktoré nie sú príliš rozdrobené
  • Poradie čítania v bežných viacstĺpcových rozloženiach

Čo si ešte vyžaduje kontrolu:

  • Husté tabuľky
  • Veľmi malé poznámky pod čiarou
  • Rovnice
  • Ručne písané poznámky
  • Veľmi úzke textové polia
  • Nekvalitné vložené písma
  • Chyby OCR v naskenovaných súboroch

Ak si chcete pred výberom porovnať možnosti nástrojov, použite naše porovnanie nástrojov na preklad PDF.

Metóda 2: Použite Google Translate na rýchle pochopenie obsahu

Najvhodnejšie pre: krátke PDF, pri ktorých na rozložení nezáleží.

Google Translate je užitočný, keď potrebujete len vedieť, čo dokument hovorí. Nie je to najbezpečnejší postup, keď potrebujete hotové preložené PDF.

Typický postup:

  1. Otvorte Google Translate.
  2. Vyberte možnosť nahrania dokumentu.
  3. Nahrajte PDF.
  4. Vyberte zdrojový a cieľový jazyk.
  5. Preložte ho a skontrolujte výstup.

Kde funguje:

  • Krátke PDF s čistým textom
  • Osobné čítanie
  • Rýchle pochopenie obsahu
  • Jednoduché memorandá alebo listy

Kde zlyháva:

  • Viacstĺpcové reporty
  • Tabuľky
  • Obrázky a popisy
  • Naskenované PDF bez OCR
  • Súbory, pri ktorých záleží na rozložení stránok
  • Dokumenty, ktoré potrebujú konzistentnú terminológiu naprieč mnohými stranami

Ak sa konkrétne snažíte použiť Google, prečítajte si celý sprievodca prekladaním PDF v Google Translate. Vysvetľuje webový postup, obchádzku cez Google Docs aj signály zlyhania, ktoré treba skontrolovať skôr, než začnete výstupu dôverovať.

Metóda 3: Použite ChatGPT na text, nie na finálne rozloženie PDF

Najvhodnejšie pre: krátke úseky, prácu s glosárom, kontrolu tónu a revíziu prekladu.

ChatGPT môže pomôcť s prekladom obsahu PDF, keď má prístup k textu. Je obzvlášť užitočný, keď otázka neznie len "čo sa tu píše?", ale aj "ako to má znieť v cieľovom jazyku?"

Dobré použitia ChatGPT:

  • Preložiť náročný odsek.
  • Prispôsobiť tón konkrétnemu publiku.
  • Vytvoriť glosár pred prekladom dlhého dokumentu.
  • Skontrolovať preklad a označiť neobratné formulácie.
  • Vysvetliť technickú pasáž v inom jazyku.

Zlé použitia ChatGPT:

  • Znovu vytvárať kompletné rozloženie PDF.
  • Prekladať dlhú knihu stranu po strane.
  • Zachovávať tabuľky, popisy a čísla strán.
  • Spracúvať naskenované PDF bez spoľahlivého kroku OCR.
  • Vytvárať finálny súbor, ktorý možno zdieľať bez manuálnej kontroly.

Použite tento prompt pre krátke úseky:

Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].

Pre kompletný postup v ChatGPT a vhodné prompty použite sprievodcu prekladaním PDF v ChatGPT.

Metóda 4: Najprv preveďte PDF do DOCX

Najvhodnejšie pre: dokumenty, ktoré plánujete upravovať alebo manuálne znovu vyskladať.

Konverzia PDF do DOCX môže pomôcť, keď potrebujete upraviteľný text. Pre formátovanie to automaticky nie je lepšie. V skutočnosti môže k poškodeniu rozloženia dôjsť práve pri konverzii.

Konverziu použite, keď:

  • Potrebujete výrazne upraviť preložený text.
  • Plánujete manuálne znovu vyskladať finálne rozloženie.
  • PDF je jednoduché a prevažne textové.
  • Potrebujete pracovný návrh, nie hotové PDF.

Konverzii sa vyhnite, keď:

  • Pôvodné PDF obsahuje zložité tabuľky.
  • Dokument má dvojstĺpcové akademické rozloženie.
  • Súbor používa veľa popisov, poznámok pod čiarou alebo bočných panelov.
  • Finálny výstup sa musí zhodovať s originálom stranu po strane.

Pred konverziou celého dokumentu otestujte jednu náročnú stranu. Ak sa pri prevode do DOCX táto strana rozbije, preložený výstup zdedí rovnaké poškodenie.

Metóda 5: Pri naskenovaných PDF najprv OCR

Najvhodnejšie pre: fotokópie, PDF obsahujúce iba obrázky, staré knihy, naskenované zmluvy a dokumenty naskenované telefónom.

Naskenované PDF obsahuje obrázky textu, nie text. Prekladové nástroje nedokážu spoľahlivo prekladať pixely. Najprv potrebujú OCR, aby vytvorili textovú vrstvu.

Použite tento postup:

  1. Skúste v PDF označiť text.
  2. Ak to nejde, spustite OCR.
  3. Zvoľte správny jazyk OCR.
  4. Skontrolujte extrahovaný text.
  5. Preložte PDF spracované pomocou OCR.
  6. Skontrolujte miesta citlivé na OCR: čísla, mená, tabuľky, poznámky pod čiarou a text s nízkym kontrastom.

Bežnou chybou je preskočiť krok 4. Chyby OCR sa zmenia na chyby prekladu. Ak OCR prečíta "rn" ako "m" alebo "0" ako "O", prekladač verne preloží nesprávny vstup.

Pre kompletný postup OCR použite sprievodcu prekladom naskenovaných PDF.

Dôležité kontroly pred a po preklade

Nemusíte kontrolovať každú stranu s rovnakou úrovňou detailu. Vyberte si strany, ktoré sa s najväčšou pravdepodobnosťou pokazia.

Prvok stránkyČo porovnať po prekladeSignál zlyhania
Titulná stranaNázov, podnázov, mená autorov, rozostupyText sa prekrýva alebo sa mená zmenili.
ObsahNadpisy, číslovanie, odkazy na stranyChýbajú odkazy alebo čísla.
Dvojstĺpcová časťPoradie čítania a hranice stĺpcovĽavý a pravý stĺpec sa zlúčia.
TabuľkaOznačenia riadkov, čísla, jednotky, poznámky pod čiarouBunky sa posunú alebo zmiznú zalomenia riadkov.
Popis obrázkaPopis zostane pri obrázkuPopisy sa presunú k nesprávnemu obrázku.
Poznámka pod čiarouZnačky a text poznámky sa zhodujúPoznámka sa zmení na hlavný text.
CitáciaMená autorov, roky, zátvorkyInterpunkcia citácie sa zmení nesprávne.
Strana s rovnicamiRovnica zostane nedotknutá, okolný text sa preložíVzorec sa zmení alebo prepíše nesprávne.

Pri akademických dokumentoch si prečítajte aj nášho sprievodcu prekladom akademických výskumných prác, kde sú hlavným rizikom rovnice, citácie a dvojstĺpcové rozloženia.

Kontrolný zoznam na zachovanie rozloženia

Použite tento kontrolný zoznam pred nahraním aj po stiahnutí:

  • Dá sa v zdrojovom PDF označiť text?
  • Je súbor sken, digitálne PDF alebo PDF s textovou vrstvou nad obrázkom?
  • Sú v ňom tabuľky so zlúčenými bunkami?
  • Sú v ňom dvojstĺpcové časti?
  • Sú popisy pevne viazané na obrázky?
  • Sú hlavičky a päty významové alebo len dekoratívne?
  • Sú v ňom ručne písané poznámky alebo pečiatky?
  • Sú v ňom rovnice, citácie alebo bloky kódu?
  • Cieľový jazyk text výrazne predlžuje alebo skracuje?
  • Má sa výstup zdieľať ako hotové PDF?

Ak je odpoveď na poslednú otázku áno, nespoliehajte sa na postup prekladu obyčajného textu.

Bežné zlyhania a riešenia

ZlyhaniePrečo sa to dejeRiešenie
Stĺpce sa zlúčia do jedného odsekuNástroj číta podľa súradníc namiesto logického poradiaPoužite prekladač PDF alebo otestujte lepší postup extrakcie.
Tabuľky sa zmenia na obyčajný textHranice tabuliek sa nerozpoznajúSkontrolujte tabuľky ručne alebo znovu vytvorte kritické tabuľky.
Naskenované strany zostanú nepreloženéPDF nemá textovú vrstvuNajprv spustite OCR.
Text sa prekrývaCieľový jazyk sa rozšíri nad pôvodný priestorPoužite nástroj, ktorý pracuje s rozložením, a potom skontrolujte stiesnené miesta.
Popisy sa posúvajúS obrázkom a popisom sa nepracuje ako s jedným celkomStrany s obrázkami skontrolujte ručne.
Poznámky pod čiarou sa zmenia na hlavný textPri extrakcii sa stratí hierarchiaSkontrolujte strany s poznámkami pod čiarou a citáciami.
Mená alebo čísla sa zmeniaPrekladový model s nimi zaobchádza ako s bežným textomPridajte glosár alebo skontrolujte rizikové entity.
Výstup vyzerá správne, ale význam nesedíRozloženie prežilo, jazyk niePri dôležitých častiach použite dvojjazyčnú kontrolu.

Odporúčaný postup pre väčšinu používateľov

  1. Skontrolujte, či sa v PDF dá označiť text.
  2. Ak je naskenované, spustite OCR a skontrolujte textovú vrstvu.
  3. Nahrajte PDF do Prekladača PDF.
  4. Preložte celý dokument.
  5. Najprv skontrolujte najproblematickejšie strany: tabuľky, stĺpce, obrázky, poznámky pod čiarou a citácie.
  6. ChatGPT alebo ľudského recenzenta používajte na kontrolu formulácií, nie ako nástroj na skladanie rozloženia.
  7. Originálne PDF, preložené PDF a prípadný glosár uchovávajte spolu pre budúce aktualizácie.

Tento postup udržiava každý nástroj v správnej úlohe: OCR číta skeny, preklad PDF zachováva štruktúru dokumentu a ľudská alebo LLM kontrola zlepšuje jazyk.

FAQ

Aký je najlepší spôsob, ako preložiť PDF bez straty formátovania?

Použite špecializovaný prekladač PDF pre PDF s označiteľným textom. Ak je PDF naskenované, najprv spustite OCR a potom preložte PDF spracované pomocou OCR. Začnite s Prekladačom PDF, ak potrebujete, aby finálny súbor zostal formátovaným PDF.

Prečo sa pri preklade PDF rozpadne formátovanie?

PDF ukladajú text na pevnej stránke, často ako umiestnené fragmenty namiesto upraviteľných odsekov. Preklad mení dĺžku textu a nástroj potom musí znovu poskladať rozloženie stránky. Základné prekladače text zvyčajne iba extrahujú a preložia, ale rozloženie potom nedokážu dobre obnoviť.

Dokáže Google Translate zachovať rozloženie PDF?

Na rýchle pochopenie obsahu môže byť užitočný, ale na zachovanie hotového rozloženia nie je spoľahlivý. Bežnými miestami zlyhania sú tabuľky, stĺpce, obrázky, popisy a naskenované strany. Ak chcete tento postup aj tak vyskúšať, použite sprievodcu prekladaním PDF v Google Translate.

Dokáže ChatGPT preložiť PDF a zachovať formátovanie?

ChatGPT dokáže preložiť alebo vylepšiť text, ale nemali by ste ho považovať za nástroj na zachovanie rozloženia PDF. Používajte ho na krátke pasáže, prácu s glosárom a revíziu. Na finálne rozloženie dokumentu použite prekladač PDF.

Čo mám urobiť s naskenovaným PDF?

Najprv spustite OCR. Potom pred prekladom skontrolujte extrahovaný text. Naskenovaným súborom sa podrobne venuje sprievodca prekladom naskenovaných PDF.

Mám pred prekladom previesť PDF do Wordu?

Iba ak plánujete dokument manuálne upraviť alebo znovu vyskladať. Konverzia môže poškodiť rozloženie strany ešte pred začiatkom prekladu. Ak chcete zachovať rozloženie, najprv otestujte cestu priameho prekladu PDF.