BookTranslator
BookTranslator

Kaip išversti PDF neprarandant formatavimo (2026 m. vadovas)

Išsamus vadovas, kaip versti PDF išsaugant maketą, lenteles, vaizdus ir šriftus. Išbandėme kiekvieną metodą ir įrankį, kad išsiaiškintume, kas iš tikrųjų veikia.

BookTranslator

BookTranslator Team

Vertimo gairės11 min read

Greitas atsakymas: pasirinkite tinkamą darbo eigą pagal turimą PDF

Norėdami išversti PDF neprarasdami formatavimo, pirmiausia patikrinkite, ar PDF faile tekstą galima pažymėti. Jei taip, naudokite specializuotą PDF vertėją, pavyzdžiui, BookTranslator PDF vertėją. Jei ne, pirmiausia paleiskite OCR, tada verskite OCR apdorotą PDF. Nekopijuokite ir neįklijuokite teksto į bendrinį vertėją, jei jums reikia, kad galutiniame dokumente būtų išsaugotos skiltys, lentelės, vaizdai, antraštės prie paveikslų, puslapių antraštės, poraštės ir puslapių tvarka.

Štai praktiška sprendimo lentelė:

PDF tipasSaugiausia darbo eigaKo vengti
PDF su pažymimu tekstuĮkelkite į PDF vertėją, tada peržiūrėkite maketąKopijuoti ir įklijuoti į teksto lauką.
Skenuotas PDFPirmiausia OCR, tada vertimasĮkelti tik iš vaizdų sudarytus puslapius į tik tekstui skirtą vertėją.
Mokslinis straipsnisNaudokite PDF vertėją, tada patikrinkite formules, citatas, lenteles ir iliustracijasAkla konversija į DOCX.
Paprastas vieno puslapio PDFGali pakakti „Google Translate“, jei maketas nesvarbusManyti, kad rezultatas jau paruoštas pateikimui.
Knygos apimties PDFNaudokite dokumento darbo eigą su terminijos peržiūraRankiniai pokalbių raginimai puslapis po puslapio.

Jei renkatės tarp įrankių, žr. geriausių PDF vertėjų palyginimą. Jei failas yra skenuotas, eikite tiesiai į skenuotų PDF OCR vadovą.

Kodėl vertimo metu suyra PDF formatavimas

PDF failai nėra saugomi taip, kaip Word dokumentai. DOCX faile pastraipos, antraštės, sąrašai ir lentelės egzistuoja kaip redaguojamos struktūros. PDF labiau primena fiksuotą drobę. Tekstas puslapyje išdėstomas pagal konkrečias koordinates, dažnai smulkiais fragmentais. PDF gali atrodyti kaip įprastas dokumentas, tačiau viduje tai gali būti teksto blokų, šriftų nuorodų, vaizdų, kaukių ir koordinačių rinkinys.

Vertimas pakeičia teksto ilgį. Čia ir prasideda maketo problemos.

Iš šaltinio į tikslinę kalbąĮprastas poveikis maketui
Iš anglų į vokiečių ar ispanųTekstas dažnai pailgėja, todėl blokai persipildo.
Iš anglų į kinų ar japonųTekstas dažnai sutrumpėja, todėl atsiranda tuščių tarpų.
Iš anglų į arabų ar hebrajųRašymo kryptį ir lygiavimą reikia tvarkyti atskirai.
Bet kuri kalba su ilgais sudurtiniais terminaisAntraštės ir lentelės gali persipildyti.
Bet kuris skenuotas puslapisKol nepaleistas OCR, gali nebūti jokio teksto vertimui.

Gera PDF vertimo darbo eiga turi atlikti penkias užduotis:

  1. Aptikti skaitymo tvarką.
  2. Atskirti pagrindinį tekstą, puslapių antraštes, antraštes prie paveikslų, lenteles ir išnašas.
  3. Versti nuoseklius teksto blokus, o ne atsitiktinius fragmentus.
  4. Pritaikyti išverstą tekstą atgal į puslapį.
  5. Sugeneruoti peržiūrai tinkamą išvesties PDF.

Dauguma nesėkmingų darbo eigų atlieka tik vidurinį žingsnį: jos ištraukia tekstą ir jį išverčia. Todėl žodžiai gali būti teisingi, bet pats dokumentas tampa nebetinkamas naudoti.

1 metodas: naudokite specializuotą PDF vertėją

Geriausiai tinka: ilgiems PDF, klientų dokumentams, ataskaitoms, knygoms, instrukcijoms ir moksliniams dokumentams.

Tai patikimiausias atspirties taškas, kai svarbus formatavimas. Specializuotas PDF vertėjas sukurtas spręsti dokumento problematiką: skaitymo tvarką, maketo išlaikymą, puslapio struktūrą ir rezultatų peržiūrą.

Naudokite šią darbo eigą:

  1. Atidarykite PDF ir įsitikinkite, kad galite pažymėti tekstą.
  2. Įkelkite failą į PDF vertėją.
  3. Pasirinkite šaltinio ir tikslinę kalbas.
  4. Išverskite dokumentą.
  5. Palyginkite rezultatą su originalu puslapiuose, kuriuose yra lentelių, antraščių, antraščių prie paveikslų, išnašų ir iliustracijų.
  6. Atlikite galutinę žmogaus peržiūrą, jei dokumentas yra teisinis, medicininis, finansinis, akademinis ar skirtas publikavimui.

Ką šis metodas išsaugo geriausiai:

  • Puslapio struktūrą
  • Pastraipų grupavimą
  • Antraštes
  • Vaizdus
  • Antraštes prie paveikslų
  • Lenteles, jei jos nėra pernelyg suskaidytos
  • Skaitymo tvarką įprastuose kelių skilčių maketuose

Ką vis tiek reikia patikrinti:

  • Tankias lenteles
  • Labai smulkias išnašas
  • Formules
  • Ranka rašytas pastabas
  • Labai siaurus teksto laukelius
  • Prastos kokybės įterptus šriftus
  • OCR klaidas skenuotuose failuose

Jei prieš pasirinkdami norite palyginti įrankius, žr. mūsų PDF vertimo įrankių palyginimą.

2 metodas: naudokite „Google Translate“ greitam supratimui

Geriausiai tinka: trumpiems PDF, kai maketas nesvarbus.

„Google Translate“ naudinga, kai jums tereikia suprasti, kas parašyta dokumente. Tai nėra saugiausia darbo eiga, kai jums reikia užbaigto išversto PDF.

Įprasta darbo eiga:

  1. Atidarykite „Google Translate“.
  2. Pasirinkite dokumento įkėlimo parinktį.
  3. Įkelkite PDF.
  4. Pasirinkite šaltinio ir tikslinę kalbas.
  5. Išverskite ir peržiūrėkite rezultatą.

Kur tai veikia:

  • Trumpi paprasto teksto PDF
  • Asmeniniam skaitymui
  • Greitam supratimui
  • Paprastoms pažymoms ar laiškams

Kur tai neveikia:

  • Kelių skilčių ataskaitos
  • Lentelės
  • Iliustracijos ir jų antraštės
  • Skenuoti PDF be OCR
  • Failai, kuriuose svarbus puslapio maketas
  • Dokumentai, kuriuose per daugelį puslapių reikia nuoseklios terminijos

Jei konkrečiai bandote naudoti „Google“, perskaitykite visą „Google Translate“ PDF vadovą. Jame paaiškinamas internetinis metodas, „Google Docs“ apeinamasis sprendimas ir požymiai, pagal kuriuos galima spręsti, ar rezultatu verta pasitikėti.

3 metodas: naudokite ChatGPT tekstui, o ne galutiniam PDF maketui

Geriausiai tinka: trumpoms ištraukoms, terminų žodynėliui, tono valdymui ir vertimo peržiūrai.

ChatGPT gali padėti versti PDF turinį, kai jis gali pasiekti tekstą. Jis ypač naudingas tada, kai klausimas yra ne tik „kas čia parašyta?“, bet ir „kaip tai turėtų skambėti tiksline kalba?“

Geri ChatGPT naudojimo atvejai:

  • Išversti sudėtingą pastraipą.
  • Pritaikyti toną konkrečiai auditorijai.
  • Sudaryti terminų žodynėlį prieš verčiant ilgą dokumentą.
  • Peržiūrėti vertimą ir pažymėti nerangias formuluotes.
  • Paaiškinti techninę ištrauką kita kalba.

Blogi ChatGPT naudojimo atvejai:

  • Atkurti visą PDF maketą.
  • Versti ilgą knygą puslapis po puslapio.
  • Išsaugoti lenteles, antraštes prie paveikslų ir puslapių numerius.
  • Tvarkyti skenuotus PDF be patikimo OCR žingsnio.
  • Sukurti galutinį failą, kuriuo būtų galima dalytis be rankinės peržiūros.

Trumpoms ištraukoms naudokite šį raginimą:

Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].

Jei reikia pilnos ChatGPT darbo eigos ir raginimų, žr. ChatGPT PDF vertimo vadovą.

4 metodas: pirmiausia konvertuokite PDF į DOCX

Geriausiai tinka: dokumentams, kuriuos planuojate redaguoti arba atkurti rankiniu būdu.

PDF konvertavimas į DOCX gali padėti, kai jums reikia redaguojamo teksto. Tačiau tai nebūtinai yra geresnis pasirinkimas formatavimui išsaugoti. Tiesą sakant, būtent konvertavimo žingsnyje maketas dažnai ir nukenčia.

Konvertavimą naudokite, kai:

  • Reikia smarkiai redaguoti išverstą tekstą.
  • Galutinį maketą planuojate atkurti rankiniu būdu.
  • PDF yra paprastas ir daugiausia sudarytas iš teksto.
  • Reikia darbinio juodraščio, o ne užbaigto PDF.

Venkite konvertavimo, kai:

  • Originaliame PDF yra sudėtingų lentelių.
  • Dokumentas turi dviejų skilčių mokslinį maketą.
  • Faile daug antraščių prie paveikslų, išnašų ar šoninių blokų.
  • Galutinis rezultatas turi atitikti originalą puslapis po puslapio.

Prieš konvertuodami visą dokumentą, išbandykite vieną sudėtingą puslapį. Jei DOCX konvertavimas sugadina tą puslapį, išverstas rezultatas paveldės tą pačią žalą.

5 metodas: skenuotiems PDF pirmiausia atlikite OCR

Geriausiai tinka: fotokopijoms, PDF, sudarytiems tik iš vaizdų, senoms knygoms, skenuotoms sutartims ir telefonu nuskenuotiems dokumentams.

Skenuotame PDF yra teksto nuotraukos, o ne pats tekstas. Vertimo įrankiai negali patikimai versti pikselių. Jiems pirmiausia reikia OCR, kad būtų sukurtas teksto sluoksnis.

Naudokite šią darbo eigą:

  1. Pabandykite PDF faile pažymėti tekstą.
  2. Jei to padaryti nepavyksta, paleiskite OCR.
  3. Pasirinkite tinkamą OCR kalbą.
  4. Peržiūrėkite ištrauktą tekstą.
  5. Išverskite OCR apdorotą PDF.
  6. Patikrinkite OCR jautrias vietas: skaičius, vardus, lenteles, išnašas ir mažo kontrasto tekstą.

Dažna klaida yra praleisti 4 žingsnį. OCR klaidos tampa vertimo klaidomis. Jei OCR perskaito „rn“ kaip „m“ arba „0“ kaip „O“, vertėjas ištikimai išvers neteisingą įvestį.

Jei reikia visos OCR darbo eigos, žr. skenuotų PDF vertimo vadovą.

Svarbios patikros prieš ir po

Nebūtina kiekvieną puslapį tikrinti vienodu detalumo lygiu. Pasirinkite puslapius, kurie greičiausiai sugrius.

Puslapio elementasKą palyginti po vertimoNesėkmės požymis
Titulinis puslapisPavadinimą, paantraštę, autorių vardus, tarpusTekstas persidengia arba pasikeičia vardai.
TurinysAntraštes, numeraciją, nuorodas į puslapiusTrūksta nuorodų arba numerių.
Dviejų skilčių skyriusSkaitymo tvarką ir skilčių ribasKairė ir dešinė skiltys susilieja.
LentelėEilučių pavadinimus, skaičius, vienetus, išnašasLangeliai pasislenka arba dingsta eilučių lūžiai.
Paveikslo antraštėAr antraštė lieka prie vaizdoAntraštės persikelia prie netinkamo paveikslo.
IšnašaŽymeklius ir ar jie atitinka išnašos tekstąIšnaša tampa pagrindiniu tekstu.
CitataAutorių pavardes, metus, skliaustusCitatos skyryba pakinta neteisingai.
Formulių puslapisFormulė nepaliesta, aplinkinis tekstas išverstasFormulė pakeičiama arba klaidingai perrašoma.

Moksliniams dokumentams taip pat perskaitykite mūsų mokslinių tyrimų straipsnių vertimo vadovą, kuriame didžiausia rizika kyla dėl formulių, citatų ir dviejų skilčių maketų.

Maketo išsaugojimo kontrolinis sąrašas

Naudokite šį sąrašą prieš įkeldami failą ir po atsisiuntimo:

  • Ar šaltinio PDF faile galima pažymėti tekstą?
  • Ar failas yra skenuotas, skaitmeninis PDF, ar PDF, kuriame tekstas uždėtas ant vaizdo?
  • Ar yra lentelių su sujungtais langeliais?
  • Ar yra dviejų skilčių skyrių?
  • Ar antraštės susietos su vaizdais?
  • Ar puslapių antraštės ir poraštės yra prasminės, ar tik dekoratyvios?
  • Ar yra ranka rašytų pastabų ar antspaudų?
  • Ar yra formulių, citatų ar kodo blokų?
  • Ar tikslinė kalba reikšmingai pailgina arba sutrumpina tekstą?
  • Ar rezultatą reikia dalytis kaip užbaigtu PDF?

Jei atsakymas į paskutinį klausimą yra taip, nesikliaukite paprasta paprasto teksto vertimo darbo eiga.

Dažnos problemos ir jų sprendimai

ProblemaKodėl taip nutinkaSprendimas
Skiltys susilieja į vieną pastraipąĮrankis skaito pagal koordinates, o ne loginę tvarkąNaudokite PDF vertėją arba išbandykite geresnę ištraukimo darbo eigą.
Lentelės virsta paprastu tekstuNeaptinkamos lentelės ribosPeržiūrėkite lenteles rankiniu būdu arba atkurkite svarbiausias.
Skenuoti puslapiai lieka neišverstiPDF neturi teksto sluoksnioPirmiausia paleiskite OCR.
Tekstas persidengiaTikslinės kalbos tekstas netelpa į pradinę erdvęNaudokite įrankį, kuris tvarko maketą, tada patikrinkite ankštas vietas.
Antraštės pasislenkaVaizdas ir jo antraštė nėra laikomi vienu vienetuRankiniu būdu patikrinkite puslapius su iliustracijomis.
Išnašos tampa pagrindiniu tekstuIštraukimo žingsnyje prarandama hierarchijaPeržiūrėkite puslapius su išnašomis ir citatas.
Pasikeičia vardai ar skaičiaiVertimo modelis juos traktuoja kaip įprastą tekstąPridėkite terminų žodynėlį arba peržiūrėkite didelės rizikos elementus.
Rezultatas atrodo teisingas, bet prasmė netiksliMaketas išliko, kalba neSvarbiems skyriams atlikite dvikalbę peržiūrą.

Daugumai naudotojų rekomenduojama darbo eiga

  1. Patikrinkite, ar PDF faile galima pažymėti tekstą.
  2. Jei jis skenuotas, paleiskite OCR ir peržiūrėkite teksto sluoksnį.
  3. Įkelkite PDF į PDF vertėją.
  4. Išverskite visą dokumentą.
  5. Pirmiausia peržiūrėkite sudėtingiausius puslapius: lenteles, skiltis, iliustracijas, išnašas ir citatas.
  6. Formuluotėms tikrinti naudokite ChatGPT arba žmogaus peržiūrą, bet ne kaip maketo variklį.
  7. Laikykite originalų PDF, išverstą PDF ir visus terminų žodynėlius kartu būsimam atnaujinimui.

Šioje darbo eigoje kiekvienas įrankis atlieka savo vaidmenį: OCR perskaito skenus, PDF vertimas išsaugo dokumento struktūrą, o žmogaus arba LLM peržiūra pagerina kalbą.

DUK

Koks yra geriausias būdas išversti PDF neprarandant formatavimo?

PDF failams, kuriuose tekstą galima pažymėti, naudokite specializuotą PDF vertėją. Jei PDF yra skenuotas, pirmiausia paleiskite OCR, tada verskite OCR apdorotą PDF. Pradėkite nuo PDF vertėjo, jei jums reikia, kad galutinis failas liktų suformatuotas PDF.

Kodėl išvertus PDF suyra formatavimas?

PDF failai saugo tekstą fiksuotame puslapyje, dažnai kaip išdėstytus fragmentus, o ne kaip redaguojamas pastraipas. Vertimas pakeičia teksto ilgį, todėl įrankis turi iš naujo atkurti puslapio maketą. Paprasti vertėjai paprastai tik ištraukia ir išverčia tekstą, bet maketo gerai neatkuria.

Ar „Google Translate“ gali išsaugoti PDF maketą?

Jis gali būti naudingas greitam supratimui, tačiau nėra patikimas, jei reikia išsaugoti galutinį maketą. Lentelės, skiltys, vaizdai, antraštės prie paveikslų ir skenuoti puslapiai yra dažniausi nesėkmės taškai. Jei vis tiek norite išbandyti šią darbo eigą, žr. „Google Translate“ PDF vadovą.

Ar ChatGPT gali išversti PDF ir išlaikyti formatavimą?

ChatGPT gali versti arba pagerinti tekstą, tačiau jo nereikėtų laikyti PDF maketo išsaugojimo įrankiu. Naudokite jį trumpoms ištraukoms, terminų žodynėliams ir peržiūrai. Galutiniam dokumento maketui naudokite PDF vertėją.

Ką daryti su skenuotu PDF?

Pirmiausia paleiskite OCR. Tada prieš versdami peržiūrėkite ištrauktą tekstą. Skenuoti failai išsamiai aptariami skenuotų PDF vertimo vadove.

Ar prieš versdamas turėčiau konvertuoti PDF į Word?

Tik jei planuojate dokumentą redaguoti arba atkurti rankiniu būdu. Konvertavimas gali sugadinti puslapio maketą dar prieš prasidedant vertimui. Jei svarbu išsaugoti maketą, pirmiausia išbandykite PDF vertimo kelią.