書譯
書譯

如何在不破壞格式的情況下翻譯 PDF(2026 指南)

完整指南:在保留版面、表格、圖片與字型的同時翻譯 PDF。我們測試了各種方法與工具,找出真正可行的做法。

書譯團隊

翻譯指南18 min read

快速答案:為你的 PDF 選對工作流程

若要在不破壞格式的情況下翻譯 PDF,先確認 PDF 是否有可選取的文字。若有,請使用專門的 PDF 翻譯工具,例如 書譯 PDF 翻譯器。若沒有,先執行 OCR,再翻譯經過 OCR 處理的 PDF。如果你需要最終文件保留欄位、表格、圖片、圖說、頁首、頁尾與頁面順序,就不要把文字複製貼上到通用翻譯器中。

以下是實用的決策表:

PDF 類型最穩妥的工作流程要避免的做法
可選取文字的 PDF上傳到 PDF 翻譯器,再檢查版面把文字複製貼上到文字框。
掃描版 PDF先做 OCR,再翻譯把只有影像的頁面上傳到純文字翻譯器。
學術論文使用 PDF 翻譯器,之後檢查公式、引用、表格與圖不加檢查就直接轉成 DOCX。
簡單的單頁 PDF如果不在意版面,Google 翻譯可能就夠用以為輸出結果已可直接交付。
長篇書籍 PDF使用包含術語審校的文件工作流程逐頁手動用聊天提示詞處理。

如果你正在比較工具,請參考 最佳 PDF 翻譯器比較。如果你的檔案是掃描件,請直接前往 掃描版 PDF OCR 指南

為什麼 PDF 在翻譯時容易壞掉排版

PDF 的儲存方式和 Word 文件不同。DOCX 檔會把段落、標題、清單與表格保存為可編輯結構。PDF 更像是一塊固定畫布。文字會以特定座標放在頁面上,而且通常會被拆成很多小片段。PDF 看起來像一般文件,但在內部,它可能只是一組文字區塊、字型參照、圖片、遮罩與座標。

翻譯會改變文字長度,排版問題也就從這裡開始。

從來源語言到目標語言常見版面影響
英文到德文或西班牙文文字通常會變長,因此框線容易溢出。
英文到中文或日文文字通常會縮短,因此容易出現大片留白。
英文到阿拉伯文或希伯來文書寫方向與對齊需要特殊處理。
任何含長複合詞的語言標題與表格可能會溢出。
任何掃描頁面在執行 OCR 之前,可能根本沒有可翻譯的文字。

一套好的 PDF 翻譯流程必須完成五件事:

  1. 偵測閱讀順序。
  2. 區分正文、頁首、圖說、表格與註腳。
  3. 翻譯連貫的文字區塊,而不是零碎片段。
  4. 把翻譯後的文字重新放回頁面中。
  5. 產出一份可供審閱、可用的 PDF。

大多數失敗的流程只做了中間那一步:擷取文字並翻譯。這就是為什麼字句可能沒錯,但整份文件卻變得無法使用。

方法 1:使用專門的 PDF 翻譯器

最適合:長篇 PDF、客戶文件、報告、書籍、手冊與學術檔案。

當格式很重要時,這通常是最可靠的起點。專門的 PDF 翻譯器是圍繞文件本身的問題來設計的:閱讀順序、版面保留、頁面結構,以及輸出後的審查。

請使用以下流程:

  1. 打開 PDF,確認你可以選取文字。
  2. 將檔案上傳到 PDF 翻譯器
  3. 選擇來源語言與目標語言。
  4. 翻譯整份文件。
  5. 針對含有表格、標題、圖說、註腳與圖片的頁面,把輸出結果與原稿逐頁對照。
  6. 如果文件屬於法律、醫療、金融、學術或可出版內容,請做最後的人工作審校。

這種方法最能保留的內容:

  • 頁面結構
  • 段落分組
  • 標題
  • 圖片
  • 圖說
  • 不過度破碎的表格
  • 正常多欄版面的閱讀順序

仍然需要特別檢查的部分:

  • 密集表格
  • 很小的註腳
  • 公式
  • 手寫註記
  • 非常窄的文字框
  • 品質不佳的嵌入字型
  • 掃描檔中的 OCR 錯誤

如果你想先比較工具選項,再決定要用哪一個,請參考我們的 PDF 翻譯工具比較

方法 2:用 Google 翻譯快速理解內容

最適合:版面不重要的短篇 PDF。

當你只需要知道文件大意時,Google 翻譯很實用。但如果你需要一份完成品等級的翻譯 PDF,這不是最穩妥的流程。

常見流程如下:

  1. 打開 Google 翻譯。
  2. 選擇文件上傳選項。
  3. 上傳 PDF。
  4. 選擇來源語言與目標語言。
  5. 執行翻譯並檢查輸出結果。

適用情境:

  • 短篇純文字 PDF
  • 個人閱讀
  • 快速理解內容
  • 簡單備忘錄或信件

不適用情境:

  • 多欄報告
  • 表格
  • 圖與圖說
  • 未經 OCR 的掃描版 PDF
  • 頁面版面很重要的檔案
  • 需要跨很多頁維持術語一致的文件

如果你特別想用 Google,請閱讀完整的 Google 翻譯 PDF 指南。它說明了網頁版方法、Google Docs 的替代流程,以及在相信輸出結果前應先檢查的失敗徵兆。

方法 3:用 ChatGPT 處理文字,不要拿它做最終 PDF 排版

最適合:短段落、術語表工作、語氣控制與翻譯審校。

當 ChatGPT 能取得文字內容時,它可以幫助翻譯 PDF 內容。尤其當問題不只是「這寫了什麼?」而是「這段在目標語言裡應該怎麼表達?」時,它特別有用。

適合用 ChatGPT 的情境:

  • 翻譯困難段落。
  • 依特定受眾調整語氣。
  • 在翻譯長文件前先建立術語表。
  • 審查譯文並標出不自然的表達。
  • 用另一種語言解釋技術段落。

不適合用 ChatGPT 的情境:

  • 重建完整 PDF 版面。
  • 逐頁翻譯一本長書。
  • 保留表格、圖說與頁碼。
  • 在沒有可靠 OCR 步驟的情況下處理掃描版 PDF。
  • 產出一份不用人工審查就能直接分享的最終檔案。

短段落可使用這個提示詞:

Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].

如果你需要完整的 ChatGPT 工作流程與提示詞,請參考 ChatGPT PDF 翻譯指南

方法 4:先把 PDF 轉成 DOCX

最適合:你打算手動編輯或重建的文件。

當你需要可編輯文字時,把 PDF 轉成 DOCX 會有幫助。但這不會自動帶來更好的格式保留效果。事實上,版面損壞往往就發生在轉換這一步。

適合先轉換的情況:

  • 你需要大幅編修譯文。
  • 你打算手動重建最終版面。
  • PDF 很簡單,而且主要都是文字。
  • 你需要的是工作草稿,而不是成品 PDF。

不適合先轉換的情況:

  • 原始 PDF 有複雜表格。
  • 文件是雙欄學術版面。
  • 檔案裡有大量圖說、註腳或側欄。
  • 最終輸出必須逐頁對齊原稿。

在轉換整份文件之前,先測試一頁最困難的頁面。如果 DOCX 轉換在那一頁就已經壞掉,後續的翻譯輸出也會繼承同樣的損傷。

方法 5:掃描版 PDF 先做 OCR

最適合:影印件、純影像 PDF、舊書、掃描合約,以及手機掃描文件。

掃描版 PDF 裡裝的是文字圖片,不是文字。翻譯工具無法可靠地翻譯像素,它們必須先透過 OCR 建立文字層。

請使用以下流程:

  1. 先嘗試在 PDF 中選取文字。
  2. 如果無法選取,就先執行 OCR。
  3. 為 OCR 選擇正確的語言。
  4. 檢查擷取出的文字。
  5. 翻譯經過 OCR 處理的 PDF。
  6. 檢查對 OCR 特別敏感的區域:數字、人名、表格、註腳,以及低對比文字。

常見錯誤是跳過第 4 步。OCR 錯誤會直接變成翻譯錯誤。如果 OCR 把「rn」讀成「m」,或把「0」讀成「O」,翻譯器就會忠實地翻譯錯誤的輸入。

完整的 OCR 流程請參考 翻譯掃描版 PDF 指南。

真正重要的前後比對項目

你不需要用同樣細的程度檢查每一頁。挑最可能出問題的頁面檢查即可。

頁面元素翻譯後要比對的內容失敗徵兆
封面頁標題、副標題、作者姓名、間距文字重疊或姓名被改掉。
目錄標題、編號、頁碼對應連結或頁碼缺失。
雙欄區段閱讀順序與欄位邊界左右兩欄混在一起。
表格列標籤、數字、單位、註腳儲存格錯位或換行消失。
圖說圖說是否仍跟著圖片圖說跑到錯的圖片。
註腳標記與註腳文字是否對得上註腳變成正文。
引用作者姓名、年份、括號引用標點被錯誤更動。
公式頁公式保持不變、周邊文字已翻譯公式被改動或重打錯誤。

對學術文件,也請閱讀我們的 翻譯學術研究論文 指南,其中公式、引用與雙欄版面是主要風險。

版面保留檢查清單

上傳前與下載後都請用這份清單檢查:

  • 你能在來源 PDF 中選取文字嗎?
  • 這個檔案是掃描件、數位 PDF,還是文字覆蓋在影像上的 PDF?
  • 是否有合併儲存格的表格?
  • 是否有雙欄區段?
  • 圖說是否與圖片綁定?
  • 頁首與頁尾是資訊性的,還是裝飾性的?
  • 是否有手寫註記或印章?
  • 是否有公式、引用或程式碼區塊?
  • 目標語言的文字長度會明顯膨脹或縮短嗎?
  • 輸出是否需要作為成品 PDF 對外分享?

如果最後一題的答案是是,就不要依賴純文字翻譯流程。

常見失敗模式與修正方式

問題發生原因修正方式
多欄內容合併成單一段落工具是按座標讀取,而不是按邏輯順序使用 PDF 翻譯器,或測試更好的文字擷取流程。
表格變成純文字沒有偵測到表格邊界手動檢查表格,或重建關鍵表格。
掃描頁面仍未翻譯PDF 沒有文字層先做 OCR。
文字重疊目標語言長度超出原始空間使用能處理版面的工具,然後檢查狹窄區域。
圖說移位圖片與圖說沒有被視為同一個單元手動檢查含圖頁面。
註腳變成正文擷取步驟丟失層級結構檢查註腳頁與引用。
名稱或數字被改動翻譯模型把它們當成一般文字加入術語表,或審查高風險實體。
輸出看起來沒問題,但意思不對版面保住了,語言品質卻沒有對重要段落做雙語審校。

大多數使用者的推薦流程

  1. 先確認 PDF 是否可選取文字。
  2. 如果是掃描件,先做 OCR 並檢查文字層。
  3. 將 PDF 上傳到 PDF 翻譯器
  4. 翻譯整份文件。
  5. 先檢查最困難的頁面:表格、欄位、圖片、註腳與引用。
  6. 用 ChatGPT 或人工審校做文字潤飾與核對,不要把它當成版面引擎。
  7. 把原始 PDF、翻譯後的 PDF,以及任何術語表一起保存,以便後續更新。

這個流程讓每種工具各司其職:OCR 負責讀取掃描件,PDF 翻譯負責保留文件結構,而人工或 LLM 審校則負責提升語言品質。

常見問題

在不破壞格式的情況下翻譯 PDF,最好的方法是什麼?

對可選取文字的 PDF,請使用專門的 PDF 翻譯器。如果 PDF 是掃描件,先做 OCR,再翻譯經過 OCR 處理的 PDF。如果你需要最終檔案仍是一份排版完整的 PDF,請先從 PDF 翻譯器 開始。

為什麼我一翻譯 PDF,格式就壞掉?

PDF 會把文字存放在固定頁面上,而且常常是以定位片段的形式存在,而不是可編輯段落。翻譯會改變文字長度,工具就必須重新建構頁面版面。基礎翻譯器通常只會擷取並翻譯文字,卻無法把版面重建好。

Google 翻譯可以保留 PDF 版面嗎?

如果你只是想快速理解內容,它很有幫助;但若要保留最終版面,它並不可靠。表格、欄位、圖片、圖說與掃描頁面,都是常見失敗點。如果你還是想試這條流程,請參考 Google 翻譯 PDF 指南

ChatGPT 可以翻譯 PDF 並保留格式嗎?

ChatGPT 可以翻譯或改善文字,但不應被當成 PDF 版面保留工具。它適合用來處理短段落、術語表與審校;最終文件版面則應交給 PDF 翻譯器處理。

掃描版 PDF 該怎麼處理?

先做 OCR。然後在翻譯前先檢查擷取出的文字。掃描檔的完整流程可參考 掃描版 PDF 翻譯指南

翻譯前,我應該先把 PDF 轉成 Word 嗎?

只有在你打算手動編輯或重建文件時才這麼做。轉換可能會在翻譯開始前就破壞頁面版面。若要保留版面,請先測試直接翻譯 PDF 這條路線。