如何在不破壞格式的情況下翻譯 PDF(2026 指南)
完整指南:在保留版面、表格、圖片與字型的同時翻譯 PDF。我們測試了各種方法與工具,找出真正可行的做法。
快速答案:為你的 PDF 選對工作流程
若要在不破壞格式的情況下翻譯 PDF,先確認 PDF 是否有可選取的文字。若有,請使用專門的 PDF 翻譯工具,例如 書譯 PDF 翻譯器。若沒有,先執行 OCR,再翻譯經過 OCR 處理的 PDF。如果你需要最終文件保留欄位、表格、圖片、圖說、頁首、頁尾與頁面順序,就不要把文字複製貼上到通用翻譯器中。
以下是實用的決策表:
| PDF 類型 | 最穩妥的工作流程 | 要避免的做法 |
|---|---|---|
| 可選取文字的 PDF | 上傳到 PDF 翻譯器,再檢查版面 | 把文字複製貼上到文字框。 |
| 掃描版 PDF | 先做 OCR,再翻譯 | 把只有影像的頁面上傳到純文字翻譯器。 |
| 學術論文 | 使用 PDF 翻譯器,之後檢查公式、引用、表格與圖 | 不加檢查就直接轉成 DOCX。 |
| 簡單的單頁 PDF | 如果不在意版面,Google 翻譯可能就夠用 | 以為輸出結果已可直接交付。 |
| 長篇書籍 PDF | 使用包含術語審校的文件工作流程 | 逐頁手動用聊天提示詞處理。 |
如果你正在比較工具,請參考 最佳 PDF 翻譯器比較。如果你的檔案是掃描件,請直接前往 掃描版 PDF OCR 指南。
為什麼 PDF 在翻譯時容易壞掉排版
PDF 的儲存方式和 Word 文件不同。DOCX 檔會把段落、標題、清單與表格保存為可編輯結構。PDF 更像是一塊固定畫布。文字會以特定座標放在頁面上,而且通常會被拆成很多小片段。PDF 看起來像一般文件,但在內部,它可能只是一組文字區塊、字型參照、圖片、遮罩與座標。
翻譯會改變文字長度,排版問題也就從這裡開始。
| 從來源語言到目標語言 | 常見版面影響 |
|---|---|
| 英文到德文或西班牙文 | 文字通常會變長,因此框線容易溢出。 |
| 英文到中文或日文 | 文字通常會縮短,因此容易出現大片留白。 |
| 英文到阿拉伯文或希伯來文 | 書寫方向與對齊需要特殊處理。 |
| 任何含長複合詞的語言 | 標題與表格可能會溢出。 |
| 任何掃描頁面 | 在執行 OCR 之前,可能根本沒有可翻譯的文字。 |
一套好的 PDF 翻譯流程必須完成五件事:
- 偵測閱讀順序。
- 區分正文、頁首、圖說、表格與註腳。
- 翻譯連貫的文字區塊,而不是零碎片段。
- 把翻譯後的文字重新放回頁面中。
- 產出一份可供審閱、可用的 PDF。
大多數失敗的流程只做了中間那一步:擷取文字並翻譯。這就是為什麼字句可能沒錯,但整份文件卻變得無法使用。
方法 1:使用專門的 PDF 翻譯器
最適合:長篇 PDF、客戶文件、報告、書籍、手冊與學術檔案。
當格式很重要時,這通常是最可靠的起點。專門的 PDF 翻譯器是圍繞文件本身的問題來設計的:閱讀順序、版面保留、頁面結構,以及輸出後的審查。
請使用以下流程:
- 打開 PDF,確認你可以選取文字。
- 將檔案上傳到 PDF 翻譯器。
- 選擇來源語言與目標語言。
- 翻譯整份文件。
- 針對含有表格、標題、圖說、註腳與圖片的頁面,把輸出結果與原稿逐頁對照。
- 如果文件屬於法律、醫療、金融、學術或可出版內容,請做最後的人工作審校。
這種方法最能保留的內容:
- 頁面結構
- 段落分組
- 標題
- 圖片
- 圖說
- 不過度破碎的表格
- 正常多欄版面的閱讀順序
仍然需要特別檢查的部分:
- 密集表格
- 很小的註腳
- 公式
- 手寫註記
- 非常窄的文字框
- 品質不佳的嵌入字型
- 掃描檔中的 OCR 錯誤
如果你想先比較工具選項,再決定要用哪一個,請參考我們的 PDF 翻譯工具比較。
方法 2:用 Google 翻譯快速理解內容
最適合:版面不重要的短篇 PDF。
當你只需要知道文件大意時,Google 翻譯很實用。但如果你需要一份完成品等級的翻譯 PDF,這不是最穩妥的流程。
常見流程如下:
- 打開 Google 翻譯。
- 選擇文件上傳選項。
- 上傳 PDF。
- 選擇來源語言與目標語言。
- 執行翻譯並檢查輸出結果。
適用情境:
- 短篇純文字 PDF
- 個人閱讀
- 快速理解內容
- 簡單備忘錄或信件
不適用情境:
- 多欄報告
- 表格
- 圖與圖說
- 未經 OCR 的掃描版 PDF
- 頁面版面很重要的檔案
- 需要跨很多頁維持術語一致的文件
如果你特別想用 Google,請閱讀完整的 Google 翻譯 PDF 指南。它說明了網頁版方法、Google Docs 的替代流程,以及在相信輸出結果前應先檢查的失敗徵兆。
方法 3:用 ChatGPT 處理文字,不要拿它做最終 PDF 排版
最適合:短段落、術語表工作、語氣控制與翻譯審校。
當 ChatGPT 能取得文字內容時,它可以幫助翻譯 PDF 內容。尤其當問題不只是「這寫了什麼?」而是「這段在目標語言裡應該怎麼表達?」時,它特別有用。
適合用 ChatGPT 的情境:
- 翻譯困難段落。
- 依特定受眾調整語氣。
- 在翻譯長文件前先建立術語表。
- 審查譯文並標出不自然的表達。
- 用另一種語言解釋技術段落。
不適合用 ChatGPT 的情境:
- 重建完整 PDF 版面。
- 逐頁翻譯一本長書。
- 保留表格、圖說與頁碼。
- 在沒有可靠 OCR 步驟的情況下處理掃描版 PDF。
- 產出一份不用人工審查就能直接分享的最終檔案。
短段落可使用這個提示詞:
Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].
如果你需要完整的 ChatGPT 工作流程與提示詞,請參考 ChatGPT PDF 翻譯指南。
方法 4:先把 PDF 轉成 DOCX
最適合:你打算手動編輯或重建的文件。
當你需要可編輯文字時,把 PDF 轉成 DOCX 會有幫助。但這不會自動帶來更好的格式保留效果。事實上,版面損壞往往就發生在轉換這一步。
適合先轉換的情況:
- 你需要大幅編修譯文。
- 你打算手動重建最終版面。
- PDF 很簡單,而且主要都是文字。
- 你需要的是工作草稿,而不是成品 PDF。
不適合先轉換的情況:
- 原始 PDF 有複雜表格。
- 文件是雙欄學術版面。
- 檔案裡有大量圖說、註腳或側欄。
- 最終輸出必須逐頁對齊原稿。
在轉換整份文件之前,先測試一頁最困難的頁面。如果 DOCX 轉換在那一頁就已經壞掉,後續的翻譯輸出也會繼承同樣的損傷。
方法 5:掃描版 PDF 先做 OCR
最適合:影印件、純影像 PDF、舊書、掃描合約,以及手機掃描文件。
掃描版 PDF 裡裝的是文字圖片,不是文字。翻譯工具無法可靠地翻譯像素,它們必須先透過 OCR 建立文字層。
請使用以下流程:
- 先嘗試在 PDF 中選取文字。
- 如果無法選取,就先執行 OCR。
- 為 OCR 選擇正確的語言。
- 檢查擷取出的文字。
- 翻譯經過 OCR 處理的 PDF。
- 檢查對 OCR 特別敏感的區域:數字、人名、表格、註腳,以及低對比文字。
常見錯誤是跳過第 4 步。OCR 錯誤會直接變成翻譯錯誤。如果 OCR 把「rn」讀成「m」,或把「0」讀成「O」,翻譯器就會忠實地翻譯錯誤的輸入。
完整的 OCR 流程請參考 翻譯掃描版 PDF 指南。
真正重要的前後比對項目
你不需要用同樣細的程度檢查每一頁。挑最可能出問題的頁面檢查即可。
| 頁面元素 | 翻譯後要比對的內容 | 失敗徵兆 |
|---|---|---|
| 封面頁 | 標題、副標題、作者姓名、間距 | 文字重疊或姓名被改掉。 |
| 目錄 | 標題、編號、頁碼對應 | 連結或頁碼缺失。 |
| 雙欄區段 | 閱讀順序與欄位邊界 | 左右兩欄混在一起。 |
| 表格 | 列標籤、數字、單位、註腳 | 儲存格錯位或換行消失。 |
| 圖說 | 圖說是否仍跟著圖片 | 圖說跑到錯的圖片。 |
| 註腳 | 標記與註腳文字是否對得上 | 註腳變成正文。 |
| 引用 | 作者姓名、年份、括號 | 引用標點被錯誤更動。 |
| 公式頁 | 公式保持不變、周邊文字已翻譯 | 公式被改動或重打錯誤。 |
對學術文件,也請閱讀我們的 翻譯學術研究論文 指南,其中公式、引用與雙欄版面是主要風險。
版面保留檢查清單
上傳前與下載後都請用這份清單檢查:
- 你能在來源 PDF 中選取文字嗎?
- 這個檔案是掃描件、數位 PDF,還是文字覆蓋在影像上的 PDF?
- 是否有合併儲存格的表格?
- 是否有雙欄區段?
- 圖說是否與圖片綁定?
- 頁首與頁尾是資訊性的,還是裝飾性的?
- 是否有手寫註記或印章?
- 是否有公式、引用或程式碼區塊?
- 目標語言的文字長度會明顯膨脹或縮短嗎?
- 輸出是否需要作為成品 PDF 對外分享?
如果最後一題的答案是是,就不要依賴純文字翻譯流程。
常見失敗模式與修正方式
| 問題 | 發生原因 | 修正方式 |
|---|---|---|
| 多欄內容合併成單一段落 | 工具是按座標讀取,而不是按邏輯順序 | 使用 PDF 翻譯器,或測試更好的文字擷取流程。 |
| 表格變成純文字 | 沒有偵測到表格邊界 | 手動檢查表格,或重建關鍵表格。 |
| 掃描頁面仍未翻譯 | PDF 沒有文字層 | 先做 OCR。 |
| 文字重疊 | 目標語言長度超出原始空間 | 使用能處理版面的工具,然後檢查狹窄區域。 |
| 圖說移位 | 圖片與圖說沒有被視為同一個單元 | 手動檢查含圖頁面。 |
| 註腳變成正文 | 擷取步驟丟失層級結構 | 檢查註腳頁與引用。 |
| 名稱或數字被改動 | 翻譯模型把它們當成一般文字 | 加入術語表,或審查高風險實體。 |
| 輸出看起來沒問題,但意思不對 | 版面保住了,語言品質卻沒有 | 對重要段落做雙語審校。 |
大多數使用者的推薦流程
- 先確認 PDF 是否可選取文字。
- 如果是掃描件,先做 OCR 並檢查文字層。
- 將 PDF 上傳到 PDF 翻譯器。
- 翻譯整份文件。
- 先檢查最困難的頁面:表格、欄位、圖片、註腳與引用。
- 用 ChatGPT 或人工審校做文字潤飾與核對,不要把它當成版面引擎。
- 把原始 PDF、翻譯後的 PDF,以及任何術語表一起保存,以便後續更新。
這個流程讓每種工具各司其職:OCR 負責讀取掃描件,PDF 翻譯負責保留文件結構,而人工或 LLM 審校則負責提升語言品質。
常見問題
在不破壞格式的情況下翻譯 PDF,最好的方法是什麼?
對可選取文字的 PDF,請使用專門的 PDF 翻譯器。如果 PDF 是掃描件,先做 OCR,再翻譯經過 OCR 處理的 PDF。如果你需要最終檔案仍是一份排版完整的 PDF,請先從 PDF 翻譯器 開始。
為什麼我一翻譯 PDF,格式就壞掉?
PDF 會把文字存放在固定頁面上,而且常常是以定位片段的形式存在,而不是可編輯段落。翻譯會改變文字長度,工具就必須重新建構頁面版面。基礎翻譯器通常只會擷取並翻譯文字,卻無法把版面重建好。
Google 翻譯可以保留 PDF 版面嗎?
如果你只是想快速理解內容,它很有幫助;但若要保留最終版面,它並不可靠。表格、欄位、圖片、圖說與掃描頁面,都是常見失敗點。如果你還是想試這條流程,請參考 Google 翻譯 PDF 指南。
ChatGPT 可以翻譯 PDF 並保留格式嗎?
ChatGPT 可以翻譯或改善文字,但不應被當成 PDF 版面保留工具。它適合用來處理短段落、術語表與審校;最終文件版面則應交給 PDF 翻譯器處理。
掃描版 PDF 該怎麼處理?
先做 OCR。然後在翻譯前先檢查擷取出的文字。掃描檔的完整流程可參考 掃描版 PDF 翻譯指南。
翻譯前,我應該先把 PDF 轉成 Word 嗎?
只有在你打算手動編輯或重建文件時才這麼做。轉換可能會在翻譯開始前就破壞頁面版面。若要保留版面,請先測試直接翻譯 PDF 這條路線。