レイアウトを崩さずにPDFを翻訳する方法(2026年ガイド)
レイアウト、表、画像、フォントを維持したままPDFを翻訳するための完全ガイド。実際に使える方法を見つけるため、あらゆる手法とツールを検証しました。
結論:手元のPDFに合ったワークフローを使う
レイアウトを崩さずにPDFを翻訳したいなら、まずそのPDFでテキストを選択できるか確認してください。選択できる場合は、BookTranslator PDF Translator のような専用のPDF翻訳ツールを使います。選択できない場合は、先にOCRを実行してから、OCR処理済みのPDFを翻訳してください。最終文書で段組み、表、画像、キャプション、ヘッダー、フッター、ページ順を維持したいなら、テキストを汎用翻訳ツールにコピー&ペーストしないでください。
実務向けの判断表は次のとおりです。
| PDFの種類 | 最も安全なワークフロー | 避けるべきこと |
|---|---|---|
| テキスト選択可能なPDF | PDF Translator にアップロードし、その後レイアウトを確認 | テキストボックスへのコピー&ペースト |
| スキャンPDF | 先にOCR、その後に翻訳 | 画像だけのページをテキスト専用翻訳ツールに投入すること |
| 学術論文 | PDF翻訳ツールを使い、その後に数式、引用、表、図を確認 | むやみにDOCXへ変換すること |
| シンプルな1ページPDF | レイアウトが重要でなければ Google Translate で十分なこともある | 出力がそのまま提出・配布できると決めつけること |
| 書籍レベルの長文PDF | 用語確認を含むドキュメント向けワークフローを使う | ページごとの手動チャット指示 |
ツールを比較して選びたい場合は、おすすめPDF翻訳ツール比較 を参照してください。ファイルがスキャンPDFなら、スキャンPDF向けOCRガイド に直接進んでください。
翻訳時にPDFの書式が崩れる理由
PDFはWord文書のように保存されているわけではありません。DOCXファイルでは、段落、見出し、箇条書き、表が編集可能な構造として保持されています。一方、PDFは固定されたキャンバスに近い形式です。テキストはページ上の特定の座標に配置され、多くの場合は細かな断片に分かれています。見た目は普通の文書でも、内部ではテキストブロック、フォント参照、画像、マスク、座標の集合として扱われていることがあります。
翻訳すると文字数や文章の長さが変わります。そこでレイアウトが崩れます。
| 原文 → 翻訳先 | よくあるレイアウトへの影響 |
|---|---|
| 英語 → ドイツ語 / スペイン語 | 文字量が増えやすく、枠からあふれます |
| 英語 → 中国語 / 日本語 | 文字量が減りやすく、空白が目立ちます |
| 英語 → アラビア語 / ヘブライ語 | 文字方向と配置に特別な処理が必要です |
| 長い複合語が多い言語 | 見出しや表があふれやすくなります |
| スキャンされたページ全般 | OCRを実行するまで翻訳対象のテキストがない場合があります |
優れたPDF翻訳ワークフローは、次の5つをこなす必要があります。
- 読み順を検出する。
- 本文、ヘッダー、キャプション、表、脚注を切り分ける。
- バラバラの断片ではなく、まとまりのあるテキストブロック単位で翻訳する。
- 翻訳後のテキストをページ内に収め直す。
- レビューできる実用的な出力PDFを生成する。
失敗するワークフローの多くは、真ん中の工程しかやっていません。つまり、テキストを抽出して翻訳するだけです。そのため、言葉自体は正しくても、文書全体が使い物にならなくなります。
方法1:専用のPDF翻訳ツールを使う
向いているケース:長いPDF、クライアント向け文書、レポート、書籍、マニュアル、学術資料。
書式が重要なら、これが最も信頼しやすい出発点です。専用のPDF翻訳ツールは、読み順、レイアウト保持、ページ構造、出力確認といった、文書特有の問題を前提に設計されています。
手順は次のとおりです。
- PDFを開き、テキストを選択できることを確認する。
- ファイルを PDF Translator にアップロードする。
- 原文言語と翻訳先言語を選ぶ。
- 文書を翻訳する。
- 表、見出し、キャプション、脚注、図があるページで、出力を原文と見比べる。
- 法務・医療・金融・学術文書や公開用文書なら、最後に人のレビューを行う。
この方法で比較的保ちやすいもの:
- ページ構造
- 段落のまとまり
- 見出し
- 画像
- キャプション
- 過度に分断されていない表
- 一般的な多段レイアウトでの読み順
それでも確認が必要なもの:
- 密な表
- 極小の脚注
- 数式
- 手書き注釈
- 非常に細いテキストボックス
- 品質の低い埋め込みフォント
- スキャンファイルに含まれるOCRエラー
選ぶ前にツールの選択肢を比較したい場合は、PDF翻訳ツール比較 を参照してください。
方法2:Google Translateは内容の把握向けに使う
向いているケース:レイアウトが重要ではない短いPDF。
Google Translate は、文書に何が書かれているかを素早く把握したいときには便利です。ただし、完成形の翻訳済みPDFが必要な場合に最も安全な方法とは言えません。
一般的な手順:
- Google Translate を開く。
- 文書アップロードのオプションを選ぶ。
- PDFをアップロードする。
- 原文言語と翻訳先言語を選ぶ。
- 翻訳し、出力を確認する。
向いているケース:
- 短いプレーンテキストPDF
- 個人で読む用途
- 内容の迅速な把握
- シンプルなメモや手紙
破綻しやすいケース:
- 多段組みのレポート
- 表
- 図とキャプション
- OCRのないスキャンPDF
- ページレイアウトが重要なファイル
- 多ページにわたり用語の一貫性が必要な文書
Googleを使う前提で検討しているなら、Google TranslateでPDFを翻訳するガイド を読んでください。Web版の手順、Google Docsを使う回避策、そして出力を信用する前に確認すべき失敗サインを解説しています。
方法3:ChatGPTはテキスト向けであり、最終PDFレイアウト向けではない
向いているケース:短い抜粋、用語集作成、トーン調整、翻訳レビュー。
ChatGPTは、テキストにアクセスできるならPDFの内容翻訳に役立ちます。特に、「これは何と書いてあるのか」だけでなく、「翻訳先言語ではどういう言い回しにすべきか」が問題になる場面で有効です。
ChatGPTが向いている使い方:
- 難しい段落を翻訳する
- 特定の読者向けにトーンを調整する
- 長文翻訳の前に用語集を作る
- 翻訳を見直して不自然な表現を見つける
- 技術的な箇所を別の言語で説明させる
ChatGPTが向いていない使い方:
- PDF全体のレイアウトを再現すること
- 長い書籍をページごとに翻訳すること
- 表、キャプション、ページ番号を保持すること
- 信頼できるOCR工程なしでスキャンPDFを扱うこと
- 手動レビューなしで共有できる最終ファイルを作ること
短い抜粋には次のプロンプトを使えます。
Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].
ChatGPTを使った完全な手順とプロンプトについては、ChatGPTでPDFを翻訳するガイド を参照してください。
方法4:先にPDFをDOCXへ変換する
向いているケース:手動で編集または再構成する予定の文書。
PDFをDOCXに変換すると、編集可能なテキストが必要な場合には役立ちます。ただし、書式保持の面で自動的に有利になるわけではありません。むしろ、レイアウトの損傷はこの変換工程で起こることがよくあります。
変換を使うべきケース:
- 翻訳後のテキストを大幅に編集する必要がある
- 最終レイアウトを手動で組み直す予定がある
- PDFがシンプルで、ほとんどがテキストである
- 完成版ではなく、作業用ドラフトが必要である
変換を避けるべきケース:
- 元のPDFに複雑な表がある
- 文書が2段組みの学術レイアウトである
- キャプション、脚注、サイドバーが多い
- 最終出力をページ単位で原本に合わせる必要がある
文書全体を変換する前に、難しいページを1ページだけ試してください。そのページがDOCX変換で崩れるなら、翻訳後の出力もその損傷を引き継ぎます。
方法5:スキャンPDFは先にOCRをかける
向いているケース:コピー、画像のみのPDF、古い書籍、スキャンした契約書、スマホで撮影した文書。
スキャンPDFに入っているのはテキストではなく、テキストの画像です。翻訳ツールはピクセルを安定して翻訳できません。まずOCRでテキストレイヤーを作る必要があります。
手順は次のとおりです。
- PDFでテキスト選択を試す。
- 選択できない場合はOCRを実行する。
- 適切なOCR言語を選ぶ。
- 抽出されたテキストを確認する。
- OCR処理済みPDFを翻訳する。
- OCRの影響を受けやすい箇所、つまり数字、名前、表、脚注、低コントラストの文字を確認する。
よくあるミスは、手順4を飛ばすことです。OCRエラーはそのまま翻訳エラーになります。OCRが「rn」を「m」と誤読したり、「0」を「O」と誤読したりすると、翻訳ツールはその誤った入力をそのまま忠実に翻訳してしまいます。
OCRの完全な手順については、スキャンPDFを翻訳するガイド を参照してください。
翻訳前後で本当に確認すべきポイント
すべてのページを同じ粒度で確認する必要はありません。崩れやすいページを優先して見てください。
| ページ要素 | 翻訳後に比較するポイント | 不具合のサイン |
|---|---|---|
| タイトルページ | タイトル、副題、著者名、余白 | テキストが重なる、または名前が変わっている |
| 目次 | 見出し、番号、ページ参照 | リンクや番号が欠けている |
| 2段組みセクション | 読み順と段の境界 | 左右の段が混ざっている |
| 表 | 行ラベル、数字、単位、脚注 | セルがずれる、または改行が消える |
| 図のキャプション | キャプションが画像と一緒に保たれているか | キャプションが別の図に移っている |
| 脚注 | 脚注番号と脚注本文が対応しているか | 脚注が本文扱いになっている |
| 引用 | 著者名、年、括弧 | 引用の句読点が不正に変わっている |
| 数式ページ | 数式はそのまま、周囲のテキストだけが翻訳されているか | 数式が改変される、または誤って打ち直される |
学術文書であれば、学術研究論文を翻訳するガイド も確認してください。数式、引用、2段組みレイアウトが主なリスクになります。
レイアウト保持チェックリスト
アップロード前とダウンロード後に、このチェックリストを使ってください。
- 元のPDFでテキストを選択できますか?
- ファイルはスキャンPDF、デジタルPDF、それとも画像上にテキストが重なったPDFですか?
- 結合セルを含む表がありますか?
- 2段組みのセクションがありますか?
- キャプションは画像に紐づいていますか?
- ヘッダーとフッターは意味のある情報ですか、それとも装飾ですか?
- 手書きのメモやスタンプがありますか?
- 数式、引用、コードブロックがありますか?
- 翻訳先言語で文字量が大きく増減しますか?
- 出力は完成版PDFとして共有する必要がありますか?
最後の質問の答えが「はい」なら、プレーンテキスト翻訳のワークフローには頼らないでください。
よくある失敗パターンと対処法
| 失敗パターン | 起こる理由 | 対処法 |
|---|---|---|
| 段組みが1つの段落に潰れる | ツールが論理順ではなく座標順に読んでいる | PDF翻訳ツールを使うか、より良い抽出ワークフローを試す |
| 表がプレーンテキストになる | 表の境界が検出されていない | 表を手動で確認するか、重要な表は再作成する |
| スキャンページが翻訳されない | PDFにテキストレイヤーがない | 先にOCRを実行する |
| テキストが重なる | 翻訳先言語で文字量が増え、元のスペースを超えている | レイアウト対応のあるツールを使い、狭い箇所を重点確認する |
| キャプションが移動する | 画像とキャプションが1つの単位として扱われていない | 図のあるページを手動で確認する |
| 脚注が本文になる | 抽出工程で階層情報が失われている | 脚注ページと引用を確認する |
| 名前や数字が変わる | 翻訳モデルが通常のテキストとして扱ってしまう | 用語集を追加するか、高リスク要素を確認する |
| 見た目は正しいが意味がずれている | レイアウトは保てても、言語の品質が十分でない | 重要箇所は対訳レビューを行う |
多くの人におすすめのワークフロー
- PDFでテキストを選択できるか確認する。
- スキャンPDFならOCRを実行し、テキストレイヤーを確認する。
- PDFを PDF Translator にアップロードする。
- 文書全体を翻訳する。
- まず難しいページから確認する。表、段組み、図、脚注、引用を優先する。
- 表現確認にはChatGPTや人のレビューを使い、レイアウトエンジンとしては使わない。
- 将来の更新に備えて、元のPDF、翻訳済みPDF、用語集をまとめて保管する。
このワークフローなら、各ツールを正しい役割で使えます。OCRはスキャンを読み取り、PDF翻訳は文書構造を保ち、人やLLMのレビューは言語品質を高めます。
FAQ
書式を崩さずにPDFを翻訳する最善の方法は何ですか?
テキスト選択可能なPDFなら、専用のPDF翻訳ツールを使ってください。スキャンPDFなら、先にOCRを実行してから、OCR処理済みのPDFを翻訳します。完成版PDFとして仕上げたいなら、まずは PDF Translator を使うのが安全です。
なぜPDFは翻訳すると書式が崩れるのですか?
PDFは、編集可能な段落ではなく、固定ページ上の配置された断片としてテキストを保持していることが多いからです。翻訳すると文字量が変わるため、ツール側でページレイアウトを組み直す必要があります。基本的な翻訳ツールはテキストの抽出と翻訳はしても、レイアウトの再構成まではうまくできないことが多いです。
Google TranslateでPDFレイアウトを保持できますか?
内容を素早く把握するには便利ですが、完成版レイアウトの保持には信頼できません。表、段組み、画像、キャプション、スキャンページは特に失敗しやすい箇所です。それでも試したいなら、Google TranslateでPDFを翻訳するガイド を参照してください。
ChatGPTでPDFを翻訳し、書式も維持できますか?
ChatGPTはテキストの翻訳や改善には使えますが、PDFレイアウトを保持するツールとして扱うべきではありません。短い抜粋、用語集作成、レビューには使えます。最終文書のレイアウトにはPDF翻訳ツールを使ってください。
スキャンPDFはどうすればよいですか?
先にOCRを実行してください。その後、抽出されたテキストを確認してから翻訳します。スキャンファイルについては、スキャンPDF翻訳ガイド で詳しく解説しています。
翻訳前にPDFをWordへ変換すべきですか?
手動で編集または再構成する予定がある場合に限ります。変換によって、翻訳を始める前の段階でページレイアウトが壊れることがあります。レイアウト保持が目的なら、まずはPDF翻訳ルートを試してください。