BookTranslator
BookTranslator

چگونه یک PDF را بدون از دست دادن قالب‌بندی ترجمه کنیم (راهنمای 2026)

راهنمای کامل ترجمه PDF در حالی که چیدمان، جدول‌ها، تصاویر و فونت‌ها حفظ شوند. همه روش‌ها و ابزارها را آزمایش کردیم تا ببینیم چه چیزی واقعاً جواب می‌دهد.

BookTranslator

BookTranslator Team

راهنماهای ترجمه13 min read

پاسخ سریع: برای PDFی که دارید، جریان کار درست را انتخاب کنید

برای ترجمه PDF بدون از دست دادن قالب‌بندی، اول بررسی کنید آیا PDF متن قابل انتخاب دارد یا نه. اگر دارد، از یک مترجم PDF تخصصی مثل مترجم PDF BookTranslator استفاده کنید. اگر ندارد، اول OCR را اجرا کنید و بعد PDF پردازش‌شده با OCR را ترجمه کنید. اگر لازم است سند نهایی ستون‌ها، جدول‌ها، تصاویر، زیرنویس‌ها، سربرگ‌ها، پابرگ‌ها و ترتیب صفحات را حفظ کند، متن را در یک مترجم عمومی کپی و پیست نکنید.

این هم جدول تصمیم‌گیری کاربردی:

نوع PDFامن‌ترین جریان کارچه چیزی را نباید انجام دهید
PDF با متن قابل انتخابآپلود در مترجم PDF، سپس بازبینی چیدمانکپی‌پیست در یک کادر متنی.
PDF اسکن‌شدهاول OCR، بعد ترجمهآپلود صفحات فقط‌تصویری در یک مترجم فقط‌متنی.
مقاله علمیاز مترجم PDF استفاده کنید، بعد معادله‌ها، ارجاع‌ها، جدول‌ها و شکل‌ها را بررسی کنیدتبدیل بدون بررسی به DOCX.
PDF ساده یک‌صفحه‌ایاگر چیدمان مهم نیست، Google Translate می‌تواند کافی باشدفرض کردن اینکه خروجی آماده ارائه است.
PDF در حد یک کتاباز یک جریان کار سندمحور همراه با بازبینی اصطلاحات استفاده کنیدپرامپت‌های چت دستی صفحه‌به‌صفحه.

اگر بین ابزارها مردد هستید، از مقایسه بهترین ابزارهای ترجمه PDF استفاده کنید. اگر فایل شما اسکن‌شده است، مستقیم سراغ راهنمای OCR برای PDF اسکن‌شده بروید.

چرا قالب‌بندی PDF هنگام ترجمه به‌هم می‌ریزد

PDFها مثل اسناد Word ذخیره نمی‌شوند. یک فایل DOCX پاراگراف‌ها، عنوان‌ها، فهرست‌ها و جدول‌ها را به‌صورت ساختارهای قابل ویرایش نگه می‌دارد. PDF بیشتر شبیه یک بوم ثابت است. متن روی صفحه در مختصات مشخص قرار می‌گیرد و اغلب به قطعه‌های کوچک شکسته شده است. ممکن است PDF شبیه یک سند عادی به نظر برسد، اما درون آن می‌تواند مجموعه‌ای از بلوک‌های متن، ارجاع‌های فونت، تصاویر، ماسک‌ها و مختصات باشد.

ترجمه طول متن را تغییر می‌دهد. مشکل چیدمان دقیقاً از همین‌جا شروع می‌شود.

زبان مبدأ به مقصداثر رایج روی چیدمان
انگلیسی به آلمانی یا اسپانیاییمتن معمولاً بلندتر می‌شود و کادرها سرریز می‌کنند.
انگلیسی به چینی یا ژاپنیمتن معمولاً کوتاه‌تر می‌شود و فضای خالی ایجاد می‌شود.
انگلیسی به عربی یا عبریجهت نوشتار و تراز نیاز به رسیدگی ویژه دارد.
هر زبانی با ترکیب‌های واژه‌ای بلندعنوان‌ها و جدول‌ها ممکن است سرریز کنند.
هر صفحه اسکن‌شدهتا قبل از OCR ممکن است اصلاً متنی برای ترجمه وجود نداشته باشد.

یک جریان کار خوب برای ترجمه PDF باید پنج کار انجام دهد:

  1. تشخیص ترتیب خواندن.
  2. جدا کردن متن اصلی، سربرگ‌ها، زیرنویس‌ها، جدول‌ها و پانویس‌ها.
  3. ترجمه بلوک‌های منسجم متن، نه قطعه‌های تصادفی.
  4. جا دادن دوباره متن ترجمه‌شده داخل صفحه.
  5. رندر کردن یک PDF خروجی قابل استفاده برای بازبینی.

بیشتر جریان‌های کاری ناموفق فقط مرحله وسط را انجام می‌دهند: متن را استخراج می‌کنند و ترجمه‌اش می‌کنند. به همین دلیل ممکن است واژه‌ها درست باشند اما خود سند غیرقابل استفاده شود.

روش 1: از یک مترجم PDF تخصصی استفاده کنید

مناسب برای: PDFهای بلند، اسناد مشتری، گزارش‌ها، کتاب‌ها، راهنماها و فایل‌های علمی.

وقتی قالب‌بندی مهم است، این مطمئن‌ترین نقطه شروع است. یک مترجم PDF تخصصی برای خودِ مسئله سند طراحی شده است: ترتیب خواندن، حفظ چیدمان، ساختار صفحه و بازبینی خروجی.

از این جریان کار استفاده کنید:

  1. PDF را باز کنید و مطمئن شوید می‌توانید متن را انتخاب کنید.
  2. فایل را در مترجم PDF آپلود کنید.
  3. زبان مبدأ و مقصد را انتخاب کنید.
  4. سند را ترجمه کنید.
  5. خروجی را در صفحاتی که جدول، عنوان، زیرنویس، پانویس و شکل دارند با نسخه اصلی مقایسه کنید.
  6. اگر سند حقوقی، پزشکی، مالی، علمی یا قابل انتشار است، یک بازبینی انسانی نهایی انجام دهید.

این روش چه چیزهایی را بهتر از همه حفظ می‌کند:

  • ساختار صفحه
  • گروه‌بندی پاراگراف‌ها
  • عنوان‌ها
  • تصاویر
  • زیرنویس‌ها
  • جدول‌هایی که بیش از حد خرد نشده‌اند
  • ترتیب خواندن در چیدمان‌های معمول چندستونه

چه چیزهایی هنوز نیاز به بازبینی دارند:

  • جدول‌های متراکم
  • پانویس‌های خیلی ریز
  • معادله‌ها
  • یادداشت‌های دست‌نویس
  • کادرهای متنی خیلی باریک
  • فونت‌های تعبیه‌شده با کیفیت پایین
  • خطاهای OCR در فایل‌های اسکن‌شده

اگر قبل از انتخاب می‌خواهید گزینه‌های ابزار را مقایسه کنید، از مقایسه ابزارهای مترجم PDF استفاده کنید.

روش 2: از Google Translate برای درک سریع محتوا استفاده کنید

مناسب برای: PDFهای کوتاهی که چیدمان در آن‌ها مهم نیست.

Google Translate زمانی مفید است که فقط بخواهید بدانید سند چه می‌گوید. وقتی به یک PDF ترجمه‌شده نهایی نیاز دارید، امن‌ترین جریان کار نیست.

جریان کار معمول:

  1. Google Translate را باز کنید.
  2. گزینه آپلود سند را انتخاب کنید.
  3. PDF را آپلود کنید.
  4. زبان مبدأ و مقصد را انتخاب کنید.
  5. ترجمه را اجرا کنید و خروجی را بررسی کنید.

جاهایی که خوب جواب می‌دهد:

  • PDFهای کوتاه و ساده با متن معمولی
  • مطالعه شخصی
  • درک سریع محتوا
  • یادداشت‌ها یا نامه‌های ساده

جاهایی که خراب می‌شود:

  • گزارش‌های چندستونه
  • جدول‌ها
  • شکل‌ها و زیرنویس‌ها
  • PDFهای اسکن‌شده بدون OCR
  • فایل‌هایی که چیدمان صفحه در آن‌ها مهم است
  • اسنادی که در صفحات زیاد به اصطلاحات ثابت نیاز دارند

اگر مشخصاً می‌خواهید از Google استفاده کنید، راهنمای کامل ترجمه PDF با Google Translate را بخوانید. در آن، روش وب، راه‌حل جایگزین با Google Docs و نشانه‌های خرابی که باید قبل از اعتماد به خروجی بررسی کنید توضیح داده شده است.

روش 3: از ChatGPT برای متن استفاده کنید، نه برای چیدمان نهایی PDF

مناسب برای: بخش‌های کوتاه، کار روی واژه‌نامه، کنترل لحن و بازبینی ترجمه.

ChatGPT می‌تواند وقتی به متن دسترسی داشته باشد، در ترجمه محتوای PDF کمک کند. مخصوصاً زمانی مفید است که سؤال فقط این نباشد که «این چه می‌گوید؟» بلکه این باشد که «این در زبان مقصد باید چه لحنی داشته باشد؟»

موارد استفاده خوب از ChatGPT:

  • ترجمه یک پاراگراف دشوار
  • تطبیق لحن با یک مخاطب مشخص
  • ساخت واژه‌نامه قبل از ترجمه یک سند بلند
  • بازبینی ترجمه و مشخص کردن عبارت‌های نامأنوس
  • توضیح یک بخش فنی به زبانی دیگر

موارد استفاده بد از ChatGPT:

  • بازسازی چیدمان کامل یک PDF
  • ترجمه صفحه‌به‌صفحه یک کتاب بلند
  • حفظ جدول‌ها، زیرنویس‌ها و شماره صفحه‌ها
  • رسیدگی به PDFهای اسکن‌شده بدون یک مرحله OCR قابل اتکا
  • تولید یک فایل نهایی که بدون بازبینی دستی قابل اشتراک‌گذاری باشد

برای بخش‌های کوتاه از این پرامپت استفاده کنید:

Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].

برای یک جریان کار کامل با ChatGPT و پرامپت‌های مناسب، از راهنمای ترجمه PDF با ChatGPT استفاده کنید.

روش 4: اول PDF را به DOCX تبدیل کنید

مناسب برای: اسنادی که قصد دارید دستی ویرایش یا بازسازی‌شان کنید.

تبدیل PDF به DOCX وقتی به متن قابل ویرایش نیاز دارید می‌تواند کمک‌کننده باشد. اما برای قالب‌بندی، به‌طور خودکار بهتر نیست. در واقع، گاهی همان مرحله تبدیل جایی است که چیدمان آسیب می‌بیند.

از تبدیل استفاده کنید وقتی:

  • لازم است متن ترجمه‌شده را زیاد ویرایش کنید.
  • قصد دارید چیدمان نهایی را دستی بازسازی کنید.
  • PDF ساده و عمدتاً متنی است.
  • به یک پیش‌نویس کاری نیاز دارید، نه یک PDF نهایی.

از تبدیل پرهیز کنید وقتی:

  • PDF اصلی جدول‌های پیچیده دارد.
  • سند چیدمان علمی دوستونه دارد.
  • فایل از زیرنویس‌ها، پانویس‌ها یا سایدبارهای زیادی استفاده می‌کند.
  • خروجی نهایی باید صفحه‌به‌صفحه با نسخه اصلی منطبق باشد.

قبل از تبدیل کل سند، یک صفحه دشوار را آزمایش کنید. اگر تبدیل DOCX آن صفحه را خراب کند، خروجی ترجمه‌شده هم همان آسیب را به ارث می‌برد.

روش 5: برای PDFهای اسکن‌شده، اول OCR

مناسب برای: کپی‌ها، PDFهای فقط‌تصویری، کتاب‌های قدیمی، قراردادهای اسکن‌شده و اسنادی که با گوشی اسکن شده‌اند.

یک PDF اسکن‌شده حاوی تصویرِ متن است، نه خودِ متن. ابزارهای ترجمه نمی‌توانند پیکسل‌ها را به‌طور قابل اعتماد ترجمه کنند. آن‌ها اول به OCR نیاز دارند تا یک لایه متنی بسازند.

از این جریان کار استفاده کنید:

  1. در PDF سعی کنید متن را انتخاب کنید.
  2. اگر انتخاب ممکن نیست، OCR را اجرا کنید.
  3. زبان درست برای OCR را انتخاب کنید.
  4. متن استخراج‌شده را بازبینی کنید.
  5. PDF پردازش‌شده با OCR را ترجمه کنید.
  6. بخش‌های حساس به OCR را بررسی کنید: اعداد، نام‌ها، جدول‌ها، پانویس‌ها و متن با کنتراست پایین.

اشتباه رایج، رد شدن از مرحله 4 است. خطاهای OCR به خطاهای ترجمه تبدیل می‌شوند. اگر OCR «rn» را «m» بخواند یا «0» را «O»، مترجم هم همان ورودی اشتباه را با دقت ترجمه می‌کند.

برای جریان کار کامل OCR، از راهنمای ترجمه PDFهای اسکن‌شده استفاده کنید.

بررسی‌های قبل و بعدی که واقعاً مهم‌اند

لازم نیست همه صفحات را با یک سطح از جزئیات بررسی کنید. صفحاتی را انتخاب کنید که بیشترین احتمال خرابی را دارند.

جزء صفحهبعد از ترجمه چه چیزی را مقایسه کنیدنشانه خرابی
صفحه عنوانعنوان، زیرعنوان، نام نویسندگان، فاصله‌گذاریمتن روی هم می‌افتد یا نام‌ها تغییر می‌کنند.
فهرست مطالبعنوان‌ها، شماره‌گذاری، ارجاع‌های صفحهلینک‌ها یا شماره‌ها حذف می‌شوند.
بخش دوستونهترتیب خواندن و مرز ستون‌هاستون‌های چپ و راست در هم ادغام می‌شوند.
جدولبرچسب سطرها، اعداد، واحدها، پانویس‌هاسلول‌ها جابه‌جا می‌شوند یا شکست خط‌ها حذف می‌شود.
زیرنویس شکلزیرنویس همراه تصویر باقی بماندزیرنویس به شکل اشتباه منتقل می‌شود.
پانویسعلامت‌ها و متن پانویس با هم منطبق باشندپانویس به متن اصلی تبدیل می‌شود.
ارجاعنام نویسندگان، سال‌ها، کروشه‌هانشانه‌گذاری ارجاع اشتباه تغییر می‌کند.
صفحه معادلهخود معادله دست‌نخورده بماند و متن اطراف ترجمه شودفرمول تغییر می‌کند یا نادرست دوباره‌نویسی می‌شود.

برای اسناد علمی، راهنمای ما درباره ترجمه مقالات پژوهشی دانشگاهی را هم بخوانید؛ جایی که معادله‌ها، ارجاع‌ها و چیدمان‌های دوستونه بیشترین ریسک را دارند.

چک‌لیست حفظ چیدمان

این چک‌لیست را قبل از آپلود و بعد از دانلود استفاده کنید:

  • آیا می‌توانید متن را در PDF مبدأ انتخاب کنید؟
  • فایل اسکن‌شده است، PDF دیجیتال است یا متن روی تصویر دارد؟
  • آیا جدول‌هایی با سلول‌های ادغام‌شده دارد؟
  • آیا بخش‌های دوستونه دارد؟
  • آیا زیرنویس‌ها به تصاویر وابسته‌اند؟
  • آیا سربرگ‌ها و پابرگ‌ها معنا دارند یا صرفاً تزئینی‌اند؟
  • آیا یادداشت‌های دست‌نویس یا مهر وجود دارد؟
  • آیا معادله، ارجاع یا بلوک کد دارد؟
  • آیا زبان مقصد به‌طور قابل توجهی متن را بلندتر یا کوتاه‌تر می‌کند؟
  • آیا لازم است خروجی به‌صورت یک PDF نهایی به اشتراک گذاشته شود؟

اگر پاسخ سؤال آخر بله است، به یک جریان کار ترجمه متنی ساده تکیه نکنید.

حالت‌های رایج خرابی و راه‌حل‌ها

خرابیچرا رخ می‌دهدراه‌حل
ستون‌ها در یک پاراگراف ادغام می‌شوندابزار به‌جای ترتیب منطقی، بر اساس مختصات می‌خوانداز یک مترجم PDF استفاده کنید یا جریان استخراج بهتری را امتحان کنید.
جدول‌ها به متن ساده تبدیل می‌شوندمرزهای جدول تشخیص داده نمی‌شوندجدول‌ها را دستی بازبینی کنید یا جدول‌های مهم را بازسازی کنید.
صفحات اسکن‌شده ترجمه‌نشده می‌مانندPDF لایه متنی ندارداول OCR را اجرا کنید.
متن روی هم می‌افتدزبان مقصد از فضای اصلی بیشتر می‌شوداز ابزاری با رسیدگی به چیدمان استفاده کنید و بعد نواحی تنگ را بررسی کنید.
زیرنویس‌ها جابه‌جا می‌شوندتصویر و زیرنویس به‌عنوان یک واحد در نظر گرفته نمی‌شوندصفحات شکل‌ها را دستی بررسی کنید.
پانویس‌ها به متن اصلی تبدیل می‌شوندمرحله استخراج سلسله‌مراتب را از دست می‌دهدصفحات پانویس و ارجاع را بازبینی کنید.
نام‌ها یا اعداد تغییر می‌کنندمدل ترجمه آن‌ها را متن عادی در نظر می‌گیردیک واژه‌نامه اضافه کنید یا موجودیت‌های پرریسک را بازبینی کنید.
خروجی درست به نظر می‌رسد اما معنا غلط استچیدمان حفظ شده، اما زبان نهبرای بخش‌های مهم بازبینی دوزبانه انجام دهید.

جریان کار پیشنهادی برای بیشتر کاربران

  1. بررسی کنید PDF قابل انتخاب است یا نه.
  2. اگر اسکن‌شده است، OCR را اجرا کنید و لایه متنی را بازبینی کنید.
  3. PDF را در مترجم PDF آپلود کنید.
  4. کل سند را ترجمه کنید.
  5. اول سخت‌ترین صفحات را بررسی کنید: جدول‌ها، ستون‌ها، شکل‌ها، پانویس‌ها و ارجاع‌ها.
  6. برای بررسی عبارت‌بندی از ChatGPT یا بازبین انسانی استفاده کنید، نه به‌عنوان موتور چیدمان.
  7. PDF اصلی، PDF ترجمه‌شده و هر واژه‌نامه‌ای را برای به‌روزرسانی‌های بعدی کنار هم نگه دارید.

این جریان کار نقش هر ابزار را سر جای درست خودش نگه می‌دارد: OCR اسکن‌ها را می‌خواند، ترجمه PDF ساختار سند را حفظ می‌کند و بازبینی انسانی یا LLM کیفیت زبان را بهتر می‌کند.

سوالات متداول

بهترین راه ترجمه PDF بدون از دست دادن قالب‌بندی چیست؟

برای PDFهای دارای متن قابل انتخاب، از یک مترجم PDF تخصصی استفاده کنید. اگر PDF اسکن‌شده است، اول OCR را اجرا کنید و بعد PDF پردازش‌شده با OCR را ترجمه کنید. اگر لازم است فایل نهایی به‌صورت یک PDF قالب‌بندی‌شده باقی بماند، از مترجم PDF شروع کنید.

چرا وقتی PDF را ترجمه می‌کنم قالب‌بندی آن خراب می‌شود؟

PDFها متن را روی یک صفحه ثابت ذخیره می‌کنند، اغلب به‌صورت قطعه‌های جای‌گذاری‌شده نه پاراگراف‌های قابل ویرایش. ترجمه طول متن را تغییر می‌دهد و ابزار باید چیدمان صفحه را از نو بسازد. مترجم‌های ساده معمولاً متن را استخراج و ترجمه می‌کنند، اما چیدمان را خوب بازسازی نمی‌کنند.

آیا Google Translate می‌تواند چیدمان PDF را حفظ کند؟

برای درک سریع محتوا می‌تواند مفید باشد، اما برای حفظ چیدمان نهایی قابل اتکا نیست. جدول‌ها، ستون‌ها، تصاویر، زیرنویس‌ها و صفحات اسکن‌شده از رایج‌ترین نقاط شکست هستند. اگر هنوز می‌خواهید این مسیر را امتحان کنید، از راهنمای PDF با Google Translate استفاده کنید.

آیا ChatGPT می‌تواند یک PDF را ترجمه کند و قالب‌بندی را نگه دارد؟

ChatGPT می‌تواند متن را ترجمه یا بهتر کند، اما نباید آن را ابزار حفظ چیدمان PDF در نظر گرفت. از آن برای بخش‌های کوتاه، کار روی واژه‌نامه و بازبینی استفاده کنید. برای چیدمان نهایی سند از یک مترجم PDF استفاده کنید.

با یک PDF اسکن‌شده چه کار باید بکنم؟

اول OCR را اجرا کنید. بعد از آن، قبل از ترجمه متن استخراج‌شده را بازبینی کنید. فایل‌های اسکن‌شده با جزئیات در راهنمای ترجمه PDF اسکن‌شده پوشش داده شده‌اند.

آیا باید قبل از ترجمه PDF را به Word تبدیل کنم؟

فقط اگر قصد دارید سند را دستی ویرایش یا بازسازی کنید. تبدیل می‌تواند حتی قبل از شروع ترجمه به چیدمان صفحه آسیب بزند. برای حفظ چیدمان، اول مسیر ترجمه مستقیم PDF را آزمایش کنید.