BookTranslator
BookTranslator

서식을 유지하면서 PDF를 번역하는 방법 (2026 가이드)

레이아웃, 표, 이미지, 글꼴을 유지하면서 PDF를 번역하는 완전한 가이드입니다. 실제로 어떤 방법과 도구가 효과적인지 확인하기 위해 모든 옵션을 테스트했습니다.

BookTranslator

BookTranslator Team

번역 가이드23 min read

빠른 답변: 가지고 있는 PDF에 맞는 워크플로를 쓰세요

서식을 잃지 않고 PDF를 번역하려면, 먼저 PDF에서 텍스트를 선택할 수 있는지 확인하세요. 선택할 수 있다면 BookTranslator PDF 번역기 같은 전용 PDF 번역기를 사용하세요. 선택할 수 없다면 먼저 OCR을 실행한 뒤 OCR 처리된 PDF를 번역하세요. 최종 문서에서 단, 표, 이미지, 캡션, 머리글, 바닥글, 페이지 순서를 유지해야 한다면 텍스트를 복사해 범용 번역기에 붙여넣는 방식은 피해야 합니다.

실전에서는 아래 결정표를 따르면 됩니다.

PDF 유형가장 안전한 워크플로피해야 할 것
텍스트 선택이 가능한 PDFPDF 번역기에 업로드한 뒤 레이아웃 검토텍스트 상자에 복사해서 붙여넣기
스캔 PDF먼저 OCR 수행 후 번역이미지 전용 페이지를 텍스트 전용 번역기에 업로드하기
학술 논문PDF 번역기를 사용한 뒤 수식, 인용, 표, 그림 점검무작정 DOCX로 변환하기
간단한 1페이지 PDF레이아웃이 중요하지 않다면 Google Translate로도 충분할 수 있음결과물이 바로 완성본이라고 가정하기
책 분량 PDF용어 검토가 포함된 문서 워크플로 사용페이지별 수동 채팅 프롬프트

도구를 비교 중이라면 최고의 PDF 번역기 비교를 참고하세요. 파일이 스캔본이라면 바로 스캔 PDF OCR 가이드로 가면 됩니다.

번역할 때 PDF 서식이 깨지는 이유

PDF는 Word 문서처럼 저장되지 않습니다. DOCX 파일은 문단, 제목, 목록, 표가 편집 가능한 구조로 들어 있습니다. 반면 PDF는 고정된 캔버스에 더 가깝습니다. 텍스트는 페이지 위 특정 좌표에 배치되며, 종종 잘게 쪼개진 조각 형태로 저장됩니다. 겉으로는 일반 문서처럼 보여도 내부적으로는 텍스트 블록, 글꼴 참조, 이미지, 마스크, 좌표의 집합일 수 있습니다.

번역은 텍스트 길이를 바꿉니다. 바로 그 지점에서 레이아웃이 무너집니다.

원문에서 목표 언어로흔한 레이아웃 영향
영어에서 독일어 또는 스페인어로텍스트가 늘어나 상자가 넘치는 경우가 많습니다.
영어에서 중국어 또는 일본어로텍스트가 줄어 빈 공간이 생기는 경우가 많습니다.
영어에서 아랍어 또는 히브리어로방향성과 정렬을 별도로 처리해야 합니다.
긴 복합어가 많은 언어로제목과 표가 넘칠 수 있습니다.
스캔된 페이지 전체OCR이 실행되기 전까지 번역할 텍스트가 없을 수 있습니다.

좋은 PDF 번역 워크플로는 다섯 가지 일을 해내야 합니다.

  1. 읽기 순서를 감지한다.
  2. 본문, 머리글, 캡션, 표, 각주를 구분한다.
  3. 무작위 조각이 아니라 의미 있는 텍스트 블록 단위로 번역한다.
  4. 번역된 텍스트를 다시 페이지 안에 맞춰 넣는다.
  5. 검토 가능한 출력 PDF를 렌더링한다.

실패하는 워크플로 대부분은 가운데 단계만 처리합니다. 텍스트를 추출해 번역만 하는 것입니다. 그래서 단어는 맞아도 문서 전체는 사용할 수 없게 됩니다.

방법 1: 전용 PDF 번역기 사용하기

적합한 경우: 긴 PDF, 고객 문서, 보고서, 책, 매뉴얼, 학술 파일.

서식이 중요하다면 이 방법이 가장 신뢰할 수 있는 출발점입니다. 전용 PDF 번역기는 문서 문제 자체를 중심으로 설계되어 있습니다. 읽기 순서, 레이아웃 유지, 페이지 구조, 출력 검토를 전제로 작동합니다.

다음 워크플로를 사용하세요.

  1. PDF를 열고 텍스트 선택이 가능한지 확인합니다.
  2. 파일을 PDF 번역기에 업로드합니다.
  3. 원문 언어와 목표 언어를 선택합니다.
  4. 문서를 번역합니다.
  5. 표, 제목, 캡션, 각주, 그림이 있는 페이지를 중심으로 원본과 결과물을 비교합니다.
  6. 문서가 법률, 의료, 금융, 학술, 출판용이라면 최종 사람 검토를 진행합니다.

이 방법이 특히 잘 보존하는 요소:

  • 페이지 구조
  • 문단 묶음
  • 제목
  • 이미지
  • 캡션
  • 지나치게 잘게 쪼개지지 않은 표
  • 일반적인 다단 레이아웃에서의 읽기 순서

그래도 검토가 필요한 요소:

  • 복잡한 표
  • 아주 작은 각주
  • 수식
  • 손글씨 주석
  • 매우 좁은 텍스트 박스
  • 품질이 낮은 내장 글꼴
  • 스캔 파일의 OCR 오류

선택 전에 도구 옵션을 비교하고 싶다면 PDF 번역기 도구 비교를 참고하세요.

방법 2: 빠른 이해용으로 Google Translate 사용하기

적합한 경우: 레이아웃이 중요하지 않은 짧은 PDF.

Google Translate는 문서가 무슨 내용을 말하는지만 빠르게 파악하고 싶을 때 유용합니다. 하지만 번역된 완성형 PDF가 필요하다면 가장 안전한 워크플로는 아닙니다.

일반적인 흐름은 다음과 같습니다.

  1. Google Translate를 엽니다.
  2. 문서 업로드 옵션을 선택합니다.
  3. PDF를 업로드합니다.
  4. 원문 언어와 목표 언어를 선택합니다.
  5. 번역 후 결과물을 검토합니다.

잘 작동하는 경우:

  • 짧고 단순한 텍스트 위주의 PDF
  • 개인용 읽기
  • 빠른 내용 파악
  • 간단한 메모나 편지

잘 실패하는 경우:

  • 다단 보고서
  • 그림과 캡션
  • OCR이 없는 스캔 PDF
  • 페이지 레이아웃이 중요한 파일
  • 여러 페이지에 걸쳐 용어 일관성이 필요한 문서

특히 Google을 쓰려는 경우에는 Google Translate PDF 가이드를 읽어보세요. 웹 방식, Google Docs 우회 방법, 그리고 결과를 신뢰하기 전에 확인해야 할 실패 징후를 설명합니다.

방법 3: 최종 PDF 레이아웃이 아니라 텍스트용으로 ChatGPT 사용하기

적합한 경우: 짧은 구간, 용어집 작업, 톤 조정, 번역 검토.

ChatGPT는 텍스트에 접근할 수 있을 때 PDF 내용을 번역하는 데 도움을 줄 수 있습니다. 특히 질문이 단순히 "이게 무슨 뜻인가요?"가 아니라 "목표 언어에서 이 문장은 어떻게 들려야 하나요?"일 때 유용합니다.

ChatGPT가 잘 맞는 사용 사례:

  • 어려운 문단 번역
  • 특정 독자층에 맞는 톤 조정
  • 긴 문서를 번역하기 전에 용어집 만들기
  • 번역을 검토하고 어색한 표현 표시하기
  • 기술 문장을 다른 언어로 설명하기

ChatGPT가 잘 맞지 않는 사용 사례:

  • 전체 PDF 레이아웃 재구성
  • 긴 책을 페이지별로 번역하기
  • 표, 캡션, 페이지 번호 유지하기
  • 신뢰할 수 있는 OCR 단계 없이 스캔 PDF 처리하기
  • 수동 검토 없이 바로 공유 가능한 최종 파일 만들기

짧은 구간에는 다음 프롬프트를 사용하세요.

Translate the following PDF excerpt from [source language] to [target language].
Preserve headings, numbered lists, table labels, citations, and technical terms.
Do not summarize. Do not add new information. If a phrase is ambiguous,
mark it with [review].

완전한 ChatGPT 워크플로와 프롬프트가 필요하다면 ChatGPT PDF 번역 가이드를 참고하세요.

방법 4: 먼저 PDF를 DOCX로 변환하기

적합한 경우: 수동으로 편집하거나 다시 조판할 계획이 있는 문서.

PDF를 DOCX로 변환하면 편집 가능한 텍스트가 필요할 때 도움이 될 수 있습니다. 하지만 서식 면에서 자동으로 더 나은 선택이 되는 것은 아닙니다. 오히려 레이아웃 손상이 변환 단계에서 시작되는 경우도 많습니다.

다음과 같은 경우에는 변환을 고려하세요.

  • 번역된 텍스트를 많이 수정해야 할 때
  • 최종 레이아웃을 수동으로 다시 만들 계획일 때
  • PDF가 단순하고 대부분 텍스트일 때
  • 완성본이 아니라 작업용 초안이 필요할 때

다음과 같은 경우에는 변환을 피하세요.

  • 원본 PDF에 복잡한 표가 있을 때
  • 문서가 2단 학술 레이아웃일 때
  • 캡션, 각주, 사이드바가 많을 때
  • 최종 출력이 페이지 단위로 원본과 맞아야 할 때

문서 전체를 변환하기 전에 어려운 페이지 하나를 먼저 테스트하세요. DOCX 변환 과정에서 그 페이지가 깨진다면, 번역 결과물도 그 손상을 그대로 이어받게 됩니다.

방법 5: 스캔 PDF는 먼저 OCR 처리하기

적합한 경우: 복사본, 이미지 전용 PDF, 오래된 책, 스캔 계약서, 휴대폰으로 스캔한 문서.

스캔 PDF에는 텍스트가 아니라 텍스트 이미지가 들어 있습니다. 번역 도구는 픽셀을 안정적으로 번역하지 못합니다. 먼저 OCR로 텍스트 레이어를 만들어야 합니다.

다음 워크플로를 사용하세요.

  1. PDF에서 텍스트를 선택해 봅니다.
  2. 선택이 되지 않으면 OCR을 실행합니다.
  3. 올바른 OCR 언어를 선택합니다.
  4. 추출된 텍스트를 검토합니다.
  5. OCR 처리된 PDF를 번역합니다.
  6. 숫자, 이름, 표, 각주, 저대비 텍스트처럼 OCR에 민감한 영역을 검토합니다.

가장 흔한 실수는 4단계를 건너뛰는 것입니다. OCR 오류는 번역 오류가 됩니다. OCR이 "rn"을 "m"으로, 또는 "0"을 "O"로 잘못 읽으면 번역기는 그 잘못된 입력을 충실하게 번역합니다.

전체 OCR 워크플로는 스캔 PDF 번역하기 가이드를 참고하세요.

번역 전후에 꼭 봐야 할 확인 포인트

모든 페이지를 같은 수준으로 검토할 필요는 없습니다. 가장 깨지기 쉬운 페이지부터 고르세요.

페이지 요소번역 후 무엇을 비교할지실패 징후
표지 페이지제목, 부제, 저자명, 간격텍스트가 겹치거나 이름이 바뀜
목차제목, 번호 매김, 페이지 참조링크나 숫자가 빠짐
2단 섹션읽기 순서와 단 경계왼쪽 단과 오른쪽 단이 합쳐짐
행 레이블, 숫자, 단위, 각주셀이 밀리거나 줄바꿈이 사라짐
그림 캡션캡션이 이미지와 함께 유지되는지캡션이 다른 그림으로 이동함
각주표시 기호와 각주 텍스트가 일치하는지각주가 본문 텍스트로 바뀜
인용저자명, 연도, 괄호인용 부호나 구두점이 잘못 바뀜
수식 페이지수식은 그대로이고 주변 텍스트만 번역되는지수식이 바뀌거나 잘못 다시 입력됨

학술 문서라면 학술 연구 논문 번역하기 가이드도 읽어보세요. 수식, 인용, 2단 레이아웃이 가장 큰 위험 요소입니다.

레이아웃 보존 체크리스트

업로드 전과 다운로드 후에 아래 항목을 확인하세요.

  • 원본 PDF에서 텍스트를 선택할 수 있나요?
  • 파일이 스캔본인가요, 디지털 PDF인가요, 아니면 텍스트가 이미지 위에 얹힌 PDF인가요?
  • 병합 셀이 있는 표가 있나요?
  • 2단 섹션이 있나요?
  • 캡션이 이미지와 연결되어 있나요?
  • 머리글과 바닥글이 의미 있는 정보인가요, 아니면 장식 요소인가요?
  • 손글씨 메모나 도장이 있나요?
  • 수식, 인용, 코드 블록이 있나요?
  • 목표 언어에서 텍스트 길이가 크게 늘어나거나 줄어드나요?
  • 결과물을 완성된 PDF 형태로 공유해야 하나요?

마지막 질문의 답이 yes라면, 일반 텍스트 번역 워크플로에 의존하지 마세요.

흔한 실패 패턴과 해결 방법

실패 현상발생 이유해결 방법
단이 하나의 문단으로 합쳐짐도구가 논리적 순서가 아니라 좌표 기준으로 읽기 때문PDF 번역기를 쓰거나 더 나은 추출 워크플로를 테스트하세요.
표가 일반 텍스트로 바뀜표 경계를 감지하지 못함표를 수동으로 검토하거나 중요한 표는 다시 만드세요.
스캔 페이지가 번역되지 않은 채 남음PDF에 텍스트 레이어가 없음먼저 OCR을 실행하세요.
텍스트가 겹침목표 언어 텍스트가 원래 공간보다 길어짐레이아웃 처리 기능이 있는 도구를 쓰고, 좁은 영역을 점검하세요.
캡션 위치가 바뀜이미지와 캡션이 하나의 단위로 처리되지 않음그림이 있는 페이지를 수동으로 확인하세요.
각주가 본문 텍스트가 됨추출 단계에서 계층 구조가 사라짐각주 페이지와 인용을 검토하세요.
이름이나 숫자가 바뀜번역 모델이 이를 일반 텍스트로 처리함용어집을 추가하거나 위험도가 높은 항목을 검토하세요.
결과물은 멀쩡해 보이지만 의미가 어긋남레이아웃은 살아남았지만 언어가 부정확함중요한 구간은 이중 언어 검토를 하세요.

대부분의 사용자에게 권장하는 워크플로

  1. PDF에서 텍스트 선택이 가능한지 확인합니다.
  2. 스캔본이라면 OCR을 실행하고 텍스트 레이어를 검토합니다.
  3. PDF를 PDF 번역기에 업로드합니다.
  4. 문서 전체를 번역합니다.
  5. 가장 어려운 페이지부터 먼저 검토합니다. 표, 단, 그림, 각주, 인용이 우선입니다.
  6. 문장 표현 점검에는 ChatGPT나 사람 검토자를 사용하되, 레이아웃 엔진으로 쓰지는 마세요.
  7. 향후 업데이트를 위해 원본 PDF, 번역 PDF, 용어집을 함께 보관하세요.

이 워크플로는 각 도구를 올바른 역할에 배치합니다. OCR은 스캔을 읽고, PDF 번역은 문서 구조를 보존하며, 사람 또는 LLM 검토는 문장 품질을 다듬습니다.

FAQ

서식을 잃지 않고 PDF를 번역하는 가장 좋은 방법은 무엇인가요?

텍스트 선택이 가능한 PDF라면 전용 PDF 번역기를 사용하세요. 스캔 PDF라면 먼저 OCR을 실행한 뒤 OCR 처리된 PDF를 번역하세요. 최종 파일이 서식이 유지된 PDF로 남아야 한다면 PDF 번역기부터 시작하는 것이 좋습니다.

PDF를 번역하면 왜 서식이 깨지나요?

PDF는 편집 가능한 문단이 아니라, 고정된 페이지 위의 배치된 조각들 형태로 텍스트를 저장하는 경우가 많습니다. 번역은 텍스트 길이를 바꾸고, 도구는 페이지 레이아웃을 다시 구성해야 합니다. 기본 번역기는 보통 텍스트를 추출해 번역만 하고, 레이아웃을 제대로 다시 만들지는 못합니다.

Google Translate가 PDF 레이아웃을 보존할 수 있나요?

빠른 내용 파악에는 도움이 될 수 있지만, 완성형 레이아웃 보존 용도로는 신뢰하기 어렵습니다. 표, 단, 이미지, 캡션, 스캔 페이지는 모두 흔한 실패 지점입니다. 그래도 그 워크플로를 시도하고 싶다면 Google Translate PDF 가이드를 참고하세요.

ChatGPT가 PDF를 번역하면서 서식도 유지할 수 있나요?

ChatGPT는 텍스트를 번역하거나 다듬는 데는 유용하지만, PDF 레이아웃 보존 도구로 취급해서는 안 됩니다. 짧은 구간, 용어집 작업, 검토에는 사용하고, 최종 문서 레이아웃에는 PDF 번역기를 사용하세요.

스캔 PDF는 어떻게 해야 하나요?

먼저 OCR을 실행하세요. 그다음 번역 전에 추출된 텍스트를 검토하세요. 스캔 파일은 스캔 PDF 번역 가이드에서 자세히 다룹니다.

번역 전에 PDF를 Word로 변환해야 하나요?

문서를 수동으로 편집하거나 다시 만들 계획이 있을 때만 그렇습니다. 변환은 번역이 시작되기 전에 이미 페이지 레이아웃을 손상시킬 수 있습니다. 레이아웃 보존이 중요하다면 먼저 PDF 번역 경로를 테스트하세요.