BookTranslator
BookTranslator

സ്കാൻ ചെയ്ത PDF എങ്ങനെ വിവർത്തനം ചെയ്യാം: സമ്പൂർണ OCR + വിവർത്തന ഗൈഡ്

സ്കാൻ ചെയ്ത PDF-കളിൽ യഥാർത്ഥ ടെക്സ്റ്റ് ഇല്ല; ടെക്സ്റ്റിന്റെ ചിത്രങ്ങൾ മാത്രമാണ് — അതുകൊണ്ടാണ് Google Translate അവ മാറ്റമില്ലാതെ തന്നെ തിരികെ നൽകുന്നത്. ഇത് ശരിയാക്കുന്ന OCR + AI പൈപ്പ്‌ലൈനിതാ.

BookTranslator

BookTranslator Team

തർജ്ജമ ഗൈഡുകൾ9 min read

ദ്രുത ഉത്തരമെന്ന് വച്ചാൽ: സ്കാൻ ചെയ്ത PDF വിവർത്തനത്തിന് മുമ്പ് OCR ആവശ്യമാണ്

സ്കാൻ ചെയ്ത PDF വിവർത്തനം ചെയ്യാൻ, ആദ്യം പേജ് ചിത്രങ്ങളെ തിരഞ്ഞെടുക്കാനാകുന്ന ടെക്സ്റ്റാക്കി മാറ്റാൻ OCR പ്രവർത്തിപ്പിക്കുക. തുടർന്ന് OCR-പ്രോസസ്സ് ചെയ്ത PDF-നെ PDF Translator പോലുള്ള ഒരു ഡോക്യുമെന്റ് വിവർത്തകത്തിൽ വിവർത്തനം ചെയ്യുക. OCR ഒഴിവാക്കിയാൽ, പല വിവർത്തന ടൂളുകളും ഒറിജിനൽ ഫയൽ മാറ്റമില്ലാതെ തിരികെ നൽകും, ചില പേജുകൾ നഷ്ടപ്പെടുത്തും, അല്ലെങ്കിൽ ഇതിനകം ടെക്സ്റ്റ് ലെയർ ഉള്ള ഭാഗങ്ങൾ മാത്രം വിവർത്തനം ചെയ്യും.

ഈ വർക്ക്‌ഫ്ലോ ഉപയോഗിക്കുക:

  1. PDF തുറന്ന് ഒരു വാക്യം തിരഞ്ഞെടുക്കാൻ ശ്രമിക്കുക.
  2. ടെക്സ്റ്റ് തിരഞ്ഞെടുക്കാനാകുന്നില്ലെങ്കിൽ OCR പ്രവർത്തിപ്പിക്കുക.
  3. വിവർത്തനത്തിന് മുമ്പ് OCR ടെക്സ്റ്റ് പരിശോധിക്കുക.
  4. OCR-പ്രോസസ്സ് ചെയ്ത PDF PDF Translator-ലേക്ക് അപ്ലോഡ് ചെയ്യുക.
  5. വിവർത്തനം ചെയ്ത ഔട്ട്പുട്ട് ഒറിജിനൽ സ്കാനുമായി താരതമ്യം ചെയ്ത് പരിശോധിക്കുക.

നിങ്ങളുടെ PDF-ൽ ഇതിനകം തിരഞ്ഞെടുക്കാനാകുന്ന ടെക്സ്റ്റ് ഉണ്ടെങ്കിലും പ്രശ്നം ലേഔട്ട് സംരക്ഷിക്കലാണെങ്കിൽ, ഫോർമാറ്റിംഗ് നഷ്ടപ്പെടുത്താതെ PDF വിവർത്തനം ചെയ്യാനുള്ള ഗൈഡ് ഉപയോഗിക്കുക.

സ്കാൻ ചെയ്ത PDF-കൾ വിവർത്തന ടൂളുകളിൽ എന്തുകൊണ്ട് പരാജയപ്പെടുന്നു

സ്കാൻ ചെയ്ത PDF എന്നത് പലപ്പോഴും PDF കണ്ടെയ്‌നറിനുള്ളിൽ ഉള്ള പേജ് ചിത്രങ്ങളുടെ ഒരു സമാഹാരമാണ്. ഒരു മനുഷ്യന് പേജിൽ വാക്കുകൾ കാണാമെങ്കിലും, സോഫ്റ്റ്‌വെയർ എക്‌സ്‌ട്രാക്റ്റ് ചെയ്യാൻ കഴിയുന്ന യഥാർത്ഥ ടെക്സ്റ്റ് ഫയലിൽ ഇല്ലാതിരിക്കും.

ഇത് ഒരു ലളിതമായ പ്രശ്നത്തിലേക്ക് നയിക്കുന്നു:

ഫയൽ തരംവിവർത്തകൻ കാണുന്നത്എന്ത് സംഭവിക്കുന്നു
ടെക്സ്റ്റ്-അധിഷ്ഠിത PDFടെക്സ്റ്റും ലേഔട്ട് ഡാറ്റയുംവിവർത്തനം ഉടൻ ആരംഭിക്കാം.
ചിത്രം മാത്രമുള്ള സ്കാൻ PDFപേജുകളുടെ ചിത്രങ്ങൾആദ്യം OCR ആവശ്യമാണ്.
ചിത്രത്തിനുമുകളിലെ ടെക്സ്റ്റുള്ള PDFസ്കാൻ ചിത്രം + മറഞ്ഞിരിക്കുന്ന OCR ടെക്സ്റ്റ് ലെയർവിവർത്തനം പ്രവർത്തിക്കാം, പക്ഷേ OCR പിശകുകൾ ഗുണനിലവാരത്തെ ബാധിക്കും.

ഏറ്റവും ഉപകാരപ്രദമായ പരിശോധന സാങ്കേതികമല്ല:

  1. PDF തുറക്കുക.
  2. ഓരോ വാക്കുകളും ഹൈലൈറ്റ് ചെയ്യാൻ ശ്രമിക്കുക.
  3. ഒരു വാക്യം കോപ്പി ചെയ്യുക.
  4. അത് ഒരു ടെക്സ്റ്റ് എഡിറ്ററിലേക്ക് പേസ്റ്റ് ചെയ്യുക.

വാക്യം ശരിയായി പേസ്റ്റ് ചെയ്താൽ PDF-ൽ ടെക്സ്റ്റ് ലെയർ ഉണ്ട്. ഒന്നും പേസ്റ്റ് ആവുന്നില്ലെങ്കിൽ, അല്ലെങ്കിൽ പേജ് മുഴുവനും ഒരു ചിത്രമായി പെരുമാറുന്നുവെങ്കിൽ, PDF-ന് OCR ആവശ്യമാണ്.

OCR ഐച്ഛികമല്ല

OCR എന്നത് optical character recognition എന്നാണ്. ഇത് ഒരു ചിത്രത്തിൽ നിന്ന് ടെക്സ്റ്റ് വായിച്ച് യന്ത്രം വായിക്കാവുന്ന ടെക്സ്റ്റ് സൃഷ്ടിക്കുന്നു. PDF വിവർത്തനത്തിൽ, OCR സാധാരണയായി സ്കാൻ ചെയ്ത പേജിന് മുകളിൽ കാണാനാകാത്ത ഒരു ടെക്സ്റ്റ് ലെയർ സൃഷ്ടിക്കും.

ആ ടെക്സ്റ്റ് ലെയറാണ് വിവർത്തനത്തിനുള്ള സ്രോതസാകുന്നത്. OCR പിഴച്ചാൽ, ആ പിശകുകൾ വിവർത്തനവും ഏറ്റെടുക്കും.

സാധാരണ OCR പിശകുകൾ:

OCR പിശക്വിവർത്തനത്തിലെ അപകടസാധ്യത
rn നെ m ആയി വായിക്കുന്നത്വാക്കുകളുടെ അർത്ഥം മാറുന്നു.
1 നെ l ആയി വായിക്കുന്നത്അക്കങ്ങൾ, റഫറൻസുകൾ, അല്ലെങ്കിൽ കോഡുകൾ തെറ്റാം.
O നെ 0 ആയി വായിക്കുന്നത്ID-കൾ, ഫോർമുലകൾ, പേരുകൾ എന്നിവ തകരാം.
ആക്സെന്റുകൾ നഷ്ടപ്പെടുന്നത്പേരുകളും പദങ്ങളും കൃത്യമല്ലാതാകുന്നു.
കോളങ്ങൾ ലയിക്കുന്നത്വാക്യങ്ങൾ തെറ്റായ ക്രമത്തിൽ വിവർത്തനം ചെയ്യപ്പെടുന്നു.
പട്ടിക സെല്ലുകൾ വരി-വരി തെറ്റായി വായിക്കുന്നത്ഡാറ്റാ ലേബലുകളും മൂല്യങ്ങളും തമ്മിലുള്ള പൊരുത്തം നഷ്ടപ്പെടുന്നു.
അടിക്കുറിപ്പുകൾ മുഖ്യ ടെക്സ്റ്റായി പരിഗണിക്കുന്നത്സൈറ്റേഷനുകളും കുറിപ്പുകളും തെറ്റായ സന്ദർഭത്തിലേക്ക് നീങ്ങുന്നു.

അതുകൊണ്ടാണ് OCR റിവ്യൂ ഘട്ടം നിർണായകം. എക്‌സ്‌ട്രാക്റ്റ് ചെയ്ത ടെക്സ്റ്റ് ചില ഭാഗങ്ങളിൽ പരിശോധിച്ചുറപ്പിക്കുന്നതുവരെ സ്കാൻ ചെയ്ത ഡോക്യുമെന്റ് വിവർത്തനം ചെയ്യരുത്.

OCR-ആദ്യം വർക്ക്‌ഫ്ലോ

ഘട്ടം 1: PDF തരം തിരിച്ചറിയുക

ടെക്സ്റ്റ് തിരഞ്ഞെടുക്കാൻ ശ്രമിക്കുക. തിരഞ്ഞെടുക്കൽ പ്രവർത്തിച്ചാൽ OCR വേണ്ടിവരണമെന്നില്ല. തിരഞ്ഞെടുക്കൽ പരാജയപ്പെട്ടാൽ, ഫയലിനെ ചിത്രം മാത്രമുള്ളതെന്ന് കരുതുക.

പേജ് കാഴ്ചയിൽ നോക്കിയും പരിശോധിക്കുക:

  • പേജുകൾ ചരിഞ്ഞതായി തോന്നുന്നുവെങ്കിൽ അത് സ്കാൻ ആണെന്ന് സൂചിപ്പിക്കുന്നു.
  • പേപ്പറിന്റെ ചാരനിറമുള്ള ടെക്സ്ചർ സ്കാൻ ആണെന്ന് സൂചിപ്പിക്കുന്നു.
  • ബൈൻഡിംഗിന് സമീപമുള്ള നിഴലുകൾ ഫോട്ടോ എടുത്ത പുസ്തകമാകാമെന്ന് സൂചിപ്പിക്കുന്നു.
  • അസമമായ കോൺട്രാസ്റ്റ് ഫോട്ടോകോപ്പിയാകാമെന്ന് സൂചിപ്പിക്കുന്നു.
  • കാണുന്ന വാക്കുകൾ സെർച്ച് കണ്ടെത്താത്തത് ടെക്സ്റ്റ് ലെയർ ഇല്ലെന്ന സൂചനയാണ്.

ഘട്ടം 2: സാധ്യമെങ്കിൽ സ്കാൻ മെച്ചപ്പെടുത്തുക

OCR ഗുണനിലവാരം ചിത്രഗുണത്തിലാണ് തുടങ്ങുന്നത്. വീണ്ടും സ്കാൻ ചെയ്യാൻ കഴിയുമെങ്കിൽ, OCR പിശകുകൾ തിരുത്താൻ സമയം ചെലവഴിക്കുന്നതിന് മുമ്പ് അത് ചെയ്യുക.

ഈ ചിത്രഗുണനിലവാര ചെക്ക്ലിസ്റ്റ് ഉപയോഗിക്കുക:

  • ചെറിയ ടെക്സ്റ്റിനും മതിയാകുന്ന റെസല്യൂഷനിൽ സ്കാൻ ചെയ്യുക.
  • പേജുകൾ നേരെയും തട്ടായും വയ്ക്കുക.
  • ബൈൻഡിംഗിന് സമീപമുള്ള നിഴലുകൾ ഒഴിവാക്കുക.
  • പട്ടികയുടെ അരികുകൾ, വിരലുകൾ, അല്ലെങ്കിൽ പശ്ചാത്തല അഴുക്കുകൾ ക്രോപ്പ് ചെയ്ത് നീക്കുക.
  • ടെക്സ്റ്റും പേജും തമ്മിൽ ശക്തമായ കോൺട്രാസ്റ്റ് ഉറപ്പാക്കുക.
  • മുഴുവൻ വരിയും വ്യക്തമായി കാണുന്നുവെന്ന് ഉറപ്പാക്കുക.
  • ശരിയായ പേജ് ദിശ ഉപയോഗിക്കുക.
  • അക്ഷരങ്ങൾ മങ്ങുന്നതുവരെ ചിത്രം അതിരുകടന്ന രീതിയിൽ കംപ്രസ് ചെയ്യരുത്.

പഴയ പുസ്തകങ്ങൾക്കും ഫോട്ടോകോപ്പികൾക്കും ഏറ്റവും വലിയ മെച്ചപ്പെടുത്തൽ സാധാരണയായി ചരിവ് തിരുത്തൽ, കോൺട്രാസ്റ്റ് ശരിയാക്കൽ, ഫോകസിൽ ഇല്ലാത്ത പേജുകൾ വീണ്ടും സ്കാൻ ചെയ്യൽ എന്നിവയിൽ നിന്നാണ് ലഭിക്കുന്നത്.

ഘട്ടം 3: OCR പ്രവർത്തിപ്പിക്കുക

ബ്രാൻഡിനെ ആശ്രയിച്ചല്ല, ഡോക്യുമെന്റിനെ ആശ്രയിച്ചാണ് OCR ടൂൾ തിരഞ്ഞെടുക്കേണ്ടത്.

OCR ഓപ്ഷൻഏറ്റവും അനുയോജ്യംശ്രദ്ധിക്കേണ്ടത്
Adobe Acrobat OCRപൊതുവായ ബിസിനസ് സ്കാനുകളും PDF ക്ലീൻഅപ്പുംഇതിനെ ആശ്രയിക്കുന്നതിന് മുമ്പ് നിലവിലെ പ്ലാൻ ആക്സസ് പരിശോധിക്കുക.
ABBYY FineReaderസങ്കീർണ സ്കാനുകൾ, പട്ടികകൾ, കോളങ്ങൾ, ബുദ്ധിമുട്ടുള്ള ലേഔട്ടുകൾമാനുവൽ റിവ്യൂ ഇന്നും ആവശ്യമാണ്.
Tesseract അല്ലെങ്കിൽ OCRmyPDFലോക്കൽ, ടെക്നിക്കൽ, ആവർത്തിക്കാവുന്ന OCR വർക്ക്‌ഫ്ലോകൾcommand-line ടൂളുകൾ ഉപയോഗിക്കുന്നതിൽ സൗകര്യം വേണം.
ഓൺലൈൻ OCR ടൂളുകൾകുറഞ്ഞ അപകടസാധ്യതയുള്ള ഇടയ്ക്കിടെ വരുന്ന ഫയലുകൾസ്വകാര്യത, ഫയൽ പരിധി, ഗുണനിലവാരം എന്നിവ വ്യത്യാസപ്പെടും.
ഫോൺ സ്കാനിംഗ് ആപ്പുകൾപെട്ടെന്ന് പുതിയൊരു സ്കാൻ പകർത്താൻperspective distortion OCR-നെ ബാധിക്കാം.

സ്വകാര്യ കരാറുകൾ, മെഡിക്കൽ രേഖകൾ, സാമ്പത്തിക ഡോക്യുമെന്റുകൾ, പ്രസിദ്ധീകരിക്കാത്ത കൈയെഴുത്തുപ്രതികൾ, അല്ലെങ്കിൽ റിവ്യൂവിലുള്ള അക്കാദമിക് പ്രവൃത്തികൾ എന്നിവയ്ക്കായി, ലോക്കൽ OCR വർക്ക്‌ഫ്ലോ അല്ലെങ്കിൽ വിശ്വസനീയമായ ഒരു അന്തരീക്ഷം തിരഞ്ഞെടുക്കുക. സെൻസിറ്റീവ് സ്കാനുകൾ ഏതെങ്കിലും യാദൃശ്ചിക സൗജന്യ OCR സൈറ്റുകളിൽ അപ്ലോഡ് ചെയ്യരുത്.

ഘട്ടം 4: OCR ടെക്സ്റ്റ് പരിശോധിക്കുക

പരിശോധിക്കേണ്ടത് വിവർത്തനത്തിന് ശേഷമല്ല, മുമ്പാണ്. ബുദ്ധിമുട്ടുള്ള നിരവധി പേജുകളിൽ നിന്ന് ടെക്സ്റ്റ് കോപ്പി ചെയ്ത് അത് വായിക്കാനാകുന്നുണ്ടോ എന്ന് പരിശോധിക്കുക.

പരിശോധിക്കേണ്ട സാമ്പിൾ പേജുകൾ:

  • ടൈറ്റിൽ പേജ്.
  • കനം കൂടിയ മുഖ്യ ഉള്ളടക്കമുള്ള ഒരു പേജ്.
  • ഒരു പട്ടിക പേജ്.
  • അടിക്കുറിപ്പുകളുള്ള ഒരു പേജ്.
  • ചെറിയ ടെക്സ്റ്റുള്ള ഒരു പേജ്.
  • സ്റ്റാമ്പുകൾ, കൈയെഴുത്ത്, അല്ലെങ്കിൽ അരികിലെ കുറിപ്പുകൾ ഉള്ള ഒരു പേജ്.
  • ഡോക്യുമെന്റ് ബഹുഭാഷയാണെങ്കിൽ ഓരോ ഭാഷയിലുമൊരു പേജ്.

ഇവ നോക്കുക:

  • നഷ്ടപ്പെട്ട പാരഗ്രാഫുകൾ.
  • ലയിച്ച കോളങ്ങൾ.
  • തകർന്ന വാക്കുകൾ.
  • തെറ്റായ അക്ഷരങ്ങൾ.
  • നഷ്ടപ്പെട്ട diacritics.
  • മൂല്യങ്ങളിൽ നിന്ന് വേർപ്പെട്ട പട്ടിക ലേബലുകൾ.
  • മുഖ്യ ടെക്സ്റ്റിലേയ്ക്ക് കയറിയ ഹെഡറുകൾ.
  • വാക്യങ്ങളിലേക്ക് കലർന്ന പേജ് നമ്പറുകൾ.

OCR ഗുണനിലവാരം മോശമാണെങ്കിൽ, വിവർത്തനത്തിന് മുമ്പ് അത് ശരിയാക്കുക. OCR ഒരിക്കലും പിടിച്ചെടുത്തിട്ടില്ലാത്ത അർത്ഥം ഒരു വിവർത്തകനും വിശ്വസനീയമായി തിരിച്ചുപിടിക്കാൻ കഴിയില്ല.

ഘട്ടം 5: OCR-പ്രോസസ്സ് ചെയ്ത PDF വിവർത്തനം ചെയ്യുക

PDF-ക്ക് വൃത്തിയായ ടെക്സ്റ്റ് ലെയർ ലഭിച്ചാൽ, അത് PDF Translator-ലേക്ക് അപ്ലോഡ് ചെയ്യുക. ഇപ്പോൾ വിവർത്തന ഘട്ടം പേജ് ചിത്രങ്ങളല്ല, ടെക്സ്റ്റാണ് ഉപയോഗിക്കുന്നത്.

വിവർത്തനത്തിന് ശേഷം താരതമ്യം ചെയ്യുക:

  • ഒറിജിനൽ സ്കാൻ
  • OCR ടെക്സ്റ്റ് ലെയർ
  • വിവർത്തനം ചെയ്ത PDF

ഈ മൂന്ന്-വഴി റിവ്യൂ ഒരു പിശക് OCR-ൽ നിന്നാണോ വിവർത്തനത്തിൽ നിന്നാണോ എന്ന് തിരിച്ചറിയാൻ സഹായിക്കുന്നു. OCR ടെക്സ്റ്റ് തെറ്റാണെങ്കിൽ OCR വീണ്ടും പ്രവർത്തിപ്പിക്കുക. OCR ടെക്സ്റ്റ് ശരിയായിട്ടും വിവർത്തനം തെറ്റാണെങ്കിൽ, വിവർത്തനം തിരുത്തുക.

ഘട്ടം 6: ഉയർന്ന അപകടസാധ്യതയുള്ള ഉള്ളടക്കം പരിശോധിക്കുക

സ്കാൻ ചെയ്ത ഡോക്യുമെന്റുകളിൽ സാധാരണയായി ശ്രദ്ധാപൂർവ്വം റിവ്യൂ ചെയ്യേണ്ട ഉള്ളടക്കമാണ് ഉണ്ടാകാറുള്ളത്: പഴയ കരാറുകൾ, സർക്കാർ ഫോമുകൾ, അക്കാദമിക് പ്രബന്ധങ്ങൾ, മാന്വലുകൾ, ചരിത്രരേഖകൾ, പുസ്തക പേജുകൾ.

ഈ ഇനങ്ങൾ മാനുവലായി പരിശോധിക്കുക:

  • പേരുകൾ
  • തീയതികൾ
  • അക്കങ്ങൾ
  • വിലാസങ്ങൾ
  • ഉൽപ്പന്ന കോഡുകൾ
  • നിയമ റഫറൻസുകൾ
  • സൈറ്റേഷനുകൾ
  • പട്ടിക ലേബലുകൾ
  • യൂണിറ്റുകൾ
  • സമവാക്യങ്ങൾ
  • ക്യാപ്ഷനുകൾ
  • അടിക്കുറിപ്പുകൾ

റിസർച്ച്, അക്കാദമിക് ഫയലുകൾ എന്നിവയ്ക്കായി അക്കാദമിക് ഗവേഷണ പ്രബന്ധങ്ങൾ വിവർത്തനം ചെയ്യാനുള്ള ഗൈഡ് കൂടി വായിക്കുക, കാരണം സ്കാൻ ചെയ്ത അക്കാദമിക് PDF-കൾക്ക് OCR അപകടസാധ്യതയ്ക്കു പുറമേ സൈറ്റേഷൻ, ലേഔട്ട് എന്നിവയുമായി ബന്ധപ്പെട്ട അപകടസാധ്യതകളും ഉണ്ടാകും.

ഒപ്പം ഒപ്പമുള്ള പരാജയ ഉദാഹരണങ്ങൾ

OCR ഔട്ട്പുട്ട് പരിശോധിക്കുമ്പോൾ ഈ പട്ടിക ഉപയോഗിക്കുക.

ഒറിജിനൽ സ്കാനിൽ സാധ്യതയുള്ളത്തെറ്റായ OCR ഔട്ട്പുട്ട്അത് എന്തുകൊണ്ട് പ്രധാനമാണ്
modernmodemഅർത്ഥം പൂർണ്ണമായി മാറുന്നു.
Section 10Section IOനിയമപരമോ സാങ്കേതികമോ ആയ റഫറൻസുകൾ തകരാം.
20262O26തീയതികളും ID-കളും വിശ്വസനീയമല്ലാതാകുന്നു.
patientpatlentമെഡിക്കൽ അല്ലെങ്കിൽ സാങ്കേതിക പദങ്ങൾ തെറ്റിപ്പോകും.
രണ്ട് വേർതിരിച്ച കോളങ്ങൾലയിച്ച ഒരു പാരഗ്രാഫ്വിവർത്തനം വാക്യങ്ങളെ തെറ്റായ ക്രമത്തിൽ വായിക്കും.
ലേബലുകളും മൂല്യങ്ങളും ഉള്ള പട്ടിക വരികലർന്ന ടെക്സ്റ്റിന്റെ ഒറ്റ വരിഡാറ്റ ഇനി ശരിയായ ലേബലുമായി പൊരുത്തപ്പെടില്ല.
അടിക്കുറിപ്പ് മാർക്കർ 1അക്ഷരം lകുറിപ്പുകൾ തെറ്റായ വാക്യത്തോട് ചേർന്നേക്കാം.

OCR ലെയറിൽ ഇത്തരത്തിലുള്ള പിശകുകൾ കണ്ടാൽ, വിവർത്തനത്തിന് മുമ്പ് OCR ശരിയാക്കുക.

ഏത് ടൂൾ ഉപയോഗിക്കണം?

ഡോക്യുമെന്റിന്റെ ബുദ്ധിമുട്ടിനെ ആശ്രയിച്ചാണ് തിരഞ്ഞെടുക്കേണ്ടത്.

ഡോക്യുമെന്റ്ശുപാർശ ചെയ്യുന്ന വഴി
വൃത്തിയായ ബിസിനസ് സ്കാൻAcrobat അല്ലെങ്കിൽ മറ്റൊരു വിശ്വസനീയ OCR ടൂളിൽ OCR നടത്തുക, തുടർന്ന് PDF Translator ഉപയോഗിക്കുക.
പഴയ പുസ്തകത്തിന്റെ സ്കാൻചരിവ് തിരുത്തി കോൺട്രാസ്റ്റ് മെച്ചപ്പെടുത്തി, ശ്രദ്ധാപൂർവ്വം OCR നടത്തി, തുടർന്ന് വിവർത്തനം ചെയ്യുക.
അക്കാദമിക് പ്രബന്ധത്തിന്റെ സ്കാൻOCR നടത്തുക, സമവാക്യങ്ങൾ/സൈറ്റേഷനുകൾ/പട്ടികകൾ പരിശോധിക്കുക, തുടർന്ന് ലേഔട്ട് റിവ്യൂവോടെ വിവർത്തനം ചെയ്യുക.
കൈയെഴുത്ത് കുറിപ്പുകൾവിവർത്തനത്തിന് മുമ്പ് മാനുവൽ ട്രാൻസ്ക്രിപ്ഷൻ ആവശ്യമായേക്കാം.
ലളിതമായ വ്യക്തിപരമായ ഡോക്യുമെന്റ്സ്വകാര്യതാ അപകടസാധ്യത കുറവാണെങ്കിൽ ഓൺലൈൻ OCR മതിയായേക്കാം.
സെൻസിറ്റീവ് ഡോക്യുമെന്റ്ലോക്കൽ OCR അല്ലെങ്കിൽ നിയന്ത്രിതവും വിശ്വസനീയവുമായ വർക്ക്‌ഫ്ലോ ഉപയോഗിക്കുക.

വിപുലമായ ടൂൾ താരതമ്യം വേണമെങ്കിൽ, മികച്ച PDF വിവർത്തക ഗൈഡ് കാണുക.

സ്കാൻ ചെയ്ത PDF-കളിലെ സാധാരണ പ്രശ്നങ്ങൾ

കുറഞ്ഞ റെസല്യൂഷൻ പേജുകൾ

കുറഞ്ഞ റെസല്യൂഷനിലുള്ള സ്കാനുകൾ അക്ഷരങ്ങളെ പരസ്പരം കലർത്തിമങ്ങിക്കും. OCR rn-നെയും m-നെയും, cl-നെയും d-നെയും, അല്ലെങ്കിൽ വിരാമചിഹ്നങ്ങളെയും പൊടിക്കറകളെയും തമ്മിൽ കുഴയ്ക്കാം.

പരിഹാരം: സാധ്യമെങ്കിൽ വീണ്ടും സ്കാൻ ചെയ്യുക. അല്ലെങ്കിൽ കോൺട്രാസ്റ്റ് വർധിപ്പിച്ച് OCR വീണ്ടും പ്രവർത്തിപ്പിക്കുക.

ചരിഞ്ഞോ വളഞ്ഞോ ഉള്ള പേജുകൾ

പുസ്തക സ്കാനുകൾ പലപ്പോഴും ബൈൻഡിംഗിനടുത്ത് വളഞ്ഞിരിക്കും. OCR ആ വളഞ്ഞ വരികൾ ശരിയായി വായിക്കാതെ ടെക്സ്റ്റിന്റെ ക്രമം മാറ്റിയേക്കാം.

പരിഹാരം: പേജ് തട്ടാക്കി വീണ്ടും സ്കാൻ ചെയ്യുക, അല്ലെങ്കിൽ deskew, dewarping എന്നിവയുള്ള OCR ടൂൾ ഉപയോഗിക്കുക.

മൾട്ടി-കോളം ലേഔട്ട്

OCR ഇടത്, വലത് കോളങ്ങൾ ഒറ്റ ടെക്സ്റ്റ് പ്രവാഹമായി ലയിപ്പിച്ചേക്കാം.

പരിഹാരം: വിവർത്തനത്തിന് മുമ്പ് വായനാക്രമം പരിശോധിക്കുക. ഇവിടെ അക്കാദമിക് പ്രബന്ധങ്ങൾക്ക് പ്രത്യേക ശ്രദ്ധ വേണം.

പട്ടികകൾ

പട്ടികകൾ ബുദ്ധിമുട്ടാണ്, കാരണം OCR-ന് ടെക്സ്റ്റും ഘടനയും ഒരുപോലെ കണ്ടെത്തണം. കാഴ്ചയിൽ പട്ടിക ശരിയായതായി തോന്നിയാലും ടെക്സ്റ്റ് ലെയർ തെറ്റായിരിക്കാം.

പരിഹാരം: പട്ടികയിലെ OCR ടെക്സ്റ്റ് കോപ്പി ചെയ്ത് ലേബലുകളും മൂല്യങ്ങളും ഇപ്പോഴും പൊരുത്തപ്പെടുന്നുണ്ടോ എന്ന് ഉറപ്പാക്കുക.

കൈയെഴുത്തും ഒപ്പുകളും

പ്രിന്റ് ചെയ്ത ടെക്സ്റ്റിനായുള്ള OCR കൈയെഴുത്ത് തിരിച്ചറിയലിനെക്കാൾ ഏറെ വിശ്വസനീയമാണ്. കൈയെഴുത്തിലുള്ള അരികുകുറിപ്പുകൾ, ഒപ്പുകൾ, നിറച്ച ഫോമുകൾ എന്നിവ നഷ്ടപ്പെടുകയോ ഗർബിള്‍ ആകുകയോ ചെയ്യാം.

പരിഹാരം: പ്രധാനപ്പെട്ട കൈയെഴുത്ത് ഉള്ളടക്കം വിവർത്തനത്തിന് മുമ്പ് മാനുവലായി ട്രാൻസ്ക്രൈബ് ചെയ്യുക.

കലർന്ന ഭാഷകൾ

OCR സോഴ്‌സ് ഭാഷ അറിയുന്നപ്പോൾ ഏറ്റവും നല്ല രീതിയിൽ പ്രവർത്തിക്കുന്നു. ഇംഗ്ലീഷ്, ഫ്രഞ്ച്, ചൈനീസ് എന്നിവ ഒരുമിച്ചുള്ള സ്കാൻ, OCR ഒരു ഭാഷയ്ക്കു മാത്രം സജ്ജീകരിച്ചാൽ പരാജയപ്പെടാം.

പരിഹാരം: ടൂൾ പിന്തുണയ്ക്കുന്നുവെങ്കിൽ ബന്ധപ്പെട്ട എല്ലാ OCR ഭാഷകളും തിരഞ്ഞെടുക്കുക, തുടർന്ന് ഓരോ ഭാഷാ വിഭാഗവും പ്രത്യേകം പരിശോധിക്കുക.

സ്വകാര്യതയും സുരക്ഷയും പരിശോധിക്കാനുള്ള പട്ടിക

സ്കാൻ ചെയ്ത PDF എവിടെയെങ്കിലും അപ്ലോഡ് ചെയ്യുന്നതിന് മുമ്പ് ചോദിക്കുക:

  • ഡോക്യുമെന്റിൽ വ്യക്തിഗത ഡാറ്റയുണ്ടോ?
  • മെഡിക്കൽ, നിയമ, സാമ്പത്തിക, അക്കാദമിക്, അല്ലെങ്കിൽ പ്രസിദ്ധീകരിക്കാത്ത ഉള്ളടക്കം ഇതിൽ ഉൾപ്പെടുന്നുണ്ടോ?
  • ഇത് ക്ലയന്റ് കരാറിലോ സ്കൂൾ നയത്തിലോ ഉൾപ്പെടുന്നുണ്ടോ?
  • ഈ ഡോക്യുമെന്റിന് ഓൺലൈൻ OCR സേവനം ഉപയോഗിക്കാൻ അനുമതിയുണ്ടോ?
  • പകരം ലോക്കൽ വർക്ക്‌ഫ്ലോ വേണോ?
  • വിവർത്തനം ആവശ്യമില്ലാത്ത പേജുകൾ നീക്കം ചെയ്യാനാകുമോ?

സ്കാൻ ചെയ്ത PDF-കൾ സാധാരണയായി സെൻസിറ്റീവായിരിക്കും, കാരണം അവ കരാറുകൾ, ID-കൾ, ഫോമുകൾ, ഗവേഷണ ഡ്രാഫ്റ്റുകൾ, ആഭ്യന്തര ആർക്കൈവ്‌സ് എന്നിവയിൽ നിന്നാണ് വരുന്നത്. OCR അപ്ലോഡ് തീരുമാനം എടുക്കുമ്പോൾ, ഒറിജിനൽ ഡോക്യുമെന്റിനോടു നിങ്ങൾ കാണിക്കുന്ന അതേ ജാഗ്രത തന്നെ പുലർത്തുക.

FAQ

സ്കാൻ ചെയ്ത PDF എങ്ങനെ വിവർത്തനം ചെയ്യാം?

ആദ്യം ടെക്സ്റ്റ് ലെയർ സൃഷ്ടിക്കാൻ OCR പ്രവർത്തിപ്പിക്കുക, OCR ഔട്ട്പുട്ട് പരിശോധിക്കുക, തുടർന്ന് OCR-പ്രോസസ്സ് ചെയ്ത PDF PDF Translator ഉപയോഗിച്ച് വിവർത്തനം ചെയ്യുക. OCR റിവ്യൂ ഘട്ടം ഒഴിവാക്കരുത്.

എന്തുകൊണ്ട് Google Translate എന്റെ സ്കാൻ ചെയ്ത PDF വിവർത്തനം ചെയ്തില്ല?

PDF ചിത്രം മാത്രമുള്ളതായിരിക്കാം. ടെക്സ്റ്റ് ലെയർ ഇല്ലെങ്കിൽ, Google Translate-ന് എക്‌സ്‌ട്രാക്റ്റ് ചെയ്യാൻ ടെക്സ്റ്റ് ഉണ്ടാകില്ല. ആദ്യം OCR പ്രവർത്തിപ്പിക്കുക, തുടർന്ന് വിവർത്തനം ചെയ്യുക. Google-സ്പെസിഫിക് വർക്ക്‌ഫ്ലോ Google Translate PDF ഗൈഡ്-ൽ ഉൾപ്പെടുത്തിയിരിക്കുന്നു.

ChatGPT-ക്ക് സ്കാൻ ചെയ്ത PDF വിവർത്തനം ചെയ്യാമോ?

ഓരോ ചിത്രം അല്ലെങ്കിൽ എക്‌സ്‌ട്രാക്റ്റ് ചെയ്ത ടെക്സ്റ്റ് പ്രത്യേകം നോക്കുമ്പോൾ ChatGPT സഹായകരമായേക്കാം. പക്ഷേ, പല പേജുകളുള്ള സ്കാൻ ചെയ്ത PDF-യ്ക്ക് OCR-ും റിവ്യൂവും ഇപ്പോഴും ആവശ്യമാണ്. മുഴുവൻ ഡോക്യുമെന്റ് വർക്ക്‌ഫ്ലോയ്ക്ക്, ആദ്യം OCR പ്രവർത്തിപ്പിച്ച് ശേഷം PDF വിവർത്തന വർക്ക്‌ഫ്ലോ ഉപയോഗിക്കുക.

സ്കാൻ ചെയ്ത PDF-കൾക്കുള്ള ഏറ്റവും നല്ല OCR ടൂൾ ഏതാണ്?

അത് ഡോക്യുമെന്റിനെ ആശ്രയിച്ചിരിക്കുന്നു. പൊതുവായതും സങ്കീർണവുമായ സ്കാനുകൾക്കായി Acrobat, ABBYY-ശൈലിയിലുള്ള ടൂളുകൾ എന്നിവ ഉപകാരപ്പെടും. ലോക്കൽ ടെക്നിക്കൽ വർക്ക്‌ഫ്ലോകൾക്കായി Tesseract അല്ലെങ്കിൽ OCRmyPDF ഉപകാരപ്പെടും. ലളിതവും കുറഞ്ഞ അപകടസാധ്യതയുള്ള ഫയലുകൾക്കായി ഓൺലൈൻ OCR മതിയായേക്കാം, പക്ഷേ സ്വകാര്യതയും ഗുണനിലവാരവും വ്യത്യാസപ്പെടും.

OCR-ന് ഫോർമാറ്റിംഗ് സംരക്ഷിക്കാനാകുമോ?

OCR-ന് ടെക്സ്റ്റ് ലെയർ സൃഷ്ടിക്കാനും ചിലപ്പോഴൊക്കെ വായനാക്രമം വീണ്ടെടുക്കാനും കഴിയും, പക്ഷേ അതിനെ യഥാർത്ഥ വിവർത്തനം ചെയ്ത ലേഔട്ട് സംരക്ഷിക്കുന്നതുമായി ഒരുപോലെ കാണരുത്. OCR-ന് ശേഷം PDF വിവർത്തന വർക്ക്‌ഫ്ലോ ഉപയോഗിച്ച് ഔട്ട്പുട്ട് ഒറിജിനലുമായി താരതമ്യം ചെയ്ത് പരിശോധിക്കുക.

OCR ഗുണനിലവാരം മോശമാണെങ്കിൽ എന്ത് ചെയ്യണം?

വിവർത്തനത്തിന് മുമ്പ് സ്കാൻ മെച്ചപ്പെടുത്തുക. സാധ്യമെങ്കിൽ വീണ്ടും സ്കാൻ ചെയ്യുക, പേജുകളുടെ ചരിവ് തിരുത്തുക, കോൺട്രാസ്റ്റ് വർധിപ്പിക്കുക, അഴുക്കുകൾ ക്രോപ്പ് ചെയ്ത് നീക്കുക, ശരിയായ OCR ഭാഷ തിരഞ്ഞെടുക്കുക, പിന്നെ ബുദ്ധിമുട്ടുള്ള പേജുകൾ വീണ്ടും പരിശോധിക്കുക.