BookTranslator
BookTranslator

ස්කෑන් කළ PDF එකක් පරිවර්තනය කරන්නේ කෙසේද: සම්පූර්ණ OCR + පරිවර්තන මාර්ගෝපදේශය

ස්කෑන් කළ PDF වල තිබෙන්නේ සැබෑ පෙළ නොව, පෙළේ පින්තූරයයි — එබැවින් Google Translate එය වෙනස් නොකරම ආපසු දෙයි. මෙය නිවැරදි කරන OCR + AI ක්‍රියාදාමය මෙන්න.

BookTranslator

BookTranslator Team

පරිවර්තන මාර්ගෝපදේශ11 min read

ඉක්මන් පිළිතුර: ස්කෑන් කළ PDF එකක් පරිවර්තනය කිරීමට පෙර OCR අවශ්‍යයි

ස්කෑන් කළ PDF එකක් පරිවර්තනය කිරීමට, මුලින්ම පිටු රූප තේරිය හැකි පෙළ බවට හැරවීමට OCR ධාවනය කරන්න. ඉන්පසු PDF පරිවර්තකය වැනි ලේඛන පරිවර්තකයක් භාවිතයෙන් OCR-සකස් කළ PDF එක පරිවර්තනය කරන්න. ඔබ OCR පියවර මඟ හැරියොත්, බොහෝ පරිවර්තන මෙවලම් මුල් ගොනුව කිසි වෙනසක් නොකරම ආපසු දීමටත්, පිටු මඟ හැරීමටත්, නැතහොත් දැනටමත් පෙළ ස්තරයක් ඇති කොටස් පමණක් පරිවර්තනය කිරීමටත් ඉඩ ඇත.

මෙම ක්‍රියාදාමය භාවිතා කරන්න:

  1. PDF එක විවෘත කර වාක්‍යයක් තේරීමට උත්සාහ කරන්න.
  2. ඔබට පෙළ තේරිය නොහැකි නම්, OCR ධාවනය කරන්න.
  3. පරිවර්තනය කිරීමට පෙර OCR මඟින් උපුටාගත් පෙළ සමාලෝචනය කරන්න.
  4. OCR-සකස් කළ PDF එක PDF පරිවර්තකය වෙත උඩුගත කරන්න.
  5. පරිවර්තනය කළ ප්‍රතිදානය මුල් ස්කෑන් පිටපත සමඟ සසඳා බලන්න.

ඔබේ PDF එකේ දැනටමත් තේරිය හැකි පෙළ තිබේ නම් සහ ගැටලුව වන්නේ සැලැස්ම රැක ගැනීම නම්, ආකෘතිය අහිමි නොකර PDF එකක් පරිවර්තනය කිරීම පිළිබඳ මාර්ගෝපදේශය භාවිතා කරන්න.

ස්කෑන් කළ PDF පරිවර්තන මෙවලම් තුළ අසාර්ථක වන්නේ ඇයි

ස්කෑන් කළ PDF එකක් බොහෝවිට PDF බහාලුමක් තුළ ඇති පිටු රූප සමූහයක් පමණි. මිනිසෙකුට පිටුවේ වචන පෙනෙනවා විය හැක, නමුත් මෘදුකාංගයකට උපුටා ගත හැකි සැබෑ පෙළ ගොනුව තුළ නොතිබිය හැක.

එමඟින් ඉතා සරල අසාර්ථකත්වයක් ඇතිවේ:

ගොනු වර්ගයපරිවර්තකයට පෙනෙන්නේ කුමක්දසිදුවන්නේ කුමක්ද
පෙළ-පදනම් වූ PDFපෙළ සහ සැලැස්ම් දත්තපරිවර්තනය වහාම ආරම්භ කළ හැක.
රූප පමණක් ඇති ස්කෑන් PDFපිටුවල පින්තූරමුලින් OCR අවශ්‍ය වේ.
රූපයට උඩින් පෙළ ඇති PDFස්කෑන් රූපය සහ සැඟවුණු OCR පෙළ ස්තරයපරිවර්තනය කළ හැක, නමුත් OCR දෝෂ ගුණාත්මකත්වයට බලපායි.

වඩාත් ප්‍රයෝජනවත් පරීක්ෂණය තාක්ෂණික එකක් නොවේ:

  1. PDF එක විවෘත කරන්න.
  2. තනි වචන ඉස්මතු කිරීමට උත්සාහ කරන්න.
  3. වාක්‍යයක් පිටපත් කරන්න.
  4. එය පෙළ සංස්කාරකයකට අලවන්න.

වාක්‍යය නිවැරදිව අලවෙන්නේ නම්, PDF එකට පෙළ ස්තරයක් ඇත. කිසිවක් අලවෙන්නේ නැත්නම්, හෝ මුළු පිටුවම එකම රූපයක් ලෙස හැසිරෙන්නේ නම්, PDF එකට OCR අවශ්‍යයි.

OCR අත්‍යවශ්‍යයි

OCR යනු optical character recognition යන්නයි. එය රූපයකින් පෙළ කියවා, යන්ත්‍රයෙන් කියවිය හැකි පෙළ නිර්මාණය කරයි. PDF පරිවර්තනය සඳහා, OCR සාමාන්‍යයෙන් ස්කෑන් කළ පිටුවට උඩින් නොපෙනෙන පෙළ ස්තරයක් නිර්මාණය කරයි.

පරිවර්තනය සඳහා මූලාශ්‍රය වන්නේ එම පෙළ ස්තරයයි. OCR වැරදි කරන්නේ නම්, පරිවර්තනයත් එම වැරදි උරුම කරගනී.

සාමාන්‍ය OCR වැරදි:

OCR වැරද්දපරිවර්තන අවදානම
rn එක m ලෙස කියවීමවචනවල අර්ථය වෙනස් වේ.
1 එක l ලෙස කියවීමඅංක, යොමු, හෝ කේත වැරදි විය හැක.
O එක 0 ලෙස කියවීමID, සූත්‍ර, සහ නම් බිඳ වැටිය හැක.
උච්චාරණ ලකුණු අහිමි වීමනම් සහ පද නිවැරදි නොවේ.
තීරු එකට එකතු වීමවාක්‍ය වැරදි අනුපිළිවෙලින් පරිවර්තනය වේ.
වගු කොෂ වැරදි ලෙස පේළියෙන් පේළිය කියවීමදත්ත ලේබල් අගයන් සමඟ නොගැලපේ.
පාද සටහන් මූලික පෙළ ලෙස සැලකීමඋපුටා දැක්වීම් සහ සටහන් වැරදි සන්දර්භයට යයි.

ඒ නිසා OCR සමාලෝචන පියවර ඉතා වැදගත්. උපුටාගත් පෙළ ඔබ අහඹු ලෙස පරීක්ෂා කර නොබැලූ විට ස්කෑන් කළ ලේඛනයක් පරිවර්තනය නොකරන්න.

OCR-පළමුව ක්‍රියාදාමය

පියවර 1: PDF වර්ගය හඳුනා ගන්න

පෙළ තේරීමට උත්සාහ කරන්න. තේරීම ක්‍රියා කරන්නේ නම්, ඔබට OCR අවශ්‍ය නොවිය හැක. තේරීම අසාර්ථක නම්, ගොනුව රූප-පමණක් PDF එකක් ලෙස සලකන්න.

පිටුව දෘශ්‍යමය වශයෙන්ද පරීක්ෂා කරන්න:

  • වක්‍ර වූ පිටු ස්කෑන් එකක් බව සංकेत කරයි.
  • අළු කඩදාසි හැඩතල ස්කෑන් එකක් බව පෙන්වයි.
  • බයින්ඩ් කිරීම අසල සෙවණැලි තිබේ නම් එය ඡායාරූපගත කළ පොතක් විය හැක.
  • අසමාන ප්‍රතිවිරුද්ධතාවක් ෆොටෝකොපියක් බව පෙන්විය හැක.
  • දෘශ්‍යමාන වචන සෙවුමෙන් සොයාගත නොහැකි නම්, පෙළ ස්තරයක් නොමැති විය හැක.

පියවර 2: හැකි නම් ස්කෑන් ගුණාත්මකත්වය වැඩි දියුණු කරන්න

OCR ගුණාත්මකත්වය ආරම්භ වන්නේ රූප ගුණාත්මකත්වයෙන්. නැවත ස්කෑන් කළ හැකි නම්, OCR දෝෂ අලුත්වැඩියා කිරීමට කාලය වැය කිරීමට පෙර එය කරන්න.

මෙම රූප-ගුණාත්මකතා පිරික්සුම් ලැයිස්තුව භාවිතා කරන්න:

  • කුඩා පෙළ සඳහා ප්‍රමාණවත් විභේදනයකින් ස්කෑන් කරන්න.
  • පිටු සමතලා සහ සෘජුව තබා ගන්න.
  • බයින්ඩ් කිරීම අසල සෙවණැලි වලක්වන්න.
  • වගු අස, ඇඟිලි, හෝ පසුබිම් අවුල් ඉවත් වන ලෙස කපන්න.
  • පෙළ සහ පිටුව අතර ප්‍රබල ප්‍රතිවිරුද්ධතාවක් තබා ගන්න.
  • සම්පූර්ණ පෙළ පේළියම දෘශ්‍යමාන වන්න.
  • නිවැරදි පිටු දිශානතිය භාවිතා කරන්න.
  • අකුරු බොඳ වන තරම් රූපය අධික ලෙස සම්පීඩනය නොකරන්න.

පැරණි පොත් සහ ෆොටෝකොපි සඳහා, විශාලම ලාභ සාමාන්‍යයෙන් ලැබෙන්නේ deskew කිරීමෙන්, contrast නිවැරදි කිරීමෙන්, සහ focus නැති පිටු නැවත ස්කෑන් කිරීමෙන්.

පියවර 3: OCR ධාවනය කරන්න

ලේඛනය අනුව OCR මෙවලම තෝරන්න; වෙළඳ නාමය අනුව නොවේ.

OCR විකල්පයවඩාත් සුදුසු කුමකටදඅවධානය යොමු කළ යුතු දේ
Adobe Acrobat OCRසාමාන්‍ය ව්‍යාපාරික ස්කෑන් සහ PDF පිරිසිදු කිරීමඒ මත විශ්වාසය තැබීමට පෙර වත්මන් සැලසුම් ප්‍රවේශය පරීක්ෂා කරන්න.
ABBYY FineReaderසංකීර්ණ ස්කෑන්, වගු, තීරු, සහ අසීරු සැලැස්ම්තවමත් අතින් සමාලෝචනය අවශ්‍ය වේ.
Tesseract හෝ OCRmyPDFදේශීය, තාක්ෂණික, නැවත කළ හැකි OCR ක්‍රියාදාමcommand-line මෙවලම් ගැන පහසුකම අවශ්‍ය වේ.
Online OCR toolsඅඩු අවදානම් සහිත අහඹු ගොනුපෞද්ගලිකත්වය, ගොනු සීමා, සහ ගුණාත්මකත්වය වෙනස් වේ.
දුරකථන ස්කෑන් ඇප්ඉක්මනින් නව ස්කෑන් එකක් ග්‍රහණය කර ගැනීමperspective distortion එක OCR ගුණාත්මකත්වයට බලපායි.

පෞද්ගලික ගිවිසුම්, වෛද්‍ය වාර්තා, මූල්‍ය ලේඛන, ප්‍රකාශයට පත් නොකළ පිටපත්, හෝ සමාලෝචනය යටතේ ඇති ශාස්ත්‍රීය කෘති සඳහා, දේශීය OCR ක්‍රියාදාමයක් හෝ විශ්වාසදායී පරිසරයක් තෝරන්න. සංවේදී ස්කෑන් අහඹු නොමිලේ OCR අඩවිවලට උඩුගත නොකරන්න.

පියවර 4: OCR පෙළ සමාලෝචනය කරන්න

පරිවර්තනයට පෙර සමාලෝචනය කරන්න, පසුව නොවේ. අසීරු පිටු කිහිපයකින් පෙළ පිටපත් කර එය කියවිය හැකිදැයි පරීක්ෂා කරන්න.

පරීක්ෂා කළ යුතු නියැදි පිටු:

  • මාතෘකා පිටුව.
  • තද පෙළ ඇති මූලික අන්තර්ගත පිටුවක්.
  • වගු පිටුවක්.
  • පාද සටහන් ඇති පිටුවක්.
  • කුඩා පෙළ ඇති පිටුවක්.
  • මුද්‍රා, අත්අකුරු, හෝ පැති සටහන් ඇති පිටුවක්.
  • ලේඛනය බහුභාෂා නම්, සෑම භාෂාවකම පිටුවක්.

මෙවැනි දේ සොයන්න:

  • අහිමි වූ ඡේද.
  • එකට එකතු වූ තීරු.
  • බිඳුණු වචන.
  • වැරදි අක්ෂර.
  • අහිමි වූ diacritics.
  • අගයන්ගෙන් වෙන් වූ වගු ලේබල්.
  • මූලික පෙළ තුළ ඇතුල් වූ headers.
  • වාක්‍ය තුළ මිශ්‍ර වූ පිටු අංක.

OCR ගුණාත්මකත්වය දුර්වල නම්, පරිවර්තනයට පෙර එය නිවැරදි කරන්න. OCR කිසිවිටෙකත් අල්ලා නොගත් අර්ථය පරිවර්තකයෙකුට විශ්වාසනීය ලෙස නැවත ගොඩනැගිය නොහැක.

පියවර 5: OCR-සකස් කළ PDF එක පරිවර්තනය කරන්න

PDF එකට පිරිසිදු පෙළ ස්තරයක් ලැබුණු පසු, එය PDF පරිවර්තකය වෙත උඩුගත කරන්න. දැන් පරිවර්තන පියවරට පිටු රූප වෙනුවට පෙළ සමඟ කටයුතු කළ හැක.

පරිවර්තනයෙන් පසු, මෙය සසඳා බලන්න:

  • මුල් ස්කෑන් පිටපත
  • OCR පෙළ ස්තරය
  • පරිවර්තනය කළ PDF

මෙම තුන්-අංශ සමාලෝචනයක් දෝෂයක් OCR නිසාද, පරිවර්තනය නිසාද යන්න හඳුනා ගැනීමට උපකාරී වේ. OCR පෙළ වැරදි නම්, OCR නැවත ධාවනය කරන්න. OCR පෙළ නිවැරදි නමුත් පරිවර්තනය වැරදි නම්, පරිවර්තනය නිවැරදි කරන්න.

පියවර 6: ඉහළ අවදානම් අන්තර්ගතය සමාලෝචනය කරන්න

ස්කෑන් කළ ලේඛන බොහෝවිට සැලකිලිමත් සමාලෝචනයක් අවශ්‍ය වන අන්තර්ගතයම අඩංගු කරයි: පැරණි ගිවිසුම්, රාජ්‍ය ආකෘති, ශාස්ත්‍රීය ලිපි, අත්පොත්, ඓතිහාසික ලේඛන, සහ පොත් පිටු.

මෙම අයිතම අතින් සමාලෝචනය කරන්න:

  • නම්
  • දිනයන්
  • අංක
  • ලිපින
  • නිෂ්පාදන කේත
  • නීතිමය යොමු
  • උපුටා දැක්වීම්
  • වගු ලේබල්
  • ඒකක
  • සමීකරණ
  • captions
  • පාද සටහන්

පර්යේෂණ සහ ශාස්ත්‍රීය ගොනු සඳහා, ශාස්ත්‍රීය පර්යේෂණ ලිපි පරිවර්තනය කිරීම පිළිබඳ මාර්ගෝපදේශයද කියවන්න, මන්ද ස්කෑන් කළ ශාස්ත්‍රීය PDF වල OCR අවදානමට අමතරව citation සහ layout අවදානම්ද ඇත.

පැත්තෙන්-පැත්තෙන් අසාර්ථකතා උදාහරණ

OCR ප්‍රතිදානය සමාලෝචනය කරන අතරතුර මෙම වගුව භාවිතා කරන්න.

මුල් ස්කෑන් එකේ බොහෝවිට පෙන්වන්නේනරක OCR ප්‍රතිදානයඑය වැදගත් වන්නේ ඇයි
modernmodemඅර්ථය සම්පූර්ණයෙන්ම වෙනස් වේ.
Section 10Section IOනීතිමය හෝ තාක්ෂණික යොමු බිඳ වැටිය හැක.
20262O26දිනයන් සහ ID විශ්වාස කළ නොහැකි වේ.
patientpatlentවෛද්‍ය හෝ තාක්ෂණික පද වැරදි වේ.
වෙන්වූ තීරු දෙකක්එකට එක් වූ ඡේදයක්වාක්‍ය වැරදි අනුපිළිවෙලින් පරිවර්තනය වේ.
ලේබල් සහ අගයන් ඇති වගු පේළියක්මිශ්‍ර පෙළ ඇති එක් පේළියක්දත්ත තවදුරටත් නිවැරදි ලේබලයට නොගැලපේ.
පාද සටහන් සලකුණ 1අකුර lසටහන් වැරදි වාක්‍යයට සම්බන්ධ විය හැක.

ඔබට OCR ස්තරයේ මෙවැනි දෝෂ පෙනේ නම්, පරිවර්තනයට පෙර OCR නිවැරදි කරන්න.

ඔබ භාවිතා කළ යුතු මෙවලම කුමක්ද?

ලේඛනයේ අසීරුතාව අනුව තෝරන්න.

ලේඛනයනිර්දේශිත මාර්ගය
පිරිසිදු ව්‍යාපාරික ස්කෑන්Acrobat හෝ වෙනත් විශ්වාසදායී OCR මෙවලමක OCR ධාවනය කර, ඉන්පසු PDF පරිවර්තකය.
පැරණි පොත් ස්කෑන්deskew කර contrast වැඩි දියුණු කර, OCR සැලකිලිමත්ව ධාවනය කර, පසුව පරිවර්තනය කරන්න.
ශාස්ත්‍රීය ලිපි ස්කෑන්OCR ධාවනය කර, සමීකරණ/උපුටා දැක්වීම්/වගු සමාලෝචනය කර, පසුව layout සමාලෝචනය සමඟ පරිවර්තනය කරන්න.
අත්අකුරු සටහන්පරිවර්තනයට පෙර අතින් පිටපත් කිරීම අවශ්‍ය විය හැක.
සරල පුද්ගලික ලේඛනයපෞද්ගලිකත්ව අවදානම අඩු නම් Online OCR පිළිගත හැක.
සංවේදී ලේඛනයදේශීය OCR හෝ විශ්වාසදායී පාලිත ක්‍රියාදාමයක් භාවිතා කරන්න.

ඔබට වඩා පුළුල් මෙවලම් සැසඳීමක් අවශ්‍ය නම්, හොඳම PDF පරිවර්තන මෙවලම් මාර්ගෝපදේශය බලන්න.

ස්කෑන් කළ PDF වල සාමාන්‍ය ගැටලු

අඩු විභේදන පිටු

අඩු විභේදන ස්කෑන් අකුරු එකට බොඳ කරයි. OCR එකට rn සහ m, cl සහ d, හෝ විරාම ලකුණු සහ දූවිලි අතර ව්‍යාකූලත්වය ඇති විය හැක.

විසඳුම: හැකි නම් නැවත ස්කෑන් කරන්න. එසේ නොමැති නම් contrast වැඩි කර නැවත OCR උත්සාහ කරන්න.

වක්‍ර හෝ ඇල වූ පිටු

පොත් ස්කෑන් බොහෝවිට බයින්ඩ් කිරීම අසල වක්‍ර වේ. OCR වක්‍ර පේළි දුර්වල ලෙස කියවයි, සහ පෙළ අනුපිළිවෙල වෙනස් කළ හැක.

විසඳුම: පිටුව සමතලා කරන්න, නැවත ස්කෑන් කරන්න, හෝ deskew සහ dewarping සහිත OCR මෙවලමක් භාවිතා කරන්න.

බහු-තීරු සැලැස්ම

OCR එකට වම් සහ දකුණු තීරු එකම වාක්‍ය ප්‍රවාහයකට එකතු කළ හැක.

විසඳුම: පරිවර්තනයට පෙර කියවීමේ අනුපිළිවෙල පරීක්ෂා කරන්න. ශාස්ත්‍රීය ලිපි මෙහි විශේෂ අවධානයක් අවශ්‍ය කරයි.

වගු

OCR සඳහා වගු අසීරු ය, මන්ද එය පෙළත් ව්‍යුහයත් දෙකම හඳුනාගත යුතු නිසාය. දෘශ්‍යමය වශයෙන් වගුව නිවැරදි ලෙස පෙනුනත්, පෙළ ස්තරය වැරදි විය හැක.

විසඳුම: වගුවෙන් OCR පෙළ පිටපත් කර, ලේබල් තවමත් අගයන් සමඟ ගැලපේදැයි තහවුරු කරන්න.

අත්අකුරු සහ අත්සන්

මුද්‍රිත පෙළ සඳහා OCR, අත්අකුරු හඳුනාගැනීමට වඩා බොහෝ විශ්වාසදායී වේ. අත්අකුරු පැති සටහන්, අත්සන්, සහ පුරවූ ආකෘති මඟ හැරීමට හෝ විකෘති වීමට ඉඩ ඇත.

විසඳුම: පරිවර්තනයට පෙර අත්‍යවශ්‍ය අත්අකුරු අතින් පිටපත් කරන්න.

මිශ්‍ර භාෂා

OCR එක මූලාශ්‍ර භාෂාව දන්නා විට වඩාත් හොඳින් ක්‍රියා කරයි. ඉංග්‍රීසි, ප්‍රංශ, සහ චීන භාෂා එකට ඇති ස්කෑන් එකක් OCR එක භාෂාවක් එකකට පමණක් සකසා තිබේ නම් අසාර්ථක විය හැක.

විසඳුම: මෙවලම සහය දක්වන්නේ නම් අදාළ OCR භාෂා සියල්ලම තෝරන්න, ඉන්පසු සෑම භාෂා අංශයක්ම අහඹු ලෙස පරීක්ෂා කරන්න.

පෞද්ගලිකත්වය සහ ආරක්ෂාව පිළිබඳ පිරික්සුම් ලැයිස්තුව

ස්කෑන් කළ PDF එකක් ඕනෑම තැනකට උඩුගත කිරීමට පෙර, ඔබම මෙසේ අසන්න:

  • ලේඛනයේ පුද්ගලික දත්ත තිබේද?
  • එහි වෛද්‍ය, නීතිමය, මූල්‍ය, ශාස්ත්‍රීය, හෝ ප්‍රකාශයට පත් නොකළ ද්‍රව්‍ය ඇතුළත්ද?
  • එය ගනුදෙනුකරුවෙකුගේ ගිවිසුමකින් හෝ පාසල් ප්‍රතිපත්තියකින් ආවරණය වී තිබේද?
  • මෙම ලේඛනය සඳහා online OCR සේවාවක් භාවිතා කිරීමට අවසර තිබේද?
  • ඒ වෙනුවට ඔබට දේශීය ක්‍රියාදාමයක් අවශ්‍යද?
  • පරිවර්තනය අවශ්‍ය නොවන පිටු ඉවත් කළ හැකිද?

ස්කෑන් කළ PDF බොහෝවිට සංවේදී වන අතර, ඒවා ගිවිසුම්, හැඳුනුම්පත්, ආකෘති, පර්යේෂණ කෙටුම්පත්, සහ අභ්‍යන්තර ලේඛනගාර වලින් පැමිණෙන නිසාය. OCR උඩුගත කිරීමේ තීරණ, මුල් ලේඛනය සම්බන්ධයෙන් ඔබ ගන්නා ප්‍රවේශයෙන්ම සලකන්න.

FAQ

ස්කෑන් කළ PDF එකක් පරිවර්තනය කරන්නේ කෙසේද?

මුලින් OCR ධාවනය කර පෙළ ස්තරයක් සාදන්න, OCR ප්‍රතිදානය සමාලෝචනය කරන්න, ඉන්පසු OCR-සකස් කළ PDF එක PDF පරිවර්තකය සමඟ පරිවර්තනය කරන්න. OCR සමාලෝචන පියවර මඟ හැරිය නොහැක.

Google Translate මගේ ස්කෑන් කළ PDF එක පරිවර්තනය නොකළේ ඇයි?

PDF එක රූප-පමණක් විය හැක. පෙළ ස්තරයක් නොමැති නම්, Google Translate ට උපුටා ගැනීමට පෙළක් නොමැත. මුලින් OCR භාවිතා කර, පසුව පරිවර්තනය කරන්න. Google-විශේෂිත ක්‍රියාදාමය Google Translate PDF මාර්ගෝපදේශය තුළ ආවරණය කර ඇත.

ChatGPT එකට ස්කෑන් කළ PDF එකක් පරිවර්තනය කළ හැකිද?

ChatGPT එකට තනි රූප හෝ උපුටාගත් පෙළ සඳහා උදව් කළ හැක, නමුත් පිටු ගණනාවක් ඇති ස්කෑන් කළ PDF එකකට තවමත් OCR සහ සමාලෝචනය අවශ්‍ය වේ. සම්පූර්ණ ලේඛන ක්‍රියාදාමයක් සඳහා, මුලින් OCR, පසුව PDF පරිවර්තන ක්‍රියාදාමයක් භාවිතා කරන්න.

ස්කෑන් කළ PDF සඳහා හොඳම OCR මෙවලම කුමක්ද?

එය ලේඛනය මත රඳා පවතී. Acrobat සහ ABBYY-වර්ගයේ මෙවලම් සාමාන්‍ය සහ සංකීර්ණ ස්කෑන් සඳහා ප්‍රයෝජනවත් වේ. Tesseract හෝ OCRmyPDF දේශීය තාක්ෂණික ක්‍රියාදාම සඳහා ප්‍රයෝජනවත් වේ. අඩු අවදානම් සහිත සරල ගොනු සඳහා Online OCR සුදුසු විය හැකි නමුත්, පෞද්ගලිකත්වය සහ ගුණාත්මකත්වය වෙනස් වේ.

OCR එකට formatting රැකගත හැකිද?

OCR එකට පෙළ ස්තරයක් සෑදීමටත්, සමහරවිට කියවීමේ අනුපිළිවෙල නැවත ලබා දීමටත් හැක, නමුත් එය මුල් පරිවර්තනය කළ layout එක රැක ගැනීම හා සමාන නොවේ. OCR පසු, PDF පරිවර්තන ක්‍රියාදාමයක් භාවිතා කර, ප්‍රතිදානය මුල් ගොනුව සමඟ සසඳා සමාලෝචනය කරන්න.

OCR ගුණාත්මකත්වය නරක නම් කුමක් කළ යුතුද?

පරිවර්තනයට පෙර ස්කෑන් එක වැඩි දියුණු කරන්න. හැකි නම් නැවත ස්කෑන් කරන්න, පිටු deskew කරන්න, contrast වැඩි කරන්න, අවුල් කොටස් කපන්න, නිවැරදි OCR භාෂාව තෝරන්න, සහ අසීරු පිටු නැවත සමාලෝචනය කරන්න.