BookTranslator
BookTranslator

ስካን የተደረገ PDFን እንዴት መተርጎም ይቻላል፡ ሙሉው የOCR + ትርጉም መመሪያ

ስካን የተደረጉ PDFዎች እውነተኛ ጽሑፍ ሳይሆን የጽሑፍ ምስሎችን ይይዛሉ — ለዚህ ነው Google Translate ሳይቀይራቸው የሚመልሳቸው። ይህን የሚያስተካክለው የOCR + AI ሂደት ይህ ነው።

BookTranslator

BookTranslator Team

የትርጉም መመሪያዎች10 min read

ፈጣን መልስ፡ ስካን የተደረገ PDF ከትርጉም በፊት OCR ይፈልጋል

ስካን የተደረገ PDF ለመተርጎም መጀመሪያ የገጹን ምስሎች ወደ ሊመረጥ የሚችል ጽሑፍ ለመቀየር OCR ያሂዱ። ከዚያ በኋላ በOCR የተሠራበትን PDF እንደ PDF ተርጓሚ ያለ የሰነድ ትርጉም መሣሪያ በመጠቀም ይተርጉሙት። OCRን ከዘለሉ ብዙ የትርጉም መሣሪያዎች ዋናውን ፋይል ሳይቀይሩ ይመልሳሉ፣ ገጾችን ያልፋሉ፣ ወይም አስቀድሞ የጽሑፍ ንብርብር ያላቸውን ክፍሎች ብቻ ይተረጉማሉ።

ይህን የሥራ ሂደት ይጠቀሙ፡

  1. PDFውን ይክፈቱ እና አንድ አረፍተ ነገር ለመምረጥ ይሞክሩ።
  2. ጽሑፉን መምረጥ ካልቻሉ OCR ያሂዱ።
  3. ከመተርጎምዎ በፊት የOCR ጽሑፉን ይገምግሙ።
  4. በOCR የተሠራበትን PDF ወደ PDF ተርጓሚ ይስቀሉ።
  5. የተተረጎመውን ውጤት ከዋናው ስካን ጋር ያረጋግጡ።

PDFዎ አስቀድሞ ሊመረጥ የሚችል ጽሑፍ ካለው እና ችግሩ አቀማመጥን ማቆየት ከሆነ፣ ቅርጸት ሳይጠፋ PDF መተርጎም የሚለውን መመሪያ ይጠቀሙ።

ስካን የተደረጉ PDFዎች በትርጉም መሣሪያዎች ውስጥ ለምን ይከሽፋሉ

ስካን የተደረገ PDF ብዙ ጊዜ በPDF ኮንቴይነር ውስጥ የተቀመጡ የገጽ ምስሎች ስብስብ ብቻ ነው። ገጹ ለሰው ቃላትን ሊያሳይ ይችላል፣ ነገር ግን ፋይሉ ሶፍትዌር የሚያወጣውን እውነተኛ ጽሑፍ ላይይዝ ይችላል።

ይህ ቀላል ውድቀት ይፈጥራል፡

የፋይሉ አይነትተርጓሚው የሚያየውየሚከሰተው
በጽሑፍ የተመሠረተ PDFጽሑፍ ከአቀማመጥ ውሂብ ጋርትርጉም ወዲያውኑ ሊጀምር ይችላል።
ምስል-ብቻ የሆነ ስካን PDFየገጾች ምስሎችመጀመሪያ OCR ያስፈልጋል።
በምስል ላይ ጽሑፍ ያለበት PDFየስካን ምስል ከተሰወረ የOCR ጽሑፍ ንብርብር ጋርትርጉም ሊሰራ ይችላል፣ ነገር ግን የOCR ስህተቶች ጥራቱን ይጎዳሉ።

በጣም ጠቃሚው ፈተና ቴክኒካዊ አይደለም፡

  1. PDFውን ይክፈቱ።
  2. ብቻቸውን ቃላት ለማድመቅ ይሞክሩ።
  3. አንድ አረፍተ ነገር ይቅዱ።
  4. ወደ የጽሑፍ አርታኢ ይለጥፉት።

አረፍተ ነገሩ በትክክል ከተለጠፈ፣ PDFው የጽሑፍ ንብርብር አለው። ምንም ካልተለጠፈ ወይም ሙሉ ገጹ እንደ አንድ ምስል ከተሰራ፣ PDFው OCR ይፈልጋል።

OCR አማራጭ አይደለም

OCR ማለት optical character recognition ነው። ይህም ከምስል ውስጥ ጽሑፍን ያነባል እና ለማሽን የሚነበብ ጽሑፍ ይፈጥራል። ለPDF ትርጉም፣ OCR ብዙ ጊዜ በተስካነው ገጽ ላይ የማይታይ የጽሑፍ ንብርብር ይፈጥራል።

ያ የጽሑፍ ንብርብር ለትርጉም መነሻ ይሆናል። OCR ስህተት ካደረገ፣ ትርጉሙ እነዚያን ስህተቶች ይወርሳል።

የተለመዱ የOCR ስህተቶች፡

የOCR ስህተትየትርጉም አደጋ
rn እንደ m መነበብቃላት ትርጉማቸውን ይቀይራሉ።
1 እንደ l መነበብቁጥሮች፣ ማጣቀሻዎች ወይም ኮዶች ስህተት ይሆናሉ።
O እንደ 0 መነበብIDዎች፣ ፎርሙላዎች እና ስሞች ሊበላሹ ይችላሉ።
አክሰንቶች መጥፋትስሞች እና ቃላት ትክክለኛ አይሆኑም።
አምዶች መቀላቀልአረፍተ ነገሮች በተሳሳተ ቅደም ተከተል ይተረጎማሉ።
የሰንጠረዥ ህዋሶች በተሳሳተ ሁኔታ ረድፍ በረድፍ መነበብየውሂብ መለያዎች ከእሴቶች ጋር አይዛመዱም።
የግርጌ ማስታወሻዎችን እንደ ዋና ጽሑፍ መውሰድማጣቀሻዎች እና ማስታወሻዎች ወደ ተሳሳተ አውድ ይገባሉ።

ስለዚህ የOCR ክለሳ ደረጃ ጠቃሚ ነው። የተወሰደውን ጽሑፍ በነጥብ ነጥብ ሳያረጋግጡ ስካን የተደረገ ሰነድ አትተርጉሙ።

OCR-መጀመሪያ የሥራ ሂደት

ደረጃ 1፡ የPDFውን አይነት ይለዩ

ጽሑፍ ለመምረጥ ይሞክሩ። ምርጫው ከሰራ፣ OCR ላያስፈልግዎ ይችላል። ምርጫው ካልሰራ፣ ፋይሉን እንደ ምስል-ብቻ ይቆጥሩት።

ገጹን በእይታም ይመልከቱ፡

  • የተጣመመ ገጽ ስካን መሆኑን ይጠቁማል።
  • ግራጫ የወረቀት ሸካራነት ስካን መሆኑን ይጠቁማል።
  • ከመጽሐፉ ጀርባ አጠገብ ያሉ ጥላዎች በካሜራ የተነሳ መጽሐፍ መሆኑን ይጠቁማሉ።
  • ያልተመጣጠነ ኮንትራስት ፎቶኮፒ መሆኑን ይጠቁማል።
  • ፍለጋ የሚታዩ ቃላትን ካላገኘ፣ የጽሑፍ ንብርብር እንደሌለ ይጠቁማል።

ደረጃ 2፡ ከተቻለ ስካኑን ያሻሽሉ

የOCR ጥራት ከምስል ጥራት ይጀምራል። እንደገና መስካን ከቻሉ፣ የOCR ስህተቶችን ለማስተካከል ጊዜ ከማባከንዎ በፊት ያድርጉት።

ይህን የምስል ጥራት ዝርዝር ይጠቀሙ፡

  • ትንንሽ ጽሑፍን ለማንበብ በቂ ጥራት ላይ ይስካኑ።
  • ገጾቹን ጠፍጣፋ እና ቀጥ አድርጉ።
  • ከጀርባ አጠገብ ያሉ ጥላዎችን ያስወግዱ።
  • የሰንጠረዥ ዳርቻዎችን፣ ጣቶችን ወይም የጀርባ ብክለትን ይከርጹ።
  • በጽሑፍ እና በገጹ መካከል ከፍተኛ ኮንትራስት ይጠቀሙ።
  • ሙሉ መስመሩ እንዲታይ ያድርጉ።
  • ትክክለኛውን የገጽ አቅጣጫ ይጠቀሙ።
  • ፊደሎቹ እስኪደበዝዙ ድረስ ምስሉን እጅግ አትጨቁኑ።

ለአሮጌ መጻሕፍት እና ፎቶኮፒዎች፣ ትልቁ ማሻሻያ አብዛኛውን ጊዜ ከገጽ ማቀናን (deskewing)፣ ኮንትራስት ማስተካከል እና ከፎከስ ውጭ የሆኑ ገጾችን እንደገና መስካን ይመጣል።

ደረጃ 3፡ OCR ያሂዱ

የOCR መሣሪያ ሲመርጡ በብራንድ ላይ ሳይሆን በሰነዱ ላይ ይመርኮዙ።

የOCR አማራጭለምን ይሻላልየሚጠነቀቁበት
Adobe Acrobat OCRአጠቃላይ የቢዝነስ ስካኖች እና PDF ማጽዳትበእሱ ላይ ከመመርኮዝዎ በፊት የአሁኑን ፕላን መዳረሻ ያረጋግጡ።
ABBYY FineReaderውስብስብ ስካኖች፣ ሰንጠረዦች፣ አምዶች እና አስቸጋሪ አቀማመጦችአሁንም በእጅ ክለሳ ያስፈልጋል።
Tesseract or OCRmyPDFአካባቢያዊ፣ ቴክኒካዊ እና ደጋግሞ ሊተገበሩ የሚችሉ የOCR የሥራ ሂደቶችበcommand-line መሣሪያዎች ላይ ልምድ ይፈልጋል።
የመስመር ላይ OCR መሣሪያዎችአደጋ ዝቅተኛ የሆኑ አልፎ አልፎ ፋይሎችግላዊነት፣ የፋይል ገደቦች እና ጥራት ይለያያሉ።
የስልክ ስካን መተግበሪያዎችአዲስ ስካን በፍጥነት ለመያዝየእይታ መጣመም OCRን ሊጎዳ ይችላል።

ለግል ውሎች፣ የሕክምና መዝገቦች፣ የፋይናንስ ሰነዶች፣ ያልታተሙ የእጅ ጽሑፎች፣ ወይም በግምገማ ላይ ላለ አካዳሚክ ሥራ፣ የአካባቢያዊ OCR የሥራ ሂደት ወይም የሚታመን አካባቢ ይመርጡ። ስሜታዊ ስካኖችን ወደ ማንኛውም የነፃ OCR ድረ-ገጽ አትጫኑ።

ደረጃ 4፡ የOCR ጽሑፉን ይገምግሙ

ከትርጉም በፊት ይገምግሙ፣ ከዚያ በኋላ አይደለም። ከብዙ አስቸጋሪ ገጾች ጽሑፍ ይቅዱ እና ሊነበብ እንደሚችል ያረጋግጡ።

ለመመርመር የሚገቡ ናሙና ገጾች፡

  • የርዕስ ገጹ።
  • ጥቅጥቅ ያለ ዋና ጽሑፍ ያለበት ገጽ።
  • የሰንጠረዥ ገጽ።
  • የግርጌ ማስታወሻ ያለበት ገጽ።
  • ትንሽ ጽሑፍ ያለበት ገጽ።
  • ማህተሞች፣ የእጅ ጽሑፍ ወይም የዳር ማስታወሻዎች ያሉበት ገጽ።
  • ሰነዱ ብዙ ቋንቋ ከሆነ በእያንዳንዱ ቋንቋ ያለ ገጽ።

የሚፈልጉት፡

  • የጠፉ አንቀጾች።
  • የተቀላቀሉ አምዶች።
  • የተቆራረጡ ቃላት።
  • የተሳሳቱ ቁምፊዎች።
  • የጠፉ ዳይአክሪቲክሶች።
  • የሰንጠረዥ መለያዎች ከእሴቶች መለየት።
  • ራስጌዎች ወደ ዋና ጽሑፍ መግባት።
  • የገጽ ቁጥሮች ወደ አረፍተ ነገሮች መቀላቀል።

የOCR ጥራት ደካማ ከሆነ ከትርጉም በፊት ያስተካክሉት። OCR በፍፁም ያልያዘውን ትርጉም አንድ ተርጓሚ በእርግጥ መመለስ አይችልም።

ደረጃ 5፡ በOCR የተሠራበትን PDF ይተርጉሙ

PDFው ንጹህ የጽሑፍ ንብርብር ካገኘ በኋላ ወደ PDF ተርጓሚ ይስቀሉት። አሁን የትርጉም ደረጃው ከገጽ ምስሎች ይልቅ በጽሑፍ ላይ ሊሰራ ይችላል።

ከትርጉም በኋላ የሚከተሉትን ያወዳድሩ፡

  • ዋናው ስካን
  • የOCR ጽሑፍ ንብርብር
  • የተተረጎመው PDF

ይህ የሶስት-አቅጣጫ ክለሳ ስህተቱ ከOCR ወይስ ከትርጉም እንደመጣ ለመለየት ይረዳዎታል። የOCR ጽሑፉ ስህተት ካለበት OCRን እንደገና ያሂዱ። የOCR ጽሑፉ ትክክል ነገር ግን ትርጉሙ ስህተት ከሆነ ትርጉሙን ያስተካክሉ።

ደረጃ 6፡ ከፍተኛ አደጋ ያለበትን ይዘት ይገምግሙ

ስካን የተደረጉ ሰነዶች ብዙ ጊዜ በጥንቃቄ ክለሳ የሚፈልገውን ይዘት ይይዛሉ፡ አሮጌ ውሎች፣ የመንግስት ቅጾች፣ አካዳሚክ ጽሑፎች፣ መመሪያዎች፣ ታሪካዊ ሰነዶች እና የመጽሐፍ ገጾች።

እነዚህን ነገሮች በእጅ ይገምግሙ፡

  • ስሞች
  • ቀኖች
  • ቁጥሮች
  • አድራሻዎች
  • የምርት ኮዶች
  • ሕጋዊ ማጣቀሻዎች
  • ማጣቀሻዎች
  • የሰንጠረዥ መለያዎች
  • መለኪያ አሃዶች
  • ፎርሙላዎች
  • መግለጫ ጽሑፎች
  • የግርጌ ማስታወሻዎች

ለምርምር እና ለአካዳሚክ ፋይሎች፣ የአካዳሚክ ምርምር ወረቀቶችን መተርጎም የሚለውን መመሪያ ደግሞ ያንብቡ፣ ምክንያቱም ስካን የተደረጉ አካዳሚክ PDFዎች በOCR አደጋ ላይ ተጨማሪ የማጣቀሻ እና የአቀማመጥ አደጋዎችን ያመጣሉ።

ከጎን-ለጎን የውድቀት ምሳሌዎች

የOCR ውጤትን ሲገምግሙ ይህን ሰንጠረዥ ይጠቀሙ።

ዋናው ስካን ምናልባት የሚያሳየውመጥፎ የOCR ውጤትለምን አስፈላጊ ነው
modernmodemትርጉሙ ሙሉ በሙሉ ይቀየራል።
Section 10Section IOሕጋዊ ወይም ቴክኒካዊ ማጣቀሻዎች ሊበላሹ ይችላሉ።
20262O26ቀኖች እና IDዎች የማይታመኑ ይሆናሉ።
patientpatlentየሕክምና ወይም ቴክኒካዊ ቃላት ይሳሳታሉ።
ሁለት የተለዩ አምዶችአንድ የተቀላቀለ አንቀጽትርጉሙ አረፍተ ነገሮችን በተሳሳተ ቅደም ተከተል ያነባል።
መለያዎችና እሴቶች ያሉት የሰንጠረዥ ረድፍየተቀላቀለ ጽሑፍ ያለበት አንድ መስመርውሂቡ ከትክክለኛው መለያ ጋር አይዛመድም።
የግርጌ ማስታወሻ ምልክት 1ፊደል lማስታወሻዎች ከተሳሳተ አረፍተ ነገር ጋር ሊጣመሩ ይችላሉ።

እነዚህን ስህተቶች በOCR ንብርብር ውስጥ ካዩ፣ ከመተርጎም በፊት OCRን ያስተካክሉ።

የትኛውን መሣሪያ መጠቀም አለብዎት?

እንደ ሰነዱ አስቸጋሪነት ይምረጡ።

ሰነድየሚመከረው መንገድ
ንጹህ የቢዝነስ ስካንOCRን በAcrobat ወይም በሌላ የሚታመን OCR መሣሪያ ያሂዱ፣ ከዚያ PDF ተርጓሚ ይጠቀሙ።
የአሮጌ መጽሐፍ ስካንገጹን አቀናን እና ኮንትራስቱን ያሻሽሉ፣ OCRን በጥንቃቄ ያሂዱ፣ ከዚያ ይተርጉሙ።
የአካዳሚክ ወረቀት ስካንOCR ያሂዱ፣ ፎርሙላዎችን/ማጣቀሻዎችን/ሰንጠረዦችን ይገምግሙ፣ ከዚያ ከአቀማመጥ ክለሳ ጋር ይተርጉሙ።
በእጅ የተጻፉ ማስታወሻዎችከትርጉም በፊት በእጅ መቅዳት ሊያስፈልግ ይችላል።
ቀላል የግል ሰነድየግላዊነት አደጋ ዝቅተኛ ከሆነ የመስመር ላይ OCR ተቀባይነት ሊኖረው ይችላል።
ስሜታዊ ሰነድየአካባቢያዊ OCR ወይም የሚታመን የተቆጣጠረ የሥራ ሂደት ይጠቀሙ።

ሰፊውን የመሣሪያ ንጽጽር ከፈለጉ፣ ምርጥ የPDF ተርጓሚ መመሪያ ይመልከቱ።

የተለመዱ የስካን PDF ችግሮች

ዝቅተኛ ጥራት ያላቸው ገጾች

ዝቅተኛ ጥራት ያላቸው ስካኖች ፊደሎችን እርስ በርስ ያደበዝዛሉ። OCR rnን ከ mclን ከ d፣ ወይም ሥርዓተ-ነጥብን ከአቧራ ጋር ሊያበላሽ ይችላል።

መፍትሄ፡ ከተቻለ እንደገና ይስካኑ። ካልተቻለ፣ ኮንትራስቱን ያሳድጉ እና OCRን እንደገና ይሞክሩ።

የተጣመመ ወይም የተጠማዘዘ ገጽ

የመጽሐፍ ስካኖች ብዙ ጊዜ ከጀርባው አጠገብ ይጠማዘዛሉ። OCR እነዚህን የተጠማዘዙ መስመሮች በደካማ ሁኔታ ያነባቸዋል እና ጽሑፉን እንደገና ሊያደራጅ ይችላል።

መፍትሄ፡ ገጹን ጠፍጣፋ ያድርጉ፣ እንደገና ይስካኑ፣ ወይም deskew እና dewarping ያለው የOCR መሣሪያ ይጠቀሙ።

ብዙ-አምድ አቀማመጥ

OCR የግራና የቀኝ አምዶችን ወደ አንድ የአረፍተ ነገር ፍሰት ሊያቀላቅል ይችላል።

መፍትሄ፡ ከትርጉም በፊት የንባብ ቅደም ተከተሉን ያረጋግጡ። አካዳሚክ ጽሑፎች በተለይ እዚህ ጥንቃቄ ያስፈልጋቸዋል።

ሰንጠረዦች

ሰንጠረዦች ከባድ ናቸው፣ ምክንያቱም OCR ጽሑፉንም መዋቅሩንም መለየት አለበት። ሰንጠረዥ በእይታ ትክክል ሊታይ ይችላል፣ ነገር ግን የጽሑፍ ንብርብሩ ስህተት ሊሆን ይችላል።

መፍትሄ፡ የOCR ጽሑፉን ከሰንጠረዡ ይቅዱ እና መለያዎቹ ከእሴቶቹ ጋር አሁንም እንደሚዛመዱ ያረጋግጡ።

የእጅ ጽሑፍ እና ፊርማዎች

የታተመ ጽሑፍ OCR ከየእጅ ጽሑፍ መለየት የበለጠ የሚታመን ነው። በእጅ የተጻፉ የጎን ማስታወሻዎች፣ ፊርማዎች እና የተሞሉ ፎርሞች ሊታለፉ ወይም ሊበላሹ ይችላሉ።

መፍትሄ፡ አስፈላጊ የእጅ ጽሑፍን ከትርጉም በፊት በእጅ ይቅዱ።

የተቀላቀሉ ቋንቋዎች

OCR የመነሻ ቋንቋውን ሲያውቅ በጣም ጥሩ ይሰራል። እንግሊዝኛ፣ ፈረንሳይኛ እና ቻይንኛ ያሉበት ስካን OCR አንድ ቋንቋ ብቻ ከተቀናበረ ሊወድቅ ይችላል።

መፍትሄ፡ መሣሪያው የሚደግፍ ከሆነ ሁሉንም ተዛማጅ የOCR ቋንቋዎች ይምረጡ፣ ከዚያ የእያንዳንዱን ቋንቋ ክፍል በነጥብ ነጥብ ያረጋግጡ።

የግላዊነት እና ደህንነት ዝርዝር

ስካን የተደረገ PDF ወዴትም ከመስቀልዎ በፊት እነዚህን ይጠይቁ፡

  • ሰነዱ የግል መረጃ ይዟል?
  • የሕክምና፣ የሕግ፣ የፋይናንስ፣ አካዳሚክ ወይም ያልታተመ ይዘት አለበት?
  • በደንበኛ ስምምነት ወይም በትምህርት ቤት ፖሊሲ የተሸፈነ ነው?
  • ለዚህ ሰነድ የመስመር ላይ OCR አገልግሎት ተፈቅዶለታል?
  • በምትኩ የአካባቢያዊ የሥራ ሂደት ያስፈልግዎታል?
  • ትርጉም የማያስፈልጋቸውን ገጾች ማስወገድ ይችላሉ?

ስካን የተደረጉ PDFዎች ብዙ ጊዜ ስሜታዊ ናቸው ምክንያቱም ከውሎች፣ መታወቂያዎች፣ ቅጾች፣ የምርምር ረቂቆች እና የውስጥ ማህደሮች ይመጣሉ። የOCR መስቀል ውሳኔዎችን እንደ ዋናው ሰነድ በተመሳሳይ ጥንቃቄ ይያዙ።

FAQ

ስካን የተደረገ PDFን እንዴት እተረጉማለሁ?

መጀመሪያ የጽሑፍ ንብርብር ለመፍጠር OCR ያሂዱ፣ የOCR ውጤቱን ይገምግሙ፣ ከዚያ በOCR የተሠራበትን PDF በ PDF ተርጓሚ ይተርጉሙት። የOCR ክለሳ ደረጃውን አትዝለሉ።

Google Translate የእኔን ስካን PDF ለምን አልተረጎመውም?

PDFው ምስል-ብቻ ሊሆን ይችላል። የጽሑፍ ንብርብር ከሌለ፣ Google Translate የሚያወጣው ጽሑፍ የለውም። መጀመሪያ OCR ያሂዱ፣ ከዚያ ይተርጉሙ። Google ላይ ብቻ የሚያተኩረው የሥራ ሂደት የGoogle Translate PDF መመሪያ ውስጥ ተካትቷል።

ChatGPT ስካን የተደረገ PDF ሊተረጉም ይችላል?

ChatGPT በተናጠል ምስሎች ወይም በተወሰደ ጽሑፍ ላይ ሊረዳ ይችላል፣ ነገር ግን ብዙ ገጽ ያለው ስካን PDF አሁንም OCR እና ክለሳ ይፈልጋል። ለሙሉ የሰነድ የሥራ ሂደት፣ መጀመሪያ OCR ያሂዱ፣ ከዚያ የPDF ትርጉም የሥራ ሂደት ይጠቀሙ።

ለስካን PDFዎች ምርጡ የOCR መሣሪያ የትኛው ነው?

እሱ በሰነዱ ላይ ይመረኮዛል። Acrobat እና ABBYY ዓይነት መሣሪያዎች ለአጠቃላይ እና ለውስብስብ ስካኖች ጠቃሚ ናቸው። Tesseract ወይም OCRmyPDF ለአካባቢያዊ ቴክኒካዊ የሥራ ሂደቶች ይጠቅማሉ። የመስመር ላይ OCR ለአደጋ ዝቅተኛ እና ቀላል ፋይሎች ጥሩ ሊሆን ይችላል፣ ነገር ግን የግላዊነት እና የጥራት ሁኔታ ይለያያል።

OCR ቅርጸትን ማቆየት ይችላል?

OCR የጽሑፍ ንብርብር ሊፈጥር እና አንዳንድ ጊዜ የንባብ ቅደም ተከተልን ሊመልስ ይችላል፣ ነገር ግን ይህ የተተረጎመውን ዋና አቀማመጥ ማቆየት ከሚባለው ጋር አንድ አይደለም። ከOCR በኋላ የPDF ትርጉም የሥራ ሂደት ይጠቀሙ እና ውጤቱን ከዋናው ጋር ያረጋግጡ።

የOCR ጥራት መጥፎ ከሆነ ምን ላድርግ?

ከመተርጎም በፊት ስካኑን ያሻሽሉ። ከተቻለ እንደገና ይስካኑ፣ ገጾቹን ያቀኑ፣ ኮንትራስቱን ያሳድጉ፣ ብክለትን ይቁረጡ፣ ትክክለኛውን የOCR ቋንቋ ይምረጡ እና አስቸጋሪ ገጾችን እንደገና ይገምግሙ።