ስካን የተደረገ PDFን እንዴት መተርጎም ይቻላል፡ ሙሉው የOCR + ትርጉም መመሪያ
ስካን የተደረጉ PDFዎች እውነተኛ ጽሑፍ ሳይሆን የጽሑፍ ምስሎችን ይይዛሉ — ለዚህ ነው Google Translate ሳይቀይራቸው የሚመልሳቸው። ይህን የሚያስተካክለው የOCR + AI ሂደት ይህ ነው።
ፈጣን መልስ፡ ስካን የተደረገ PDF ከትርጉም በፊት OCR ይፈልጋል
ስካን የተደረገ PDF ለመተርጎም መጀመሪያ የገጹን ምስሎች ወደ ሊመረጥ የሚችል ጽሑፍ ለመቀየር OCR ያሂዱ። ከዚያ በኋላ በOCR የተሠራበትን PDF እንደ PDF ተርጓሚ ያለ የሰነድ ትርጉም መሣሪያ በመጠቀም ይተርጉሙት። OCRን ከዘለሉ ብዙ የትርጉም መሣሪያዎች ዋናውን ፋይል ሳይቀይሩ ይመልሳሉ፣ ገጾችን ያልፋሉ፣ ወይም አስቀድሞ የጽሑፍ ንብርብር ያላቸውን ክፍሎች ብቻ ይተረጉማሉ።
ይህን የሥራ ሂደት ይጠቀሙ፡
- PDFውን ይክፈቱ እና አንድ አረፍተ ነገር ለመምረጥ ይሞክሩ።
- ጽሑፉን መምረጥ ካልቻሉ OCR ያሂዱ።
- ከመተርጎምዎ በፊት የOCR ጽሑፉን ይገምግሙ።
- በOCR የተሠራበትን PDF ወደ PDF ተርጓሚ ይስቀሉ።
- የተተረጎመውን ውጤት ከዋናው ስካን ጋር ያረጋግጡ።
PDFዎ አስቀድሞ ሊመረጥ የሚችል ጽሑፍ ካለው እና ችግሩ አቀማመጥን ማቆየት ከሆነ፣ ቅርጸት ሳይጠፋ PDF መተርጎም የሚለውን መመሪያ ይጠቀሙ።
ስካን የተደረጉ PDFዎች በትርጉም መሣሪያዎች ውስጥ ለምን ይከሽፋሉ
ስካን የተደረገ PDF ብዙ ጊዜ በPDF ኮንቴይነር ውስጥ የተቀመጡ የገጽ ምስሎች ስብስብ ብቻ ነው። ገጹ ለሰው ቃላትን ሊያሳይ ይችላል፣ ነገር ግን ፋይሉ ሶፍትዌር የሚያወጣውን እውነተኛ ጽሑፍ ላይይዝ ይችላል።
ይህ ቀላል ውድቀት ይፈጥራል፡
| የፋይሉ አይነት | ተርጓሚው የሚያየው | የሚከሰተው |
|---|---|---|
| በጽሑፍ የተመሠረተ PDF | ጽሑፍ ከአቀማመጥ ውሂብ ጋር | ትርጉም ወዲያውኑ ሊጀምር ይችላል። |
| ምስል-ብቻ የሆነ ስካን PDF | የገጾች ምስሎች | መጀመሪያ OCR ያስፈልጋል። |
| በምስል ላይ ጽሑፍ ያለበት PDF | የስካን ምስል ከተሰወረ የOCR ጽሑፍ ንብርብር ጋር | ትርጉም ሊሰራ ይችላል፣ ነገር ግን የOCR ስህተቶች ጥራቱን ይጎዳሉ። |
በጣም ጠቃሚው ፈተና ቴክኒካዊ አይደለም፡
- PDFውን ይክፈቱ።
- ብቻቸውን ቃላት ለማድመቅ ይሞክሩ።
- አንድ አረፍተ ነገር ይቅዱ።
- ወደ የጽሑፍ አርታኢ ይለጥፉት።
አረፍተ ነገሩ በትክክል ከተለጠፈ፣ PDFው የጽሑፍ ንብርብር አለው። ምንም ካልተለጠፈ ወይም ሙሉ ገጹ እንደ አንድ ምስል ከተሰራ፣ PDFው OCR ይፈልጋል።
OCR አማራጭ አይደለም
OCR ማለት optical character recognition ነው። ይህም ከምስል ውስጥ ጽሑፍን ያነባል እና ለማሽን የሚነበብ ጽሑፍ ይፈጥራል። ለPDF ትርጉም፣ OCR ብዙ ጊዜ በተስካነው ገጽ ላይ የማይታይ የጽሑፍ ንብርብር ይፈጥራል።
ያ የጽሑፍ ንብርብር ለትርጉም መነሻ ይሆናል። OCR ስህተት ካደረገ፣ ትርጉሙ እነዚያን ስህተቶች ይወርሳል።
የተለመዱ የOCR ስህተቶች፡
| የOCR ስህተት | የትርጉም አደጋ |
|---|---|
rn እንደ m መነበብ | ቃላት ትርጉማቸውን ይቀይራሉ። |
1 እንደ l መነበብ | ቁጥሮች፣ ማጣቀሻዎች ወይም ኮዶች ስህተት ይሆናሉ። |
O እንደ 0 መነበብ | IDዎች፣ ፎርሙላዎች እና ስሞች ሊበላሹ ይችላሉ። |
| አክሰንቶች መጥፋት | ስሞች እና ቃላት ትክክለኛ አይሆኑም። |
| አምዶች መቀላቀል | አረፍተ ነገሮች በተሳሳተ ቅደም ተከተል ይተረጎማሉ። |
| የሰንጠረዥ ህዋሶች በተሳሳተ ሁኔታ ረድፍ በረድፍ መነበብ | የውሂብ መለያዎች ከእሴቶች ጋር አይዛመዱም። |
| የግርጌ ማስታወሻዎችን እንደ ዋና ጽሑፍ መውሰድ | ማጣቀሻዎች እና ማስታወሻዎች ወደ ተሳሳተ አውድ ይገባሉ። |
ስለዚህ የOCR ክለሳ ደረጃ ጠቃሚ ነው። የተወሰደውን ጽሑፍ በነጥብ ነጥብ ሳያረጋግጡ ስካን የተደረገ ሰነድ አትተርጉሙ።
OCR-መጀመሪያ የሥራ ሂደት
ደረጃ 1፡ የPDFውን አይነት ይለዩ
ጽሑፍ ለመምረጥ ይሞክሩ። ምርጫው ከሰራ፣ OCR ላያስፈልግዎ ይችላል። ምርጫው ካልሰራ፣ ፋይሉን እንደ ምስል-ብቻ ይቆጥሩት።
ገጹን በእይታም ይመልከቱ፡
- የተጣመመ ገጽ ስካን መሆኑን ይጠቁማል።
- ግራጫ የወረቀት ሸካራነት ስካን መሆኑን ይጠቁማል።
- ከመጽሐፉ ጀርባ አጠገብ ያሉ ጥላዎች በካሜራ የተነሳ መጽሐፍ መሆኑን ይጠቁማሉ።
- ያልተመጣጠነ ኮንትራስት ፎቶኮፒ መሆኑን ይጠቁማል።
- ፍለጋ የሚታዩ ቃላትን ካላገኘ፣ የጽሑፍ ንብርብር እንደሌለ ይጠቁማል።
ደረጃ 2፡ ከተቻለ ስካኑን ያሻሽሉ
የOCR ጥራት ከምስል ጥራት ይጀምራል። እንደገና መስካን ከቻሉ፣ የOCR ስህተቶችን ለማስተካከል ጊዜ ከማባከንዎ በፊት ያድርጉት።
ይህን የምስል ጥራት ዝርዝር ይጠቀሙ፡
- ትንንሽ ጽሑፍን ለማንበብ በቂ ጥራት ላይ ይስካኑ።
- ገጾቹን ጠፍጣፋ እና ቀጥ አድርጉ።
- ከጀርባ አጠገብ ያሉ ጥላዎችን ያስወግዱ።
- የሰንጠረዥ ዳርቻዎችን፣ ጣቶችን ወይም የጀርባ ብክለትን ይከርጹ።
- በጽሑፍ እና በገጹ መካከል ከፍተኛ ኮንትራስት ይጠቀሙ።
- ሙሉ መስመሩ እንዲታይ ያድርጉ።
- ትክክለኛውን የገጽ አቅጣጫ ይጠቀሙ።
- ፊደሎቹ እስኪደበዝዙ ድረስ ምስሉን እጅግ አትጨቁኑ።
ለአሮጌ መጻሕፍት እና ፎቶኮፒዎች፣ ትልቁ ማሻሻያ አብዛኛውን ጊዜ ከገጽ ማቀናን (deskewing)፣ ኮንትራስት ማስተካከል እና ከፎከስ ውጭ የሆኑ ገጾችን እንደገና መስካን ይመጣል።
ደረጃ 3፡ OCR ያሂዱ
የOCR መሣሪያ ሲመርጡ በብራንድ ላይ ሳይሆን በሰነዱ ላይ ይመርኮዙ።
| የOCR አማራጭ | ለምን ይሻላል | የሚጠነቀቁበት |
|---|---|---|
| Adobe Acrobat OCR | አጠቃላይ የቢዝነስ ስካኖች እና PDF ማጽዳት | በእሱ ላይ ከመመርኮዝዎ በፊት የአሁኑን ፕላን መዳረሻ ያረጋግጡ። |
| ABBYY FineReader | ውስብስብ ስካኖች፣ ሰንጠረዦች፣ አምዶች እና አስቸጋሪ አቀማመጦች | አሁንም በእጅ ክለሳ ያስፈልጋል። |
| Tesseract or OCRmyPDF | አካባቢያዊ፣ ቴክኒካዊ እና ደጋግሞ ሊተገበሩ የሚችሉ የOCR የሥራ ሂደቶች | በcommand-line መሣሪያዎች ላይ ልምድ ይፈልጋል። |
| የመስመር ላይ OCR መሣሪያዎች | አደጋ ዝቅተኛ የሆኑ አልፎ አልፎ ፋይሎች | ግላዊነት፣ የፋይል ገደቦች እና ጥራት ይለያያሉ። |
| የስልክ ስካን መተግበሪያዎች | አዲስ ስካን በፍጥነት ለመያዝ | የእይታ መጣመም OCRን ሊጎዳ ይችላል። |
ለግል ውሎች፣ የሕክምና መዝገቦች፣ የፋይናንስ ሰነዶች፣ ያልታተሙ የእጅ ጽሑፎች፣ ወይም በግምገማ ላይ ላለ አካዳሚክ ሥራ፣ የአካባቢያዊ OCR የሥራ ሂደት ወይም የሚታመን አካባቢ ይመርጡ። ስሜታዊ ስካኖችን ወደ ማንኛውም የነፃ OCR ድረ-ገጽ አትጫኑ።
ደረጃ 4፡ የOCR ጽሑፉን ይገምግሙ
ከትርጉም በፊት ይገምግሙ፣ ከዚያ በኋላ አይደለም። ከብዙ አስቸጋሪ ገጾች ጽሑፍ ይቅዱ እና ሊነበብ እንደሚችል ያረጋግጡ።
ለመመርመር የሚገቡ ናሙና ገጾች፡
- የርዕስ ገጹ።
- ጥቅጥቅ ያለ ዋና ጽሑፍ ያለበት ገጽ።
- የሰንጠረዥ ገጽ።
- የግርጌ ማስታወሻ ያለበት ገጽ።
- ትንሽ ጽሑፍ ያለበት ገጽ።
- ማህተሞች፣ የእጅ ጽሑፍ ወይም የዳር ማስታወሻዎች ያሉበት ገጽ።
- ሰነዱ ብዙ ቋንቋ ከሆነ በእያንዳንዱ ቋንቋ ያለ ገጽ።
የሚፈልጉት፡
- የጠፉ አንቀጾች።
- የተቀላቀሉ አምዶች።
- የተቆራረጡ ቃላት።
- የተሳሳቱ ቁምፊዎች።
- የጠፉ ዳይአክሪቲክሶች።
- የሰንጠረዥ መለያዎች ከእሴቶች መለየት።
- ራስጌዎች ወደ ዋና ጽሑፍ መግባት።
- የገጽ ቁጥሮች ወደ አረፍተ ነገሮች መቀላቀል።
የOCR ጥራት ደካማ ከሆነ ከትርጉም በፊት ያስተካክሉት። OCR በፍፁም ያልያዘውን ትርጉም አንድ ተርጓሚ በእርግጥ መመለስ አይችልም።
ደረጃ 5፡ በOCR የተሠራበትን PDF ይተርጉሙ
PDFው ንጹህ የጽሑፍ ንብርብር ካገኘ በኋላ ወደ PDF ተርጓሚ ይስቀሉት። አሁን የትርጉም ደረጃው ከገጽ ምስሎች ይልቅ በጽሑፍ ላይ ሊሰራ ይችላል።
ከትርጉም በኋላ የሚከተሉትን ያወዳድሩ፡
- ዋናው ስካን
- የOCR ጽሑፍ ንብርብር
- የተተረጎመው PDF
ይህ የሶስት-አቅጣጫ ክለሳ ስህተቱ ከOCR ወይስ ከትርጉም እንደመጣ ለመለየት ይረዳዎታል። የOCR ጽሑፉ ስህተት ካለበት OCRን እንደገና ያሂዱ። የOCR ጽሑፉ ትክክል ነገር ግን ትርጉሙ ስህተት ከሆነ ትርጉሙን ያስተካክሉ።
ደረጃ 6፡ ከፍተኛ አደጋ ያለበትን ይዘት ይገምግሙ
ስካን የተደረጉ ሰነዶች ብዙ ጊዜ በጥንቃቄ ክለሳ የሚፈልገውን ይዘት ይይዛሉ፡ አሮጌ ውሎች፣ የመንግስት ቅጾች፣ አካዳሚክ ጽሑፎች፣ መመሪያዎች፣ ታሪካዊ ሰነዶች እና የመጽሐፍ ገጾች።
እነዚህን ነገሮች በእጅ ይገምግሙ፡
- ስሞች
- ቀኖች
- ቁጥሮች
- አድራሻዎች
- የምርት ኮዶች
- ሕጋዊ ማጣቀሻዎች
- ማጣቀሻዎች
- የሰንጠረዥ መለያዎች
- መለኪያ አሃዶች
- ፎርሙላዎች
- መግለጫ ጽሑፎች
- የግርጌ ማስታወሻዎች
ለምርምር እና ለአካዳሚክ ፋይሎች፣ የአካዳሚክ ምርምር ወረቀቶችን መተርጎም የሚለውን መመሪያ ደግሞ ያንብቡ፣ ምክንያቱም ስካን የተደረጉ አካዳሚክ PDFዎች በOCR አደጋ ላይ ተጨማሪ የማጣቀሻ እና የአቀማመጥ አደጋዎችን ያመጣሉ።
ከጎን-ለጎን የውድቀት ምሳሌዎች
የOCR ውጤትን ሲገምግሙ ይህን ሰንጠረዥ ይጠቀሙ።
| ዋናው ስካን ምናልባት የሚያሳየው | መጥፎ የOCR ውጤት | ለምን አስፈላጊ ነው |
|---|---|---|
modern | modem | ትርጉሙ ሙሉ በሙሉ ይቀየራል። |
Section 10 | Section IO | ሕጋዊ ወይም ቴክኒካዊ ማጣቀሻዎች ሊበላሹ ይችላሉ። |
2026 | 2O26 | ቀኖች እና IDዎች የማይታመኑ ይሆናሉ። |
patient | patlent | የሕክምና ወይም ቴክኒካዊ ቃላት ይሳሳታሉ። |
| ሁለት የተለዩ አምዶች | አንድ የተቀላቀለ አንቀጽ | ትርጉሙ አረፍተ ነገሮችን በተሳሳተ ቅደም ተከተል ያነባል። |
| መለያዎችና እሴቶች ያሉት የሰንጠረዥ ረድፍ | የተቀላቀለ ጽሑፍ ያለበት አንድ መስመር | ውሂቡ ከትክክለኛው መለያ ጋር አይዛመድም። |
የግርጌ ማስታወሻ ምልክት 1 | ፊደል l | ማስታወሻዎች ከተሳሳተ አረፍተ ነገር ጋር ሊጣመሩ ይችላሉ። |
እነዚህን ስህተቶች በOCR ንብርብር ውስጥ ካዩ፣ ከመተርጎም በፊት OCRን ያስተካክሉ።
የትኛውን መሣሪያ መጠቀም አለብዎት?
እንደ ሰነዱ አስቸጋሪነት ይምረጡ።
| ሰነድ | የሚመከረው መንገድ |
|---|---|
| ንጹህ የቢዝነስ ስካን | OCRን በAcrobat ወይም በሌላ የሚታመን OCR መሣሪያ ያሂዱ፣ ከዚያ PDF ተርጓሚ ይጠቀሙ። |
| የአሮጌ መጽሐፍ ስካን | ገጹን አቀናን እና ኮንትራስቱን ያሻሽሉ፣ OCRን በጥንቃቄ ያሂዱ፣ ከዚያ ይተርጉሙ። |
| የአካዳሚክ ወረቀት ስካን | OCR ያሂዱ፣ ፎርሙላዎችን/ማጣቀሻዎችን/ሰንጠረዦችን ይገምግሙ፣ ከዚያ ከአቀማመጥ ክለሳ ጋር ይተርጉሙ። |
| በእጅ የተጻፉ ማስታወሻዎች | ከትርጉም በፊት በእጅ መቅዳት ሊያስፈልግ ይችላል። |
| ቀላል የግል ሰነድ | የግላዊነት አደጋ ዝቅተኛ ከሆነ የመስመር ላይ OCR ተቀባይነት ሊኖረው ይችላል። |
| ስሜታዊ ሰነድ | የአካባቢያዊ OCR ወይም የሚታመን የተቆጣጠረ የሥራ ሂደት ይጠቀሙ። |
ሰፊውን የመሣሪያ ንጽጽር ከፈለጉ፣ ምርጥ የPDF ተርጓሚ መመሪያ ይመልከቱ።
የተለመዱ የስካን PDF ችግሮች
ዝቅተኛ ጥራት ያላቸው ገጾች
ዝቅተኛ ጥራት ያላቸው ስካኖች ፊደሎችን እርስ በርስ ያደበዝዛሉ። OCR rnን ከ m፣ clን ከ d፣ ወይም ሥርዓተ-ነጥብን ከአቧራ ጋር ሊያበላሽ ይችላል።
መፍትሄ፡ ከተቻለ እንደገና ይስካኑ። ካልተቻለ፣ ኮንትራስቱን ያሳድጉ እና OCRን እንደገና ይሞክሩ።
የተጣመመ ወይም የተጠማዘዘ ገጽ
የመጽሐፍ ስካኖች ብዙ ጊዜ ከጀርባው አጠገብ ይጠማዘዛሉ። OCR እነዚህን የተጠማዘዙ መስመሮች በደካማ ሁኔታ ያነባቸዋል እና ጽሑፉን እንደገና ሊያደራጅ ይችላል።
መፍትሄ፡ ገጹን ጠፍጣፋ ያድርጉ፣ እንደገና ይስካኑ፣ ወይም deskew እና dewarping ያለው የOCR መሣሪያ ይጠቀሙ።
ብዙ-አምድ አቀማመጥ
OCR የግራና የቀኝ አምዶችን ወደ አንድ የአረፍተ ነገር ፍሰት ሊያቀላቅል ይችላል።
መፍትሄ፡ ከትርጉም በፊት የንባብ ቅደም ተከተሉን ያረጋግጡ። አካዳሚክ ጽሑፎች በተለይ እዚህ ጥንቃቄ ያስፈልጋቸዋል።
ሰንጠረዦች
ሰንጠረዦች ከባድ ናቸው፣ ምክንያቱም OCR ጽሑፉንም መዋቅሩንም መለየት አለበት። ሰንጠረዥ በእይታ ትክክል ሊታይ ይችላል፣ ነገር ግን የጽሑፍ ንብርብሩ ስህተት ሊሆን ይችላል።
መፍትሄ፡ የOCR ጽሑፉን ከሰንጠረዡ ይቅዱ እና መለያዎቹ ከእሴቶቹ ጋር አሁንም እንደሚዛመዱ ያረጋግጡ።
የእጅ ጽሑፍ እና ፊርማዎች
የታተመ ጽሑፍ OCR ከየእጅ ጽሑፍ መለየት የበለጠ የሚታመን ነው። በእጅ የተጻፉ የጎን ማስታወሻዎች፣ ፊርማዎች እና የተሞሉ ፎርሞች ሊታለፉ ወይም ሊበላሹ ይችላሉ።
መፍትሄ፡ አስፈላጊ የእጅ ጽሑፍን ከትርጉም በፊት በእጅ ይቅዱ።
የተቀላቀሉ ቋንቋዎች
OCR የመነሻ ቋንቋውን ሲያውቅ በጣም ጥሩ ይሰራል። እንግሊዝኛ፣ ፈረንሳይኛ እና ቻይንኛ ያሉበት ስካን OCR አንድ ቋንቋ ብቻ ከተቀናበረ ሊወድቅ ይችላል።
መፍትሄ፡ መሣሪያው የሚደግፍ ከሆነ ሁሉንም ተዛማጅ የOCR ቋንቋዎች ይምረጡ፣ ከዚያ የእያንዳንዱን ቋንቋ ክፍል በነጥብ ነጥብ ያረጋግጡ።
የግላዊነት እና ደህንነት ዝርዝር
ስካን የተደረገ PDF ወዴትም ከመስቀልዎ በፊት እነዚህን ይጠይቁ፡
- ሰነዱ የግል መረጃ ይዟል?
- የሕክምና፣ የሕግ፣ የፋይናንስ፣ አካዳሚክ ወይም ያልታተመ ይዘት አለበት?
- በደንበኛ ስምምነት ወይም በትምህርት ቤት ፖሊሲ የተሸፈነ ነው?
- ለዚህ ሰነድ የመስመር ላይ OCR አገልግሎት ተፈቅዶለታል?
- በምትኩ የአካባቢያዊ የሥራ ሂደት ያስፈልግዎታል?
- ትርጉም የማያስፈልጋቸውን ገጾች ማስወገድ ይችላሉ?
ስካን የተደረጉ PDFዎች ብዙ ጊዜ ስሜታዊ ናቸው ምክንያቱም ከውሎች፣ መታወቂያዎች፣ ቅጾች፣ የምርምር ረቂቆች እና የውስጥ ማህደሮች ይመጣሉ። የOCR መስቀል ውሳኔዎችን እንደ ዋናው ሰነድ በተመሳሳይ ጥንቃቄ ይያዙ።
FAQ
ስካን የተደረገ PDFን እንዴት እተረጉማለሁ?
መጀመሪያ የጽሑፍ ንብርብር ለመፍጠር OCR ያሂዱ፣ የOCR ውጤቱን ይገምግሙ፣ ከዚያ በOCR የተሠራበትን PDF በ PDF ተርጓሚ ይተርጉሙት። የOCR ክለሳ ደረጃውን አትዝለሉ።
Google Translate የእኔን ስካን PDF ለምን አልተረጎመውም?
PDFው ምስል-ብቻ ሊሆን ይችላል። የጽሑፍ ንብርብር ከሌለ፣ Google Translate የሚያወጣው ጽሑፍ የለውም። መጀመሪያ OCR ያሂዱ፣ ከዚያ ይተርጉሙ። Google ላይ ብቻ የሚያተኩረው የሥራ ሂደት የGoogle Translate PDF መመሪያ ውስጥ ተካትቷል።
ChatGPT ስካን የተደረገ PDF ሊተረጉም ይችላል?
ChatGPT በተናጠል ምስሎች ወይም በተወሰደ ጽሑፍ ላይ ሊረዳ ይችላል፣ ነገር ግን ብዙ ገጽ ያለው ስካን PDF አሁንም OCR እና ክለሳ ይፈልጋል። ለሙሉ የሰነድ የሥራ ሂደት፣ መጀመሪያ OCR ያሂዱ፣ ከዚያ የPDF ትርጉም የሥራ ሂደት ይጠቀሙ።
ለስካን PDFዎች ምርጡ የOCR መሣሪያ የትኛው ነው?
እሱ በሰነዱ ላይ ይመረኮዛል። Acrobat እና ABBYY ዓይነት መሣሪያዎች ለአጠቃላይ እና ለውስብስብ ስካኖች ጠቃሚ ናቸው። Tesseract ወይም OCRmyPDF ለአካባቢያዊ ቴክኒካዊ የሥራ ሂደቶች ይጠቅማሉ። የመስመር ላይ OCR ለአደጋ ዝቅተኛ እና ቀላል ፋይሎች ጥሩ ሊሆን ይችላል፣ ነገር ግን የግላዊነት እና የጥራት ሁኔታ ይለያያል።
OCR ቅርጸትን ማቆየት ይችላል?
OCR የጽሑፍ ንብርብር ሊፈጥር እና አንዳንድ ጊዜ የንባብ ቅደም ተከተልን ሊመልስ ይችላል፣ ነገር ግን ይህ የተተረጎመውን ዋና አቀማመጥ ማቆየት ከሚባለው ጋር አንድ አይደለም። ከOCR በኋላ የPDF ትርጉም የሥራ ሂደት ይጠቀሙ እና ውጤቱን ከዋናው ጋር ያረጋግጡ።
የOCR ጥራት መጥፎ ከሆነ ምን ላድርግ?
ከመተርጎም በፊት ስካኑን ያሻሽሉ። ከተቻለ እንደገና ይስካኑ፣ ገጾቹን ያቀኑ፣ ኮንትራስቱን ያሳድጉ፣ ብክለትን ይቁረጡ፣ ትክክለኛውን የOCR ቋንቋ ይምረጡ እና አስቸጋሪ ገጾችን እንደገና ይገምግሙ።