સ્કેન કરેલ PDF નો અનુવાદ કેવી રીતે કરવો: સંપૂર્ણ OCR + અનુવાદ માર્ગદર્શિકા
સ્કેન કરેલ PDF માં વાસ્તવિક ટેક્સ્ટ નહીં પરંતુ ટેક્સ્ટના ચિત્રો હોય છે — તેથી Google Translate તેને બદલ્યા વગર જ પરત આપે છે. તેને ઠીક કરતી OCR + AI પાઇપલાઇન અહીં છે.
ઝડપી જવાબ: સ્કેન કરેલ PDF ને અનુવાદ પહેલાં OCR જરૂરી છે
સ્કેન કરેલ PDF નો અનુવાદ કરવા માટે, પહેલા OCR ચલાવો જેથી પાનાંના ચિત્રો પસંદ કરી શકાય તેવા ટેક્સ્ટમાં ફેરવાઈ જાય. પછી PDF અનુવાદક જેવા દસ્તાવેજ અનુવાદક સાથે OCR-પ્રોસેસ કરેલ PDF નો અનુવાદ કરો. જો તમે OCR છોડો, તો ઘણા અનુવાદ ટૂલ્સ મૂળ ફાઇલ જ બદલ્યા વગર પરત આપશે, કેટલાક પાનાં ચૂકી જશે, અથવા ફક્ત તે જ ભાગોનું અનુવાદ કરશે જેમાં પહેલેથી ટેક્સ્ટ લેયર છે.
આ વર્કફ્લો ઉપયોગ કરો:
- PDF ખોલો અને એક વાક્ય પસંદ કરવાનો પ્રયાસ કરો.
- જો તમે ટેક્સ્ટ પસંદ ન કરી શકો, તો OCR ચલાવો.
- અનુવાદ પહેલાં OCR ટેક્સ્ટની સમીક્ષા કરો.
- OCR-પ્રોસેસ કરેલ PDF ને PDF અનુવાદક માં અપલોડ કરો.
- અનુવાદિત આઉટપુટને મૂળ સ્કેન સાથે સરખાવો.
જો તમારી PDF માં પહેલેથી પસંદ કરી શકાય તેવો ટેક્સ્ટ છે અને સમસ્યા લેઆઉટ જાળવવાની છે, તો ફોર્મેટિંગ ગુમાવ્યા વગર PDF નો અનુવાદ કેવી રીતે કરવો માર્ગદર્શિકા ઉપયોગ કરો.
સ્કેન કરેલ PDF અનુવાદ ટૂલ્સમાં કેમ નિષ્ફળ જાય છે
સ્કેન કરેલ PDF ઘણી વાર PDF કન્ટેનર અંદર પાનાંના ચિત્રોના સમૂહ જેવું જ હોય છે. માણસને પાનાં પર શબ્દો દેખાય છે, પરંતુ સોફ્ટવેર માટે તેમાંથી ટેક્સ્ટ કાઢી શકાય તેવો વાસ્તવિક ટેક્સ્ટ ફાઇલમાં હોવો જરૂરી નથી.
તે એક સરળ નિષ્ફળતા ઉભી કરે છે:
| ફાઇલનો પ્રકાર | અનુવાદક શું જુએ છે | શું થાય છે |
|---|---|---|
| ટેક્સ્ટ-આધારિત PDF | ટેક્સ્ટ અને લેઆઉટ ડેટા | અનુવાદ તરત શરૂ થઈ શકે છે. |
| ફક્ત-ચિત્રવાળી સ્કેન PDF | પાનાંના ચિત્રો | પહેલા OCR જરૂરી છે. |
| ટેક્સ્ટ-ઓવર-ઇમેજ PDF | સ્કેન ચિત્ર અને છુપાયેલું OCR ટેક્સ્ટ લેયર | અનુવાદ થઈ શકે છે, પરંતુ OCR ભૂલો ગુણવત્તાને અસર કરે છે. |
સૌથી ઉપયોગી ટેસ્ટ ટેક્નિકલ નથી:
- PDF ખોલો.
- અલગ-અલગ શબ્દોને હાઇલાઇટ કરવાનો પ્રયાસ કરો.
- એક વાક્ય નકલ કરો.
- તેને ટેક્સ્ટ એડિટરમાં પેસ્ટ કરો.
જો વાક્ય યોગ્ય રીતે પેસ્ટ થાય, તો PDF માં ટેક્સ્ટ લેયર છે. જો કશું પેસ્ટ ન થાય, અથવા આખું પાનું એક જ ચિત્રની જેમ વર્તે, તો PDF ને OCR જરૂરી છે.
OCR વૈકલ્પિક નથી
OCR નો અર્થ optical character recognition થાય છે. તે ચિત્રમાંથી ટેક્સ્ટ વાંચે છે અને મશીન-રીડેબલ ટેક્સ્ટ બનાવે છે. PDF અનુવાદ માટે, OCR સામાન્ય રીતે સ્કેન કરેલા પાનાં ઉપર અદૃશ્ય ટેક્સ્ટ લેયર બનાવે છે.
આ ટેક્સ્ટ લેયર અનુવાદ માટે સ્રોત બને છે. જો OCR ભૂલો કરે, તો અનુવાદ પણ એ જ ભૂલો વારસામાં મેળવે છે.
OCR ની સામાન્ય ભૂલો:
| OCR ભૂલ | અનુવાદનું જોખમ |
|---|---|
rn ને m તરીકે વાંચવું | શબ્દનો અર્થ બદલાઈ જાય છે. |
1 ને l તરીકે વાંચવું | આંકડા, સંદર્ભો, અથવા કોડ ખોટા થઈ જાય છે. |
O ને 0 તરીકે વાંચવું | ID, સૂત્રો, અને નામ તૂટી શકે છે. |
| ઍક્સન્ટ્સ ગુમાવી દેવા | નામો અને શબ્દો અચોક્કસ બની જાય છે. |
| કૉલમ્સ ભળી જવા | વાક્યો ખોટા ક્રમમાં અનુવાદિત થાય છે. |
| ટેબલ સેલ્સને પંક્તિ પ્રમાણે ખોટી રીતે વાંચવા | ડેટા લેબલ્સ હવે મૂલ્યો સાથે મેળ ખાતા નથી. |
| ફૂટનોટ્સને મુખ્ય લખાણ માનવું | citation અને નોંધો ખોટા સંદર્ભમાં ખસી જાય છે. |
એટલા માટે OCR સમીક્ષા પગલું મહત્વપૂર્ણ છે. જ્યાં સુધી તમે કાઢવામાં આવેલ ટેક્સ્ટને ચકાસી ન લો, ત્યાં સુધી સ્કેન કરેલા દસ્તાવેજનો અનુવાદ ન કરો.
OCR-પ્રથમ વર્કફ્લો
પગલું 1: PDF નો પ્રકાર ઓળખો
ટેક્સ્ટ પસંદ કરવાનો પ્રયાસ કરો. જો પસંદગી કામ કરે, તો કદાચ તમને OCR ની જરૂર ન પડે. જો પસંદગી કામ ન કરે, તો ફાઇલને ફક્ત-ચિત્રવાળી માનો.
પાનાંને દૃશ્ય રીતે પણ તપાસો:
- ઝુકેલા પાનાં સ્કેન સૂચવે છે.
- રાખોડી કાગળની ટેક્સ્ચર સ્કેન સૂચવે છે.
- મધ્ય બંધાણ પાસે પડછાયા હોય તો ફોટોગ્રાફ કરાયેલ પુસ્તક હોઈ શકે.
- અસમાન કોન્ટ્રાસ્ટ ફોટોકૉપી સૂચવે છે.
- દેખાતા શબ્દો શોધથી ન મળે તો ટેક્સ્ટ લેયર ન હોવાની શક્યતા છે.
પગલું 2: શક્ય હોય તો સ્કેન સુધારો
OCR ની ગુણવત્તાની શરૂઆત ચિત્રની ગુણવત્તાથી થાય છે. જો તમે ફરી સ્કેન કરી શકો, તો OCR ભૂલો સુધારવામાં સમય ખર્ચવા પહેલાં તે કરો.
આ ઇમેજ-ક્વોલિટી ચેકલિસ્ટ ઉપયોગ કરો:
- નાનાં લખાણ માટે પૂરતી ઊંચી રિઝોલ્યુશનમાં સ્કેન કરો.
- પાનાં સમતલ અને સીધાં રાખો.
- મધ્ય બંધાણ પાસે પડછાયા ટાળો.
- ટેબલની કિનારીઓ, આંગળીઓ, અથવા પાછળની ગંદકી કાપી કાઢો.
- લખાણ અને પાનાં વચ્ચે મજબૂત કોન્ટ્રાસ્ટ રાખો.
- આખી લાઇન સ્પષ્ટ દેખાય તે સુનિશ્ચિત કરો.
- પાનાંની યોગ્ય દિશા રાખો.
- ચિત્રને એટલું વધુ કમ્પ્રેસ ન કરો કે અક્ષરો ધૂંધળા થઈ જાય.
જૂના પુસ્તકો અને ફોટોકૉપી માટે સૌથી મોટા સુધારા સામાન્ય રીતે પાનાંનું ઝુકાવ સીધું કરવાથી, કોન્ટ્રાસ્ટ સુધારવાથી, અને ફોકસ બહાર ગયેલા પાનાં ફરી સ્કેન કરવાથી મળે છે.
પગલું 3: OCR ચલાવો
OCR ટૂલ બ્રાન્ડ પરથી નહીં, દસ્તાવેજ પરથી પસંદ કરો.
| OCR વિકલ્પ | ક્યારે શ્રેષ્ઠ | કઈ બાબતનું ધ્યાન રાખવું |
|---|---|---|
| Adobe Acrobat OCR | સામાન્ય બિઝનેસ સ્કેન્સ અને PDF સફાઈ | આધાર રાખતા પહેલાં હાલની પ્લાન ઍક્સેસ ચકાસો. |
| ABBYY FineReader | જટિલ સ્કેન્સ, ટેબલ્સ, કૉલમ્સ, અને મુશ્કેલ લેઆઉટ્સ | હજી પણ મેન્યુઅલ સમીક્ષા જરૂરી છે. |
| Tesseract or OCRmyPDF | લોકલ, ટેક્નિકલ, ફરી કરી શકાય તેવા OCR વર્કફ્લોઝ | કમાન્ડ-લાઇન ટૂલ્સમાં સુવિધા જરૂરી છે. |
| Online OCR tools | ક્યારેક આવતી ઓછી જોખમી ફાઇલો માટે | ગોપનીયતા, ફાઇલ મર્યાદા, અને ગુણવત્તા બદલાય છે. |
| Phone scanning apps | નવું સ્કેન ઝડપથી કૅપ્ચર કરવા માટે | પરસ્પેક્ટિવ ડિસ્ટોર્શન OCR ને નુકસાન પહોંચાડી શકે છે. |
ખાનગી કરારો, મેડિકલ રેકોર્ડ્સ, નાણાકીય દસ્તાવેજો, અપ્રકાશિત પાંડુલિપિઓ, અથવા સમીક્ષા હેઠળનું શૈક્ષણિક કામ માટે લોકલ OCR વર્કફ્લો અથવા વિશ્વસનીય નિયંત્રિત પર્યાવરણ પસંદ કરો. સંવેદનશીલ સ્કેન્સને અજાણી ફ્રી OCR સાઇટ્સ પર અપલોડ ન કરો.
પગલું 4: OCR ટેક્સ્ટની સમીક્ષા કરો
સમીક્ષા અનુવાદ પછી નહીં, પહેલાં કરો. કેટલાક મુશ્કેલ પાનાંમાંથી ટેક્સ્ટ નકલ કરો અને તપાસો કે તે વાંચી શકાય છે કે નહીં.
ચકાસવા માટેના નમૂના પાનાં:
- ટાઇટલ પેજ.
- ગાઢ મુખ્ય લખાણવાળું પાનું.
- ટેબલવાળું પાનું.
- ફૂટનોટ્સવાળું પાનું.
- નાનાં લખાણવાળું પાનું.
- સ્ટેમ્પ, હસ્તલેખન, અથવા કિનારી નોંધોવાળું પાનું.
- દસ્તાવેજ બહુભાષી હોય તો દરેક ભાષાનું એક પાનું.
આ માટે જુઓ:
- ગુમ થયેલા પેરાગ્રાફ્સ.
- ભળેલા કૉલમ્સ.
- તૂટેલા શબ્દો.
- ખોટા અક્ષરો.
- ગુમ થયેલા diacritics.
- મૂલ્યોથી અલગ પડેલા ટેબલ લેબલ્સ.
- મુખ્ય લખાણમાં દાખલ થયેલા હેડર્સ.
- વાક્યોમાં ભળેલા પાનાં નંબરો.
જો OCR ની ગુણવત્તા નબળી હોય, તો અનુવાદ પહેલાં તેને સુધારો. OCR એ અર્થ જ પકડ્યો ન હોય, તો અનુવાદક વિશ્વસનીય રીતે તેને પાછો મેળવી શકતો નથી.
પગલું 5: OCR-પ્રોસેસ કરેલ PDF નો અનુવાદ કરો
જ્યારે PDF માં સ્વચ્છ ટેક્સ્ટ લેયર આવી જાય, ત્યારે તેને PDF અનુવાદક માં અપલોડ કરો. હવે અનુવાદનું પગલું પાનાંના ચિત્રો બદલે ટેક્સ્ટ સાથે કામ કરી શકે છે.
અનુવાદ પછી આ સરખાવો:
- મૂળ સ્કેન
- OCR ટેક્સ્ટ લેયર
- અનુવાદિત PDF
આ ત્રણ-માર્ગીય સમીક્ષા તમને ઓળખવામાં મદદ કરે છે કે ભૂલ OCR માંથી આવી કે અનુવાદમાંથી. જો OCR ટેક્સ્ટ ખોટો હોય, તો OCR ફરી ચલાવો. જો OCR ટેક્સ્ટ સાચો હોય પણ અનુવાદ ખોટો હોય, તો અનુવાદ સુધારો.
પગલું 6: ઊંચા જોખમવાળી સામગ્રીની સમીક્ષા કરો
સ્કેન કરેલા દસ્તાવેજોમાં ઘણી વાર ખાસ એવી સામગ્રી હોય છે જેને ધ્યાનપૂર્વક ચકાસવાની જરૂર પડે છે: જૂના કરારો, સરકારી ફોર્મ્સ, શૈક્ષણિક પેપર્સ, મેન્યુઅલ્સ, ઐતિહાસિક દસ્તાવેજો, અને પુસ્તકનાં પાનાં.
આ વસ્તુઓ મેન્યુઅલી ચકાસો:
- નામો
- તારીખો
- આંકડા
- સરનામાં
- પ્રોડક્ટ કોડ્સ
- કાનૂની સંદર્ભો
- citation
- ટેબલ લેબલ્સ
- એકમો
- સમીકરણો
- કૅપ્શન્સ
- ફૂટનોટ્સ
સંશોધન અને શૈક્ષણિક ફાઇલો માટે શૈક્ષણિક સંશોધન પેપર્સનું અનુવાદ માર્ગદર્શિકા પણ વાંચો, કારણ કે સ્કેન કરેલા શૈક્ષણિક PDF માં OCR જોખમ ઉપરાંત citation અને લેઆઉટના જોખમ પણ ઉમેરાય છે.
બાજુ-બાજુમાં નિષ્ફળતા ઉદાહરણો
OCR આઉટપુટની સમીક્ષા કરતી વખતે આ ટેબલ ઉપયોગ કરો.
| મૂળ સ્કેનમાં સંભાવિત લખાણ | ખરાબ OCR આઉટપુટ | તે શા માટે મહત્વનું છે |
|---|---|---|
modern | modem | અર્થ સંપૂર્ણપણે બદલાઈ જાય છે. |
Section 10 | Section IO | કાનૂની અથવા ટેક્નિકલ સંદર્ભો તૂટી શકે છે. |
2026 | 2O26 | તારીખો અને ID અવિશ્વસનીય બની જાય છે. |
patient | patlent | મેડિકલ અથવા ટેક્નિકલ શબ્દો ખોટા થઈ જાય છે. |
| બે અલગ કૉલમ્સ | એક ભળેલો પેરાગ્રાફ | અનુવાદ વાક્યોને ખોટા ક્રમમાં વાંચે છે. |
| લેબલ્સ અને મૂલ્યોવાળી ટેબલ પંક્તિ | ભળેલા લખાણની એક જ લાઇન | ડેટા હવે સાચા લેબલ સાથે નકશો થતો નથી. |
ફૂટનોટ માર્કર 1 | અક્ષર l | નોંધો ખોટા વાક્ય સાથે જોડાઈ શકે છે. |
જો તમને OCR લેયરમાં આવી ભૂલો દેખાય, તો અનુવાદ પહેલાં OCR સુધારો.
તમારે કયું ટૂલ ઉપયોગ કરવું જોઈએ?
દસ્તાવેજની મુશ્કેલી પ્રમાણે પસંદ કરો.
| દસ્તાવેજ | ભલામણ કરેલો માર્ગ |
|---|---|
| સ્વચ્છ બિઝનેસ સ્કેન | Acrobat અથવા બીજા વિશ્વસનીય OCR ટૂલમાં OCR કરો, પછી PDF અનુવાદક. |
| જૂના પુસ્તકનું સ્કેન | ઝુકાવ સીધો કરો અને કોન્ટ્રાસ્ટ સુધારો, OCR ધ્યાનથી ચલાવો, પછી અનુવાદ કરો. |
| શૈક્ષણિક પેપરનું સ્કેન | OCR કરો, સમીકરણો/citation/ટેબલ્સ તપાસો, પછી લેઆઉટ સમીક્ષા સાથે અનુવાદ કરો. |
| હસ્તલેખ નોંધો | અનુવાદ પહેલાં મેન્યુઅલ ટ્રાન્સક્રિપ્શન જરૂરી થઈ શકે છે. |
| સરળ વ્યક્તિગત દસ્તાવેજ | જો ગોપનીયતાનું જોખમ ઓછું હોય તો ઑનલાઇન OCR સ્વીકાર્ય હોઈ શકે છે. |
| સંવેદનશીલ દસ્તાવેજ | લોકલ OCR અથવા વિશ્વસનીય નિયંત્રિત વર્કફ્લો ઉપયોગ કરો. |
જો તમે વધુ વ્યાપક ટૂલ સરખામણી ઇચ્છતા હો, તો શ્રેષ્ઠ PDF અનુવાદક માર્ગદર્શિકા જુઓ.
સ્કેન કરેલા PDF ની સામાન્ય સમસ્યાઓ
ઓછી રિઝોલ્યુશનવાળા પાનાં
ઓછી રિઝોલ્યુશનવાળા સ્કેન્સમાં અક્ષરો એકબીજા સાથે ધૂંધળાં થઈ જાય છે. OCR rn અને m, cl અને d, અથવા punctuation અને ધૂળ વચ્ચે ગૂંચવાઈ શકે છે.
ઉકેલ: શક્ય હોય તો ફરી સ્કેન કરો. નહીં તો કોન્ટ્રાસ્ટ વધારો અને OCR ફરી અજમાવો.
ઝુકેલા અથવા વળાંકવાળા પાનાં
પુસ્તકના સ્કેન્સમાં મધ્ય બંધાણ પાસે વળાંક આવતો હોય છે. OCR આ વળાંકવાળી લાઇનોને ખરાબ રીતે વાંચે છે અને લખાણનો ક્રમ પણ બદલી શકે છે.
ઉકેલ: પાનું સમતલ કરો, ફરી સ્કેન કરો, અથવા deskew અને dewarping ધરાવતું OCR ટૂલ ઉપયોગ કરો.
બહુ-કૉલમ લેઆઉટ
OCR ડાબા અને જમણા કૉલમને ભેળવીને એક જ વાક્ય પ્રવાહમાં ફેરવી શકે છે.
ઉકેલ: અનુવાદ પહેલાં વાંચન ક્રમ તપાસો. શૈક્ષણિક પેપર્સમાં અહીં ખાસ ધ્યાન જોઈએ.
ટેબલ્સ
ટેબલ્સ મુશ્કેલ છે કારણ કે OCR ને ટેક્સ્ટ અને માળખું બન્ને ઓળખવું પડે છે. ટેબલ દેખાવમાં સાચી લાગે છતાં ટેક્સ્ટ લેયર ખોટી હોઈ શકે છે.
ઉકેલ: ટેબલમાંથી OCR ટેક્સ્ટ નકલ કરો અને ખાતરી કરો કે લેબલ્સ હજી પણ મૂલ્યો સાથે મેળ ખાતા હોય.
હસ્તલેખન અને સહી
પ્રિન્ટેડ ટેક્સ્ટ માટે OCR, હસ્તલેખ ઓળખ કરતાં ઘણી વધુ વિશ્વસનીય છે. હાથથી લખાયેલી કિનારી નોંધો, સહીઓ, અને ભરેલા ફોર્મ્સ ચૂકી જઈ શકે છે અથવા ગૂંચવાઈ શકે છે.
ઉકેલ: જરૂરી હસ્તલેખનનું અનુવાદ પહેલાં મેન્યુઅલી ટ્રાન્સક્રિપ્શન કરો.
મિશ્ર ભાષાઓ
OCR ત્યારે શ્રેષ્ઠ કામ કરે છે જ્યારે તેને સ્રોત ભાષા ખબર હોય. અંગ્રેજી, ફ્રેન્ચ, અને ચીની ધરાવતા સ્કેનમાં OCR ફક્ત એક જ ભાષા માટે સેટ હોય તો નિષ્ફળ થઈ શકે છે.
ઉકેલ: જો ટૂલ સપોર્ટ કરે તો સંબંધિત બધી OCR ભાષાઓ પસંદ કરો, પછી દરેક ભાષા વિભાગને સ્પોટ-ચેક કરો.
ગોપનીયતા અને સુરક્ષા ચેકલિસ્ટ
સ્કેન કરેલ PDF ક્યાંય પણ અપલોડ કરતાં પહેલાં પૂછો:
- શું દસ્તાવેજમાં વ્યક્તિગત ડેટા છે?
- શું તેમાં મેડિકલ, કાનૂની, નાણાકીય, શૈક્ષણિક, અથવા અપ્રકાશિત સામગ્રી છે?
- શું તે ક્લાયન્ટ એગ્રીમેન્ટ અથવા શાળાની નીતિ હેઠળ આવરે છે?
- શું આ દસ્તાવેજ માટે ઑનલાઇન OCR સેવા માન્ય છે?
- શું તેના બદલે તમને લોકલ વર્કફ્લો જોઈએ?
- શું તમે અનુવાદ ન કરવાના પાનાં દૂર કરી શકો છો?
સ્કેન કરેલા PDF ઘણી વાર સંવેદનશીલ હોય છે કારણ કે તે કરારો, ઓળખપત્રો, ફોર્મ્સ, સંશોધન ડ્રાફ્ટ્સ, અને આંતરિક આર્કાઇવ્સમાંથી આવે છે. OCR અપલોડનો નિર્ણય લેતી વખતે એ જ સાવચેતી રાખો જે તમે મૂળ દસ્તાવેજ માટે રાખતા.
FAQ
હું સ્કેન કરેલ PDF નો અનુવાદ કેવી રીતે કરું?
પહેલા OCR ચલાવી ટેક્સ્ટ લેયર બનાવો, OCR આઉટપુટની સમીક્ષા કરો, પછી PDF અનુવાદક સાથે OCR-પ્રોસેસ કરેલ PDF નો અનુવાદ કરો. OCR સમીક્ષાનું પગલું છોડશો નહીં.
Google Translate એ મારું સ્કેન કરેલ PDF અનુવાદ કેમ ન કર્યું?
PDF ફક્ત-ચિત્રવાળી હોઈ શકે છે. જો તેમાં ટેક્સ્ટ લેયર નથી, તો Google Translate પાસે કાઢવા માટે ટેક્સ્ટ નથી. પહેલા OCR કરો, પછી અનુવાદ કરો. Google-વિશેષ વર્કફ્લો Google Translate PDF માર્ગદર્શિકા માં આવરી લેવાયો છે.
શું ChatGPT સ્કેન કરેલ PDF નો અનુવાદ કરી શકે?
ChatGPT અલગ-અલગ ચિત્રો અથવા કાઢવામાં આવેલ ટેક્સ્ટમાં મદદ કરી શકે છે, પરંતુ બહુ-પાનાંવાળી સ્કેન કરેલ PDF માટે હજી પણ OCR અને સમીક્ષા જરૂરી છે. સંપૂર્ણ દસ્તાવેજ વર્કફ્લો માટે, પહેલા OCR કરો, પછી PDF અનુવાદ વર્કફ્લો ઉપયોગ કરો.
સ્કેન કરેલા PDF માટે શ્રેષ્ઠ OCR ટૂલ કયું છે?
તે દસ્તાવેજ પર નિર્ભર છે. Acrobat અને ABBYY-પ્રકારના ટૂલ્સ સામાન્ય અને જટિલ સ્કેન્સ માટે ઉપયોગી છે. Tesseract અથવા OCRmyPDF લોકલ ટેક્નિકલ વર્કફ્લોઝ માટે ઉપયોગી છે. ઓછી જોખમવાળી સરળ ફાઇલો માટે ઑનલાઇન OCR યોગ્ય હોઈ શકે છે, પરંતુ ગોપનીયતા અને ગુણવત્તા બદલાય છે.
શું OCR ફોર્મેટિંગ જાળવી શકે?
OCR ટેક્સ્ટ લેયર બનાવી શકે છે અને ક્યારેક વાંચન ક્રમ પણ પુનઃપ્રાપ્ત કરી શકે છે, પરંતુ તે મૂળ અનુવાદિત લેઆઉટ જાળવવા જેવું નથી. OCR પછી PDF અનુવાદ વર્કફ્લો ઉપયોગ કરો અને આઉટપુટને મૂળ દસ્તાવેજ સાથે સરખાવો.
જો OCR ની ગુણવત્તા ખરાબ હોય તો શું કરવું?
અનુવાદ પહેલાં સ્કેન સુધારો. શક્ય હોય તો ફરી સ્કેન કરો, પાનાંનું ઝુકાવ સીધું કરો, કોન્ટ્રાસ્ટ વધારો, ગંદકી કાપી કાઢો, યોગ્ય OCR ભાષા પસંદ કરો, અને મુશ્કેલ પાનાં ફરી તપાસો.