BookTranslator
BookTranslator

સ્કેન કરેલ PDF નો અનુવાદ કેવી રીતે કરવો: સંપૂર્ણ OCR + અનુવાદ માર્ગદર્શિકા

સ્કેન કરેલ PDF માં વાસ્તવિક ટેક્સ્ટ નહીં પરંતુ ટેક્સ્ટના ચિત્રો હોય છે — તેથી Google Translate તેને બદલ્યા વગર જ પરત આપે છે. તેને ઠીક કરતી OCR + AI પાઇપલાઇન અહીં છે.

BookTranslator

BookTranslator Team

અનુવાદ માર્ગદર્શિકા11 min read

ઝડપી જવાબ: સ્કેન કરેલ PDF ને અનુવાદ પહેલાં OCR જરૂરી છે

સ્કેન કરેલ PDF નો અનુવાદ કરવા માટે, પહેલા OCR ચલાવો જેથી પાનાંના ચિત્રો પસંદ કરી શકાય તેવા ટેક્સ્ટમાં ફેરવાઈ જાય. પછી PDF અનુવાદક જેવા દસ્તાવેજ અનુવાદક સાથે OCR-પ્રોસેસ કરેલ PDF નો અનુવાદ કરો. જો તમે OCR છોડો, તો ઘણા અનુવાદ ટૂલ્સ મૂળ ફાઇલ જ બદલ્યા વગર પરત આપશે, કેટલાક પાનાં ચૂકી જશે, અથવા ફક્ત તે જ ભાગોનું અનુવાદ કરશે જેમાં પહેલેથી ટેક્સ્ટ લેયર છે.

આ વર્કફ્લો ઉપયોગ કરો:

  1. PDF ખોલો અને એક વાક્ય પસંદ કરવાનો પ્રયાસ કરો.
  2. જો તમે ટેક્સ્ટ પસંદ ન કરી શકો, તો OCR ચલાવો.
  3. અનુવાદ પહેલાં OCR ટેક્સ્ટની સમીક્ષા કરો.
  4. OCR-પ્રોસેસ કરેલ PDF ને PDF અનુવાદક માં અપલોડ કરો.
  5. અનુવાદિત આઉટપુટને મૂળ સ્કેન સાથે સરખાવો.

જો તમારી PDF માં પહેલેથી પસંદ કરી શકાય તેવો ટેક્સ્ટ છે અને સમસ્યા લેઆઉટ જાળવવાની છે, તો ફોર્મેટિંગ ગુમાવ્યા વગર PDF નો અનુવાદ કેવી રીતે કરવો માર્ગદર્શિકા ઉપયોગ કરો.

સ્કેન કરેલ PDF અનુવાદ ટૂલ્સમાં કેમ નિષ્ફળ જાય છે

સ્કેન કરેલ PDF ઘણી વાર PDF કન્ટેનર અંદર પાનાંના ચિત્રોના સમૂહ જેવું જ હોય છે. માણસને પાનાં પર શબ્દો દેખાય છે, પરંતુ સોફ્ટવેર માટે તેમાંથી ટેક્સ્ટ કાઢી શકાય તેવો વાસ્તવિક ટેક્સ્ટ ફાઇલમાં હોવો જરૂરી નથી.

તે એક સરળ નિષ્ફળતા ઉભી કરે છે:

ફાઇલનો પ્રકારઅનુવાદક શું જુએ છેશું થાય છે
ટેક્સ્ટ-આધારિત PDFટેક્સ્ટ અને લેઆઉટ ડેટાઅનુવાદ તરત શરૂ થઈ શકે છે.
ફક્ત-ચિત્રવાળી સ્કેન PDFપાનાંના ચિત્રોપહેલા OCR જરૂરી છે.
ટેક્સ્ટ-ઓવર-ઇમેજ PDFસ્કેન ચિત્ર અને છુપાયેલું OCR ટેક્સ્ટ લેયરઅનુવાદ થઈ શકે છે, પરંતુ OCR ભૂલો ગુણવત્તાને અસર કરે છે.

સૌથી ઉપયોગી ટેસ્ટ ટેક્નિકલ નથી:

  1. PDF ખોલો.
  2. અલગ-અલગ શબ્દોને હાઇલાઇટ કરવાનો પ્રયાસ કરો.
  3. એક વાક્ય નકલ કરો.
  4. તેને ટેક્સ્ટ એડિટરમાં પેસ્ટ કરો.

જો વાક્ય યોગ્ય રીતે પેસ્ટ થાય, તો PDF માં ટેક્સ્ટ લેયર છે. જો કશું પેસ્ટ ન થાય, અથવા આખું પાનું એક જ ચિત્રની જેમ વર્તે, તો PDF ને OCR જરૂરી છે.

OCR વૈકલ્પિક નથી

OCR નો અર્થ optical character recognition થાય છે. તે ચિત્રમાંથી ટેક્સ્ટ વાંચે છે અને મશીન-રીડેબલ ટેક્સ્ટ બનાવે છે. PDF અનુવાદ માટે, OCR સામાન્ય રીતે સ્કેન કરેલા પાનાં ઉપર અદૃશ્ય ટેક્સ્ટ લેયર બનાવે છે.

આ ટેક્સ્ટ લેયર અનુવાદ માટે સ્રોત બને છે. જો OCR ભૂલો કરે, તો અનુવાદ પણ એ જ ભૂલો વારસામાં મેળવે છે.

OCR ની સામાન્ય ભૂલો:

OCR ભૂલઅનુવાદનું જોખમ
rn ને m તરીકે વાંચવુંશબ્દનો અર્થ બદલાઈ જાય છે.
1 ને l તરીકે વાંચવુંઆંકડા, સંદર્ભો, અથવા કોડ ખોટા થઈ જાય છે.
O ને 0 તરીકે વાંચવુંID, સૂત્રો, અને નામ તૂટી શકે છે.
ઍક્સન્ટ્સ ગુમાવી દેવાનામો અને શબ્દો અચોક્કસ બની જાય છે.
કૉલમ્સ ભળી જવાવાક્યો ખોટા ક્રમમાં અનુવાદિત થાય છે.
ટેબલ સેલ્સને પંક્તિ પ્રમાણે ખોટી રીતે વાંચવાડેટા લેબલ્સ હવે મૂલ્યો સાથે મેળ ખાતા નથી.
ફૂટનોટ્સને મુખ્ય લખાણ માનવુંcitation અને નોંધો ખોટા સંદર્ભમાં ખસી જાય છે.

એટલા માટે OCR સમીક્ષા પગલું મહત્વપૂર્ણ છે. જ્યાં સુધી તમે કાઢવામાં આવેલ ટેક્સ્ટને ચકાસી ન લો, ત્યાં સુધી સ્કેન કરેલા દસ્તાવેજનો અનુવાદ ન કરો.

OCR-પ્રથમ વર્કફ્લો

પગલું 1: PDF નો પ્રકાર ઓળખો

ટેક્સ્ટ પસંદ કરવાનો પ્રયાસ કરો. જો પસંદગી કામ કરે, તો કદાચ તમને OCR ની જરૂર ન પડે. જો પસંદગી કામ ન કરે, તો ફાઇલને ફક્ત-ચિત્રવાળી માનો.

પાનાંને દૃશ્ય રીતે પણ તપાસો:

  • ઝુકેલા પાનાં સ્કેન સૂચવે છે.
  • રાખોડી કાગળની ટેક્સ્ચર સ્કેન સૂચવે છે.
  • મધ્ય બંધાણ પાસે પડછાયા હોય તો ફોટોગ્રાફ કરાયેલ પુસ્તક હોઈ શકે.
  • અસમાન કોન્ટ્રાસ્ટ ફોટોકૉપી સૂચવે છે.
  • દેખાતા શબ્દો શોધથી ન મળે તો ટેક્સ્ટ લેયર ન હોવાની શક્યતા છે.

પગલું 2: શક્ય હોય તો સ્કેન સુધારો

OCR ની ગુણવત્તાની શરૂઆત ચિત્રની ગુણવત્તાથી થાય છે. જો તમે ફરી સ્કેન કરી શકો, તો OCR ભૂલો સુધારવામાં સમય ખર્ચવા પહેલાં તે કરો.

આ ઇમેજ-ક્વોલિટી ચેકલિસ્ટ ઉપયોગ કરો:

  • નાનાં લખાણ માટે પૂરતી ઊંચી રિઝોલ્યુશનમાં સ્કેન કરો.
  • પાનાં સમતલ અને સીધાં રાખો.
  • મધ્ય બંધાણ પાસે પડછાયા ટાળો.
  • ટેબલની કિનારીઓ, આંગળીઓ, અથવા પાછળની ગંદકી કાપી કાઢો.
  • લખાણ અને પાનાં વચ્ચે મજબૂત કોન્ટ્રાસ્ટ રાખો.
  • આખી લાઇન સ્પષ્ટ દેખાય તે સુનિશ્ચિત કરો.
  • પાનાંની યોગ્ય દિશા રાખો.
  • ચિત્રને એટલું વધુ કમ્પ્રેસ ન કરો કે અક્ષરો ધૂંધળા થઈ જાય.

જૂના પુસ્તકો અને ફોટોકૉપી માટે સૌથી મોટા સુધારા સામાન્ય રીતે પાનાંનું ઝુકાવ સીધું કરવાથી, કોન્ટ્રાસ્ટ સુધારવાથી, અને ફોકસ બહાર ગયેલા પાનાં ફરી સ્કેન કરવાથી મળે છે.

પગલું 3: OCR ચલાવો

OCR ટૂલ બ્રાન્ડ પરથી નહીં, દસ્તાવેજ પરથી પસંદ કરો.

OCR વિકલ્પક્યારે શ્રેષ્ઠકઈ બાબતનું ધ્યાન રાખવું
Adobe Acrobat OCRસામાન્ય બિઝનેસ સ્કેન્સ અને PDF સફાઈઆધાર રાખતા પહેલાં હાલની પ્લાન ઍક્સેસ ચકાસો.
ABBYY FineReaderજટિલ સ્કેન્સ, ટેબલ્સ, કૉલમ્સ, અને મુશ્કેલ લેઆઉટ્સહજી પણ મેન્યુઅલ સમીક્ષા જરૂરી છે.
Tesseract or OCRmyPDFલોકલ, ટેક્નિકલ, ફરી કરી શકાય તેવા OCR વર્કફ્લોઝકમાન્ડ-લાઇન ટૂલ્સમાં સુવિધા જરૂરી છે.
Online OCR toolsક્યારેક આવતી ઓછી જોખમી ફાઇલો માટેગોપનીયતા, ફાઇલ મર્યાદા, અને ગુણવત્તા બદલાય છે.
Phone scanning appsનવું સ્કેન ઝડપથી કૅપ્ચર કરવા માટેપરસ્પેક્ટિવ ડિસ્ટોર્શન OCR ને નુકસાન પહોંચાડી શકે છે.

ખાનગી કરારો, મેડિકલ રેકોર્ડ્સ, નાણાકીય દસ્તાવેજો, અપ્રકાશિત પાંડુલિપિઓ, અથવા સમીક્ષા હેઠળનું શૈક્ષણિક કામ માટે લોકલ OCR વર્કફ્લો અથવા વિશ્વસનીય નિયંત્રિત પર્યાવરણ પસંદ કરો. સંવેદનશીલ સ્કેન્સને અજાણી ફ્રી OCR સાઇટ્સ પર અપલોડ ન કરો.

પગલું 4: OCR ટેક્સ્ટની સમીક્ષા કરો

સમીક્ષા અનુવાદ પછી નહીં, પહેલાં કરો. કેટલાક મુશ્કેલ પાનાંમાંથી ટેક્સ્ટ નકલ કરો અને તપાસો કે તે વાંચી શકાય છે કે નહીં.

ચકાસવા માટેના નમૂના પાનાં:

  • ટાઇટલ પેજ.
  • ગાઢ મુખ્ય લખાણવાળું પાનું.
  • ટેબલવાળું પાનું.
  • ફૂટનોટ્સવાળું પાનું.
  • નાનાં લખાણવાળું પાનું.
  • સ્ટેમ્પ, હસ્તલેખન, અથવા કિનારી નોંધોવાળું પાનું.
  • દસ્તાવેજ બહુભાષી હોય તો દરેક ભાષાનું એક પાનું.

આ માટે જુઓ:

  • ગુમ થયેલા પેરાગ્રાફ્સ.
  • ભળેલા કૉલમ્સ.
  • તૂટેલા શબ્દો.
  • ખોટા અક્ષરો.
  • ગુમ થયેલા diacritics.
  • મૂલ્યોથી અલગ પડેલા ટેબલ લેબલ્સ.
  • મુખ્ય લખાણમાં દાખલ થયેલા હેડર્સ.
  • વાક્યોમાં ભળેલા પાનાં નંબરો.

જો OCR ની ગુણવત્તા નબળી હોય, તો અનુવાદ પહેલાં તેને સુધારો. OCR એ અર્થ જ પકડ્યો ન હોય, તો અનુવાદક વિશ્વસનીય રીતે તેને પાછો મેળવી શકતો નથી.

પગલું 5: OCR-પ્રોસેસ કરેલ PDF નો અનુવાદ કરો

જ્યારે PDF માં સ્વચ્છ ટેક્સ્ટ લેયર આવી જાય, ત્યારે તેને PDF અનુવાદક માં અપલોડ કરો. હવે અનુવાદનું પગલું પાનાંના ચિત્રો બદલે ટેક્સ્ટ સાથે કામ કરી શકે છે.

અનુવાદ પછી આ સરખાવો:

  • મૂળ સ્કેન
  • OCR ટેક્સ્ટ લેયર
  • અનુવાદિત PDF

આ ત્રણ-માર્ગીય સમીક્ષા તમને ઓળખવામાં મદદ કરે છે કે ભૂલ OCR માંથી આવી કે અનુવાદમાંથી. જો OCR ટેક્સ્ટ ખોટો હોય, તો OCR ફરી ચલાવો. જો OCR ટેક્સ્ટ સાચો હોય પણ અનુવાદ ખોટો હોય, તો અનુવાદ સુધારો.

પગલું 6: ઊંચા જોખમવાળી સામગ્રીની સમીક્ષા કરો

સ્કેન કરેલા દસ્તાવેજોમાં ઘણી વાર ખાસ એવી સામગ્રી હોય છે જેને ધ્યાનપૂર્વક ચકાસવાની જરૂર પડે છે: જૂના કરારો, સરકારી ફોર્મ્સ, શૈક્ષણિક પેપર્સ, મેન્યુઅલ્સ, ઐતિહાસિક દસ્તાવેજો, અને પુસ્તકનાં પાનાં.

આ વસ્તુઓ મેન્યુઅલી ચકાસો:

  • નામો
  • તારીખો
  • આંકડા
  • સરનામાં
  • પ્રોડક્ટ કોડ્સ
  • કાનૂની સંદર્ભો
  • citation
  • ટેબલ લેબલ્સ
  • એકમો
  • સમીકરણો
  • કૅપ્શન્સ
  • ફૂટનોટ્સ

સંશોધન અને શૈક્ષણિક ફાઇલો માટે શૈક્ષણિક સંશોધન પેપર્સનું અનુવાદ માર્ગદર્શિકા પણ વાંચો, કારણ કે સ્કેન કરેલા શૈક્ષણિક PDF માં OCR જોખમ ઉપરાંત citation અને લેઆઉટના જોખમ પણ ઉમેરાય છે.

બાજુ-બાજુમાં નિષ્ફળતા ઉદાહરણો

OCR આઉટપુટની સમીક્ષા કરતી વખતે આ ટેબલ ઉપયોગ કરો.

મૂળ સ્કેનમાં સંભાવિત લખાણખરાબ OCR આઉટપુટતે શા માટે મહત્વનું છે
modernmodemઅર્થ સંપૂર્ણપણે બદલાઈ જાય છે.
Section 10Section IOકાનૂની અથવા ટેક્નિકલ સંદર્ભો તૂટી શકે છે.
20262O26તારીખો અને ID અવિશ્વસનીય બની જાય છે.
patientpatlentમેડિકલ અથવા ટેક્નિકલ શબ્દો ખોટા થઈ જાય છે.
બે અલગ કૉલમ્સએક ભળેલો પેરાગ્રાફઅનુવાદ વાક્યોને ખોટા ક્રમમાં વાંચે છે.
લેબલ્સ અને મૂલ્યોવાળી ટેબલ પંક્તિભળેલા લખાણની એક જ લાઇનડેટા હવે સાચા લેબલ સાથે નકશો થતો નથી.
ફૂટનોટ માર્કર 1અક્ષર lનોંધો ખોટા વાક્ય સાથે જોડાઈ શકે છે.

જો તમને OCR લેયરમાં આવી ભૂલો દેખાય, તો અનુવાદ પહેલાં OCR સુધારો.

તમારે કયું ટૂલ ઉપયોગ કરવું જોઈએ?

દસ્તાવેજની મુશ્કેલી પ્રમાણે પસંદ કરો.

દસ્તાવેજભલામણ કરેલો માર્ગ
સ્વચ્છ બિઝનેસ સ્કેનAcrobat અથવા બીજા વિશ્વસનીય OCR ટૂલમાં OCR કરો, પછી PDF અનુવાદક.
જૂના પુસ્તકનું સ્કેનઝુકાવ સીધો કરો અને કોન્ટ્રાસ્ટ સુધારો, OCR ધ્યાનથી ચલાવો, પછી અનુવાદ કરો.
શૈક્ષણિક પેપરનું સ્કેનOCR કરો, સમીકરણો/citation/ટેબલ્સ તપાસો, પછી લેઆઉટ સમીક્ષા સાથે અનુવાદ કરો.
હસ્તલેખ નોંધોઅનુવાદ પહેલાં મેન્યુઅલ ટ્રાન્સક્રિપ્શન જરૂરી થઈ શકે છે.
સરળ વ્યક્તિગત દસ્તાવેજજો ગોપનીયતાનું જોખમ ઓછું હોય તો ઑનલાઇન OCR સ્વીકાર્ય હોઈ શકે છે.
સંવેદનશીલ દસ્તાવેજલોકલ OCR અથવા વિશ્વસનીય નિયંત્રિત વર્કફ્લો ઉપયોગ કરો.

જો તમે વધુ વ્યાપક ટૂલ સરખામણી ઇચ્છતા હો, તો શ્રેષ્ઠ PDF અનુવાદક માર્ગદર્શિકા જુઓ.

સ્કેન કરેલા PDF ની સામાન્ય સમસ્યાઓ

ઓછી રિઝોલ્યુશનવાળા પાનાં

ઓછી રિઝોલ્યુશનવાળા સ્કેન્સમાં અક્ષરો એકબીજા સાથે ધૂંધળાં થઈ જાય છે. OCR rn અને m, cl અને d, અથવા punctuation અને ધૂળ વચ્ચે ગૂંચવાઈ શકે છે.

ઉકેલ: શક્ય હોય તો ફરી સ્કેન કરો. નહીં તો કોન્ટ્રાસ્ટ વધારો અને OCR ફરી અજમાવો.

ઝુકેલા અથવા વળાંકવાળા પાનાં

પુસ્તકના સ્કેન્સમાં મધ્ય બંધાણ પાસે વળાંક આવતો હોય છે. OCR આ વળાંકવાળી લાઇનોને ખરાબ રીતે વાંચે છે અને લખાણનો ક્રમ પણ બદલી શકે છે.

ઉકેલ: પાનું સમતલ કરો, ફરી સ્કેન કરો, અથવા deskew અને dewarping ધરાવતું OCR ટૂલ ઉપયોગ કરો.

બહુ-કૉલમ લેઆઉટ

OCR ડાબા અને જમણા કૉલમને ભેળવીને એક જ વાક્ય પ્રવાહમાં ફેરવી શકે છે.

ઉકેલ: અનુવાદ પહેલાં વાંચન ક્રમ તપાસો. શૈક્ષણિક પેપર્સમાં અહીં ખાસ ધ્યાન જોઈએ.

ટેબલ્સ

ટેબલ્સ મુશ્કેલ છે કારણ કે OCR ને ટેક્સ્ટ અને માળખું બન્ને ઓળખવું પડે છે. ટેબલ દેખાવમાં સાચી લાગે છતાં ટેક્સ્ટ લેયર ખોટી હોઈ શકે છે.

ઉકેલ: ટેબલમાંથી OCR ટેક્સ્ટ નકલ કરો અને ખાતરી કરો કે લેબલ્સ હજી પણ મૂલ્યો સાથે મેળ ખાતા હોય.

હસ્તલેખન અને સહી

પ્રિન્ટેડ ટેક્સ્ટ માટે OCR, હસ્તલેખ ઓળખ કરતાં ઘણી વધુ વિશ્વસનીય છે. હાથથી લખાયેલી કિનારી નોંધો, સહીઓ, અને ભરેલા ફોર્મ્સ ચૂકી જઈ શકે છે અથવા ગૂંચવાઈ શકે છે.

ઉકેલ: જરૂરી હસ્તલેખનનું અનુવાદ પહેલાં મેન્યુઅલી ટ્રાન્સક્રિપ્શન કરો.

મિશ્ર ભાષાઓ

OCR ત્યારે શ્રેષ્ઠ કામ કરે છે જ્યારે તેને સ્રોત ભાષા ખબર હોય. અંગ્રેજી, ફ્રેન્ચ, અને ચીની ધરાવતા સ્કેનમાં OCR ફક્ત એક જ ભાષા માટે સેટ હોય તો નિષ્ફળ થઈ શકે છે.

ઉકેલ: જો ટૂલ સપોર્ટ કરે તો સંબંધિત બધી OCR ભાષાઓ પસંદ કરો, પછી દરેક ભાષા વિભાગને સ્પોટ-ચેક કરો.

ગોપનીયતા અને સુરક્ષા ચેકલિસ્ટ

સ્કેન કરેલ PDF ક્યાંય પણ અપલોડ કરતાં પહેલાં પૂછો:

  • શું દસ્તાવેજમાં વ્યક્તિગત ડેટા છે?
  • શું તેમાં મેડિકલ, કાનૂની, નાણાકીય, શૈક્ષણિક, અથવા અપ્રકાશિત સામગ્રી છે?
  • શું તે ક્લાયન્ટ એગ્રીમેન્ટ અથવા શાળાની નીતિ હેઠળ આવરે છે?
  • શું આ દસ્તાવેજ માટે ઑનલાઇન OCR સેવા માન્ય છે?
  • શું તેના બદલે તમને લોકલ વર્કફ્લો જોઈએ?
  • શું તમે અનુવાદ ન કરવાના પાનાં દૂર કરી શકો છો?

સ્કેન કરેલા PDF ઘણી વાર સંવેદનશીલ હોય છે કારણ કે તે કરારો, ઓળખપત્રો, ફોર્મ્સ, સંશોધન ડ્રાફ્ટ્સ, અને આંતરિક આર્કાઇવ્સમાંથી આવે છે. OCR અપલોડનો નિર્ણય લેતી વખતે એ જ સાવચેતી રાખો જે તમે મૂળ દસ્તાવેજ માટે રાખતા.

FAQ

હું સ્કેન કરેલ PDF નો અનુવાદ કેવી રીતે કરું?

પહેલા OCR ચલાવી ટેક્સ્ટ લેયર બનાવો, OCR આઉટપુટની સમીક્ષા કરો, પછી PDF અનુવાદક સાથે OCR-પ્રોસેસ કરેલ PDF નો અનુવાદ કરો. OCR સમીક્ષાનું પગલું છોડશો નહીં.

Google Translate એ મારું સ્કેન કરેલ PDF અનુવાદ કેમ ન કર્યું?

PDF ફક્ત-ચિત્રવાળી હોઈ શકે છે. જો તેમાં ટેક્સ્ટ લેયર નથી, તો Google Translate પાસે કાઢવા માટે ટેક્સ્ટ નથી. પહેલા OCR કરો, પછી અનુવાદ કરો. Google-વિશેષ વર્કફ્લો Google Translate PDF માર્ગદર્શિકા માં આવરી લેવાયો છે.

શું ChatGPT સ્કેન કરેલ PDF નો અનુવાદ કરી શકે?

ChatGPT અલગ-અલગ ચિત્રો અથવા કાઢવામાં આવેલ ટેક્સ્ટમાં મદદ કરી શકે છે, પરંતુ બહુ-પાનાંવાળી સ્કેન કરેલ PDF માટે હજી પણ OCR અને સમીક્ષા જરૂરી છે. સંપૂર્ણ દસ્તાવેજ વર્કફ્લો માટે, પહેલા OCR કરો, પછી PDF અનુવાદ વર્કફ્લો ઉપયોગ કરો.

સ્કેન કરેલા PDF માટે શ્રેષ્ઠ OCR ટૂલ કયું છે?

તે દસ્તાવેજ પર નિર્ભર છે. Acrobat અને ABBYY-પ્રકારના ટૂલ્સ સામાન્ય અને જટિલ સ્કેન્સ માટે ઉપયોગી છે. Tesseract અથવા OCRmyPDF લોકલ ટેક્નિકલ વર્કફ્લોઝ માટે ઉપયોગી છે. ઓછી જોખમવાળી સરળ ફાઇલો માટે ઑનલાઇન OCR યોગ્ય હોઈ શકે છે, પરંતુ ગોપનીયતા અને ગુણવત્તા બદલાય છે.

શું OCR ફોર્મેટિંગ જાળવી શકે?

OCR ટેક્સ્ટ લેયર બનાવી શકે છે અને ક્યારેક વાંચન ક્રમ પણ પુનઃપ્રાપ્ત કરી શકે છે, પરંતુ તે મૂળ અનુવાદિત લેઆઉટ જાળવવા જેવું નથી. OCR પછી PDF અનુવાદ વર્કફ્લો ઉપયોગ કરો અને આઉટપુટને મૂળ દસ્તાવેજ સાથે સરખાવો.

જો OCR ની ગુણવત્તા ખરાબ હોય તો શું કરવું?

અનુવાદ પહેલાં સ્કેન સુધારો. શક્ય હોય તો ફરી સ્કેન કરો, પાનાંનું ઝુકાવ સીધું કરો, કોન્ટ્રાસ્ટ વધારો, ગંદકી કાપી કાઢો, યોગ્ય OCR ભાષા પસંદ કરો, અને મુશ્કેલ પાનાં ફરી તપાસો.