Skan qilingan PDF’ni qanday tarjima qilish kerak: OCR + tarjima bo‘yicha to‘liq qo‘llanma

Skan qilingan PDF’larda haqiqiy matn emas, matnning rasmlari bo‘ladi — shu sababli Google Translate ularni o‘zgartirmasdan qaytaradi. Buni tuzatadigan OCR + AI ish jarayoni mana shu.

BookTranslator Team

Tarjima qo'llanmalari2026-02-2810 min read

Tezkor javob: skan qilingan PDF tarjimadan oldin OCR’dan o‘tishi kerak

Skan qilingan PDF’ni tarjima qilish uchun avval sahifa rasmlarini tanlanadigan matnga aylantirish uchun OCR’ni ishga tushiring. So‘ng OCR ishlovidan o‘tgan PDF’ni PDF tarjimoni kabi hujjat tarjimoni bilan tarjima qiling. Agar OCR bosqichini o‘tkazib yuborsangiz, ko‘plab tarjima vositalari asl faylni o‘zgartirmasdan qaytaradi, ayrim sahifalarni tushirib qoldiradi yoki faqat allaqachon matn qatlami mavjud bo‘lgan qismlarnigina tarjima qiladi.

Quyidagi ish jarayonidan foydalaning:

PDF’ni oching va bitta gapni belgilab ko‘rishga urinib ko‘ring.
Agar matnni belgilay olmasangiz, OCR’ni ishga tushiring.
Tarjima qilishdan oldin OCR matnini tekshirib chiqing.
OCR ishlovidan o‘tgan PDF’ni PDF tarjimoniga yuklang.
Tarjima qilingan natijani asl skan bilan solishtirib tekshiring.

Agar PDF’ingizda allaqachon tanlanadigan matn bo‘lsa va muammo maketni saqlashda bo‘lsa, formatlashni yo‘qotmasdan PDF tarjima qilish qo‘llanmasidan foydalaning.

Nega skan qilingan PDF’lar tarjima vositalarida ishlamay qoladi

Skan qilingan PDF ko‘pincha PDF konteyneri ichidagi sahifa rasmlari to‘plamidan iborat bo‘ladi. Sahifada odam so‘zlarni ko‘rishi mumkin, ammo fayl ichida dastur ajratib olishi uchun haqiqiy matn bo‘lmasligi mumkin.

Bu oddiy nosozlikni keltirib chiqaradi:

Fayl turi	Tarjimon nimani ko‘radi	Nima sodir bo‘ladi
Matnga asoslangan PDF	Matn va maket ma’lumotlari	Tarjima darhol boshlanishi mumkin.
Faqat rasmdan iborat skan PDF	Sahifa rasmlari	Avval OCR kerak bo‘ladi.
Rasm ustidagi matnli PDF	Skan rasmi va yashirin OCR matn qatlami	Tarjima ishlashi mumkin, ammo OCR xatolari sifatga ta’sir qiladi.

Eng foydali tekshiruv texnik emas:

PDF’ni oching.
Alohida so‘zlarni belgilab ko‘rishga harakat qiling.
Bitta gapni nusxalang.
Uni matn muharririga joylashtiring.

Agar gap to‘g‘ri qo‘yilsa, PDF’da matn qatlami bor. Hech narsa qo‘yilmasa yoki butun sahifa bitta rasmdek tutsa, PDF’ga OCR kerak.

OCR majburiy

OCR optik belgilarni tanishni anglatadi. U rasmdagi matnni o‘qiydi va mashina o‘qiy oladigan matn yaratadi. PDF tarjimasida OCR odatda skan qilingan sahifa ustiga ko‘rinmas matn qatlamini yaratadi.

Ana shu matn qatlami tarjima uchun manbaga aylanadi. Agar OCR xato qilsa, tarjima ham o‘sha xatolarni meros qilib oladi.

OCR’da tez-tez uchraydigan xatolar:

OCR xatosi	Tarjima uchun xavf
`rn` `m` deb o‘qiladi	So‘zlarning ma’nosi o‘zgaradi.
`1` `l` deb o‘qiladi	Raqamlar, havolalar yoki kodlar xato bo‘lib qoladi.
`O` `0` deb o‘qiladi	IDlar, formulalar va nomlar buzilishi mumkin.
Diakritik belgilar tushib qoladi	Ismlar va atamalar noaniq bo‘lib qoladi.
Ustunlar birlashtirib yuboriladi	Gaplar noto‘g‘ri tartibda tarjima qilinadi.
Jadval kataklari qator bo‘yicha noto‘g‘ri o‘qiladi	Ma’lumot yorliqlari endi qiymatlarga mos kelmaydi.
Pastki izohlar asosiy matn deb olinadi	Iqtiboslar va izohlar noto‘g‘ri kontekstga ko‘chib ketadi.

Shuning uchun OCR natijasini ko‘rib chiqish bosqichi muhim. Ajratib olingan matnni tekshirib ko‘rmasdan turib skan qilingan hujjatni tarjima qilmang.

Avval OCR qilinadigan ish jarayoni

1-qadam: PDF turini aniqlang

Matnni tanlashga urinib ko‘ring. Agar tanlash ishlasa, sizga OCR kerak bo‘lmasligi mumkin. Agar tanlash ishlamasa, faylni faqat rasmdan iborat deb qabul qiling.

Sahifani ko‘z bilan ham tekshiring:

Qiyshaygan sahifalar skan ekanini ko‘rsatadi.
Kulrang qog‘oz teksturasi skan ekanini ko‘rsatadi.
Kitobning bog‘lama joyi yaqinidagi soyalar suratga olingan kitobdan darak beradi.
Notekis kontrast fotonusxani anglatadi.
Qidiruv ko‘rinib turgan so‘zlarni topmasa, matn qatlami yo‘qligini ko‘rsatadi.

2-qadam: imkoni bo‘lsa, skanni yaxshilang

OCR sifati tasvir sifatidan boshlanadi. Agar qayta skan qila olsangiz, OCR xatolarini tuzatishga vaqt sarflashdan oldin shuni qiling.

Tasvir sifati uchun quyidagi ro‘yxatdan foydalaning:

Mayda matn uchun yetarli yuqori aniqlikda skan qiling.
Sahifalarni tekis va to‘g‘ri tuting.
Bog‘lama joyi yaqinida soya tushirmang.
Jadval chetlari, barmoqlar yoki fon shovqinini kesib tashlang.
Matn bilan sahifa orasida kuchli kontrast bo‘lsin.
Butun satr ko‘rinib tursin.
Sahifa yo‘nalishi to‘g‘ri bo‘lsin.
Harflar xiralashib ketadigan darajada tasvirni haddan tashqari siqmang.

Eski kitoblar va fotonusxalarda eng katta foyda odatda qiyshiqlikni to‘g‘rilash, kontrastni tuzatish va fokusdan chiqqan sahifalarni qayta skan qilishdan keladi.

3-qadam: OCR’ni ishga tushiring

OCR vositasini brendga qarab emas, hujjatga qarab tanlang.

OCR varianti	Eng mos holat	E’tibor bering
Adobe Acrobat OCR	Oddiy biznes skanlari va PDF tozalash	Unga tayanishdan oldin joriy tarifda kirish borligini tekshiring.
ABBYY FineReader	Murakkab skanlar, jadvallar, ustunlar va qiyin maketlar	Baribir qo‘lda tekshiruv talab etiladi.
Tesseract yoki OCRmyPDF	Mahalliy, texnik va takrorlanadigan OCR ish jarayonlari	Buyruq satri vositalari bilan ishlashga qulaylik talab qiladi.
Onlayn OCR vositalari	Xavfi past, vaqti-vaqti bilan uchraydigan fayllar	Maxfiylik, fayl cheklovlari va sifat turlicha bo‘ladi.
Telefon skanerlash ilovalari	Yangi skanni tezda olish	Perspektiva buzilishi OCR sifatiga zarar yetkazishi mumkin.

Maxfiy shartnomalar, tibbiy yozuvlar, moliyaviy hujjatlar, e’lon qilinmagan qo‘lyozmalar yoki ko‘rib chiqilayotgan ilmiy ishlar uchun mahalliy OCR ish jarayonini yoki ishonchli muhitni afzal ko‘ring. Maxfiy skanlarni tasodifiy bepul OCR saytlariga yuklamang.

4-qadam: OCR matnini tekshiring

Tarjimadan keyin emas, tarjimadan oldin tekshiring. Bir nechta qiyin sahifalardan matnni nusxalab, uni o‘qish mumkinmi-yo‘qligini ko‘ring.

Tekshirish uchun namunaviy sahifalar:

Sarlavha sahifasi.
Matni zich bo‘lgan asosiy sahifa.
Jadval bor sahifa.
Pastki izohlar bor sahifa.
Mayda matnli sahifa.
Muhrlar, qo‘lyozuv yoki chet izohlari bor sahifa.
Hujjat ko‘p tilli bo‘lsa, har bir tildan bittadan sahifa.

Quyidagilarni qidiring:

Yetishmayotgan paragraflar.
Birlashtirilgan ustunlar.
Buzilgan so‘zlar.
Noto‘g‘ri belgilar.
Yo‘qolgan diakritikalar.
Qiymatlardan ajralib qolgan jadval yorliqlari.
Sarlavhalarning asosiy matnga kirib qolishi.
Sahifa raqamlarining gaplarga aralashib ketishi.

Agar OCR sifati yomon bo‘lsa, tarjimadan oldin uni tuzating. OCR umuman ushlamagan ma’noni tarjimon ishonchli tarzda tiklay olmaydi.

5-qadam: OCR ishlovidan o‘tgan PDF’ni tarjima qiling

PDF’da toza matn qatlami paydo bo‘lgach, uni PDF tarjimoniga yuklang. Endi tarjima bosqichi sahifa rasmlari o‘rniga matn bilan ishlay oladi.

Tarjimadan keyin quyidagilarni solishtiring:

Asl skan
OCR matn qatlami
Tarjima qilingan PDF

Bu uch tomonlama taqqoslash xato OCR’danmi yoki tarjimadanmi ekanini aniqlashga yordam beradi. Agar OCR matni noto‘g‘ri bo‘lsa, OCR’ni qayta ishga tushiring. Agar OCR matni to‘g‘ri bo‘lib, tarjima noto‘g‘ri bo‘lsa, tarjimani tuzating.

6-qadam: xavfi yuqori kontentni tekshiring

Skan qilingan hujjatlar ko‘pincha aynan sinchiklab tekshirish talab qiladigan kontentni o‘z ichiga oladi: eski shartnomalar, hukumat blankalari, ilmiy maqolalar, qo‘llanmalar, tarixiy hujjatlar va kitob sahifalari.

Quyidagilarni qo‘lda tekshiring:

Ismlar
Sanalar
Raqamlar
Manzillar
Mahsulot kodlari
Huquqiy havolalar
Iqtiboslar
Jadval yorliqlari
O‘lchov birliklari
Tenglamalar
Rasm osti yozuvlari
Pastki izohlar

Tadqiqot va akademik fayllar uchun akademik tadqiqot maqolalarini tarjima qilish qo‘llanmasini ham o‘qing, chunki skan qilingan akademik PDF’lar OCR xavfiga qo‘shimcha ravishda iqtibos va maket xatarlarini ham olib keladi.

Yonma-yon xato misollari

OCR natijasini tekshirayotganda ushbu jadvaldan foydalaning.

Asl skanda ko‘rinishi ehtimol	Yomon OCR natijasi	Nega bu muhim
`modern`	`modem`	Ma’no butunlay o‘zgaradi.
`Section 10`	`Section IO`	Huquqiy yoki texnik havolalar buzilishi mumkin.
`2026`	`2O26`	Sanalar va IDlar ishonchsiz bo‘lib qoladi.
`patient`	`patlent`	Tibbiy yoki texnik atamalar xato bo‘lib qoladi.
Ikki alohida ustun	Bitta birlashtirilgan paragraf	Tarjima gaplarni noto‘g‘ri tartibda o‘qiydi.
Yorliqlar va qiymatlar bor jadval qatori	Aralash matndan iborat bitta satr	Ma’lumot endi to‘g‘ri yorliqqa ulanmaydi.
Pastki izoh belgisi `1`	Harf `l`	Izohlar noto‘g‘ri gapga ulanib qolishi mumkin.

Agar OCR qatlamida shu xatolarni ko‘rsangiz, tarjimadan oldin OCR’ni tuzating.

Qaysi vositadan foydalanish kerak?

Hujjat murakkabligiga qarab tanlang.

Hujjat	Tavsiya etiladigan yo‘l
Toza biznes skani	Acrobat yoki boshqa ishonchli OCR vositasida OCR qiling, so‘ng PDF tarjimonidan foydalaning.
Eski kitob skani	Qiyshiqlikni to‘g‘rilang, kontrastni yaxshilang, OCR’ni sinchiklab bajaring, so‘ng tarjima qiling.
Ilmiy maqola skani	OCR qiling, tenglamalar/iqtiboslar/jadvallarni tekshiring, so‘ng maketni ham ko‘rib chiqib tarjima qiling.
Qo‘lda yozilgan qaydlar	Tarjimadan oldin qo‘lda ko‘chirish talab qilinishi mumkin.
Oddiy shaxsiy hujjat	Agar maxfiylik xavfi past bo‘lsa, onlayn OCR maqbul bo‘lishi mumkin.
Maxfiy hujjat	Mahalliy OCR yoki ishonchli boshqariladigan ish jarayonidan foydalaning.

Agar vositalarning kengroq taqqoslovini xohlasangiz, eng yaxshi PDF tarjimonlari qo‘llanmasini ko‘ring.

Skan qilingan PDF’larda tez-tez uchraydigan muammolar

Past aniqlikdagi sahifalar

Past aniqlikdagi skanlar harflarni bir-biriga qorishtirib yuboradi. OCR rn va m, cl va d, yoki tinish belgisi bilan changni adashtirishi mumkin.

Tuzatish: iloji bo‘lsa, qayta skan qiling. Bo‘lmasa, kontrastni oshirib, OCR’ni yana urinib ko‘ring.

Qiyshaygan yoki egilgan sahifalar

Kitob skanlari ko‘pincha bog‘lama joyiga yaqin egiladi. OCR egri satrlarni yomon o‘qiydi va matn tartibini buzib yuborishi mumkin.

Tuzatish: sahifani tekislang, qayta skan qiling yoki qiyshiqlikni to‘g‘rilash va egrilikni tuzatishni qo‘llab-quvvatlaydigan OCR vositasidan foydalaning.

Ko‘p ustunli maket

OCR chap va o‘ng ustunlarni bitta gap oqimiga birlashtirib yuborishi mumkin.

Tuzatish: tarjimadan oldin o‘qish tartibini tekshiring. Bu yerda ilmiy maqolalar alohida e’tibor talab qiladi.

Jadvallar

Jadvallar qiyin, chunki OCR ham matnni, ham tuzilmani aniqlashi kerak. Jadval ko‘zga to‘g‘ri ko‘rinishi mumkin, ammo matn qatlami xato bo‘lishi mumkin.

Tuzatish: jadvaldagi OCR matnini nusxalab ko‘ring va yorliqlar hanuz qiymatlarga mos kelishini tasdiqlang.

Qo‘lyozma va imzolar

Bosma matn uchun OCR qo‘lyozuvni tanishga qaraganda ancha ishonchli. Chetdagi qo‘lyozma izohlar, imzolar va to‘ldirilgan blankalar o‘tkazib yuborilishi yoki buzib o‘qilishi mumkin.

Tuzatish: muhim qo‘lyozuvlarni tarjimadan oldin qo‘lda ko‘chirib yozing.

Aralash tillar

OCR manba tilini bilsa, eng yaxshi ishlaydi. Ingliz, fransuz va xitoy tillari aralashgan skan OCR faqat bitta tilga sozlangan bo‘lsa, muvaffaqiyatsiz chiqishi mumkin.

Tuzatish: agar vosita qo‘llab-quvvatlasa, OCR uchun barcha tegishli tillarni tanlang, keyin har bir til bo‘limini alohida tekshirib chiqing.

Maxfiylik va xavfsizlik bo‘yicha ro‘yxat

Skan qilingan PDF’ni biror joyga yuklashdan oldin, quyidagilarni so‘rang:

Hujjat shaxsiy ma’lumotlarni o‘z ichiga oladimi?
Unda tibbiy, huquqiy, moliyaviy, akademik yoki e’lon qilinmagan material bormi?
U mijoz shartnomasi yoki o‘quv muassasasi siyosati bilan cheklanganmi?
Bu hujjat uchun onlayn OCR xizmatidan foydalanishga ruxsat bormi?
Buning o‘rniga sizga mahalliy ish jarayoni kerakmi?
Tarjima kerak bo‘lmagan sahifalarni olib tashlay olasizmi?

Skan qilingan PDF’lar ko‘pincha maxfiy bo‘ladi, chunki ular shartnomalar, IDlar, blankalar, tadqiqot qoralamalari va ichki arxivlardan keladi. OCR’ga yuklash haqidagi qarorlarni asl hujjatga qanday yondashsangiz, xuddi shunday qabul qiling.

FAQ

Skan qilingan PDF’ni qanday tarjima qilaman?

Avval matn qatlamini yaratish uchun OCR qiling, OCR natijasini tekshirib chiqing, so‘ng OCR ishlovidan o‘tgan PDF’ni PDF tarjimoni bilan tarjima qiling. OCR natijasini tekshirish bosqichini o‘tkazib yubormang.

Nega Google Translate mening skan qilingan PDF’imni tarjima qilmadi?

PDF faqat rasmdan iborat bo‘lishi mumkin. Agar matn qatlami bo‘lmasa, Google Translate ajratib oladigan matn ham bo‘lmaydi. Avval OCR qiling, keyin tarjima qiling. Google’ga xos ish jarayoni Google Translate PDF qo‘llanmasida yoritilgan.

ChatGPT skan qilingan PDF’ni tarjima qila oladimi?

ChatGPT alohida rasmlar yoki ajratib olingan matn bilan yordam berishi mumkin, ammo ko‘p sahifali skan qilingan PDF baribir OCR va tekshiruvni talab qiladi. Butun hujjat bo‘yicha ish jarayoni uchun avval OCR qiling, keyin PDF tarjima ish jarayonidan foydalaning.

Skan qilingan PDF’lar uchun eng yaxshi OCR vositasi qaysi?

Bu hujjatga bog‘liq. Acrobat va ABBYY uslubidagi vositalar oddiy hamda murakkab skanlar uchun foydali. Tesseract yoki OCRmyPDF mahalliy texnik ish jarayonlari uchun qulay. Onlayn OCR xavfi past oddiy fayllar uchun mos bo‘lishi mumkin, ammo maxfiylik va sifat turlicha bo‘ladi.

OCR formatlashni saqlab qola oladimi?

OCR matn qatlamini yaratishi va ba’zan o‘qish tartibini tiklashi mumkin, ammo bu tarjima qilingan asl maketni saqlash bilan bir xil emas. OCR’dan keyin PDF tarjima ish jarayonidan foydalaning va natijani asl nusxa bilan solishtirib tekshiring.

OCR sifati yomon bo‘lsa nima qilish kerak?

Tarjimadan oldin skanni yaxshilang. Iloji bo‘lsa qayta skan qiling, sahifalarni qiyshiqlikdan to‘g‘rilang, kontrastni oshiring, ortiqcha narsalarni kesib tashlang, OCR uchun to‘g‘ri tilni tanlang va qiyin sahifalarni yana bir bor tekshirib chiqing.

Tegishli postlar

Tarjima qo'llanmalari

Formatini yo‘qotmasdan PDF’ni qanday tarjima qilish mumkin (2026 qo‘llanma)

2026-03-2011 min read

Maslahatlar va resurslar

2026-yildagi eng yaxshi PDF tarjima vositalari: halol taqqoslash

2026-02-2814 min read

Foydalanish holatlari

Akademik tadqiqot maqolalarini qanday tarjima qilish kerak: tenglamalar, iqtiboslar va formatlashni saqlab qolish

2026-02-2811 min read

Tarjima qo'llanmalari

PDF fayllar uchun Google Translate’dan qanday foydalaniladi: To‘liq qo‘llanma (2026)

2026-03-208 min read