Sooner atanapi engké, dulur anu mindeng jalan kalawan aplikasi kantor, keur Nyanghareupan tugas umum - pikeun nyeken téks ti buku, majalah, koran, ngan daun, lajeng narjamahkeun eta gambar kana format tulisan, kayaning a dokumen Word.
Jang ngalampahkeun ieu merlukeun alat panyeken sarta program husus pikeun pangakuan téks. Dina artikel ieu kami baris ngobrol ngeunaan FineReader analog bébas -CuneiForm (Dina pangakuan di FineReader - tingali artikel ieu.).
Hayu urang ngawitan ...
eusi
- 1. Fitur kasempetan program CuneiForm
- 2. Conto tina OCR
- 3. tumpak OCR
- 4. Conclusions
1. Fitur kasempetan program CuneiForm
CuneiForm
Anjeun tiasa ngundeur tina situs nu pamekar urang: //cognitiveforms.com/
Program pikeun pangakuan téks kalawan open source. Sajaba ti éta, jalan dina sakabéh vérsi Windows: XP, Vista, 7, 8, nu pleases. Salian ieu, tambahkeun program tarjamah lengkep Rusia!
pro:
- OCR 20 basa pang populerna (Inggris jeung Rusia sorangan téh kaasup kana jumlah ieu);
- rojongan hébat fon print béda;
- parios kamus téks dipikawanoh;
- kamampuhan pikeun ngahemat hasil dina sababaraha cara;
- pelestarian struktur mangrupa dokumen urang;
- rojongan hébat sarta pangakuan tabel.
kontra:
- teu ngarojong dokumén anu kacida gedéna jeung payil (400 dpi);
- henteu ngarojong hiji jenis nu tangtu langsung tina scanner; (ogé, éta teu pikasieuneun, disadiakeun pikeun panggerak scanner teh nyaeta scanning sarta program husus.)
- rarancang teu caang (tapi anu perlu éta nalika program bakal ngajawab masalah dina pinuh).
2. Conto tina OCR
Urang nganggap yen gambar dipikabutuh pikeun pangakuan geus ditarima (discan eta, atawa ngundeur buku online di pdf / format djvu sarta ngagaduhan kaluar gambar maranéhna dipikahayang Kumaha ngalakukeun hal eta -., Tempo artikel ieu.).
1) Buka gambar nu dipikahoyong dina program CuineForm (file / kabuka atawa "Cntrl + O").
2) Dina raraga lumangsungna pangakuan - hal anu perlu munggaran nangtukeun wewengkon béda: téks, gambar, tabel, jeung sajabana The program Cuneiform ieu bisa dipigawé henteu ngan ku leungeun, tapi. otomatis! Jang ngalampahkeun ieu, klik "aksara" dina jandela luhur.
3) Saatos 10-15 detik. program nu otomatis highlights sagala widang kelir béda. Contona, wewengkon téks anu diwarnaan bulao. Ku jalan kitu, éta bakal nyorot sagala widang neuleu na gancang. Jujur, abdi teu nyangka eta respon kitu gancang sarta bener ...
4) Pikeun jalma anu teu percanten ka tata perenah otomatis, sarta anjeun bisa make manual. Jang ngalampahkeun ieu, aya parabot stop kontak (tingali gambar di handap ieu.), Ngaliwatan nu bisa nyorot téks, tabel, gambar. Pindahkeun, kanaékan / ngurangan gambar awal, motong edges. Sacara umum, hiji set alus.
5) Saatos sakabeh wewengkon geus ditandaan, anjeun tiasa lumangsungna pangakuan. Jang ngalampahkeun ieu, ngan saukur klik tombol luyu, sabab ditémbongkeun di handap ieu.
6) Ngan sanggeus 10-20 detik. sateuacan Anjeun muka dokumen dina Microsoft Word kalayan téks dipikawanoh. Naon metot, dina téks contona ieu kasalahan, tangtu aya, tapi maranéhna teu pisan! Utamana, tempo dina naon nondescript salaku bahan baku - gambar.
Laju sarta kualitas anu comparable kalawan FineReader!
3. tumpak OCR
fitur program ieu bisa datang dina gunana lamun nu peryogi mikawanoh leuwih ti hiji gambar, tapi sababaraha. A potong kompas nepi ka ngajalankeun pangakuan tumpak, biasana disumputkeun dina menu "mimitian".
1) Saatos muka program, Anjeun kudu nyieun pakét anyar atanapi muka hiji saméméhna disimpen. Dina conto urang - nyieun nu anyar.
2) Dina lengkah saterusna, urang masihan eta ngaran, preferably misalna yén genep bulan engké mun ngelingan yen eta geus disimpen.
3) salajengna, pilih basa dokumen (Rusia, Inggris), nunjukkeun naha bahan dina gambar discan anjeun, sarta tabel.
4) Ayeuna maneh kudu nangtukeun polder mana payil anu lokasina pikeun pangakuan. Ku jalan kitu, cukup Narikna, program bakal manggihan sakabeh gambar jeung payil gambar lianna, nu éta bakal bisa mikawanoh sarta tambahkan maranéhanana ka proyek. Anjeun bakal ditinggalkeun ngaleupaskeun kaleuwihan.
5) Lengkah saterusna henteu vazhen- milih naon nu kudu jeung file sumber, sanggeus pangakuan nu. Kuring nyarankeun ka milih keletik teh "becus".
6) Éta ngan tetep pilih format numana dokumen dipikawanoh geus disimpen. Aya sababaraha pilihan:
- rtf - file ti kecap dokumen, nawarkeun sagala kantor populér (kaasup haratis, tumbu ka program);
- txt - format tulisan, kasebut nyaéta dimungkinkeun pikeun ngahemat ukur téks, gambar na tabel teu kaci;
- htm - Kaca hiperteks, nyaeta gunana lamun nyeken jeung ngakuan file pikeun loka. Eta tur pilih dina conto urang.
7) Saatos ngaklik "Puguh" tombol mimitian processing proyék Anjeun.
8) program The jalan geulis gancang. Sanggeus maca anjeun bakal nempo hiji tab jeung file htm. Lamun klik pikeun ngjalankeun browser nu, dimana anjeun tiasa ningali hasil file misalna. Ku jalan kitu, anjeun tiasa ngahemat a kebat pikeun digawé salajengna kalawan eta.
9) Salaku bisa ditempo, hasil Karya pisan impressive. program gambar Gampang ngakuan, sarta handapeun éta gampang pikeun mikawanoh téks. Bari program nu geus bébas, sarta - anu sagala super!
4. Conclusions
Lamun mindeng teu ngalakukeun nu scanning na OCR, FineReader lajeng meuli program, sigana teu make akal pikiran. Kalawan mayoritas masalah bisa kalayan gampang nanganan CuneiForm.
Di sisi séjén, kudu di dinya tur minuses.
Heula, teuing sababaraha parabot pikeun ngedit tur verifying hasilna. Bréh, lamun perlu mikawanoh loba gambar - dina FineReader gampang tingali dina glance dina kolom katuhu kabeh anu ditambahkeun kana proyék éta: pikeun gancang cabut kaleuwihan, jieun perobahan, jeung sajabana Jeung katilu, dina dokumén kualitas pisan miskin pisan, CuneiForm leungiteun salaku pangakuan :. dokumen nu boga dibawa ka pikiran - mun aturan Kasalahan baca dicap, tanda petik, jsb
Éta sadayana. Jeung anjeun nyaho naon nu sejenna pantes program haratis pikeun pangakuan téks?