Rekomenduojama, 2024

Redaktoriaus Pasirinkimas

Ištraukite tekstą iš vaizdų su šiomis geriausiomis OCR programomis

Šiomis dienomis beveik viskas (pvz., Nuotraukos, muzika, vaizdo įrašai) nuėjo skaitmeniniu būdu (ir tai yra prasminga, nes skaitmeninį turinį galima patogiai valdyti, redaguoti ir bendrinti). Taigi, kaip gali likti tekstiniai dokumentai. Dėl optinių simbolių atpažinimo (OCR) technikos pažangos dabar skaitmeninę tekstinę medžiagą skaitmeninti spausdintuose / ranka rašytuose dokumentuose lengviau nei kada nors padaryti, todėl jį galima redaguoti teksto apdorojimo programomis.

Kad tai padarytumėte, jums reikia tikrai gerų OCR programinės įrangos programų, ir būtent tai yra šis straipsnis. Šios programinės įrangos gali įsigyti šaltinio spausdintus dokumentus kaip vaizdus iš nuskaitymo įrenginių, arba galite įvesti savo dokumento vaizdus, ​​kurie bus konvertuojami į redaguojamą tekstą. Įdomu? Na, tada tegul ne įveikti aplink krūmas, ir patekti į 5 geriausias OCR programinė įranga .

1. ABBYY FineReader

Kai kalbama apie optinį simbolių atpažinimą, beveik viskas, kas yra net arti ABBYY FineReader. „ ABBYY FineReader“ įdeda į kraštutinę dalį su nenormaliu galingumu.

Nepaisant to, kad „ABBYY FineReader“ yra labai paprasta ir paprasta, ją lengva naudoti. Jis gali išgauti tekstą iš beveik visų rūšių populiarių vaizdo formatų, tokių kaip PNG, JPG, BMP ir TIFF. Ir tai dar ne viskas. „ABBYY FineReader“ taip pat gali išgauti tekstą iš PDF ir DJVU failų. Įkeliant šaltinio failą ar vaizdą (kuris turėtų turėti mažiausiai 300 dpi skiriamąją gebą, kad būtų galima nuskaityti), programa ją analizuoja ir automatiškai nustato skirtingus ištraukiamo teksto failo skyrius. Galite išgauti visą tekstą arba pasirinkti tik kai kuriuos konkrečius skirsnius. Po to, viskas, ką jums reikia padaryti, yra parinktis „Išsaugoti“, jei norite pasirinkti išvesties formatą, o „ABBYY FIneReader“ rūpinsis likusia. Yra daug išvesties formato, pvz., TXT, PDF, RTF ir net EPUB.

Išvesties tekstas yra puikiai redaguojamas, o tekstai iš net turinio intensyviausių dokumentų (pvz., Turintys kelis stulpelius ir sudėtingus išdėstymus) ištraukiami nepriekaištingai. Kitos funkcijos apima plačią kalbų palaikymą, daugybę šriftų stilių / dydžių ir vaizdo korekcijos įrankius failams, gaunamiems iš skaitytuvų ir kamerų.

Trumpai tariant, jei norite, kad ten būtų absoliuti geriausia OCR programinė įranga, turinti didelį įvesties / išvesties formatą ir apdorojimo palaikymą, eikite į ABBYY FineReader.

Platformos prieinamumas: Windows 10, 8, 7, Vista ir XP; „Mac OS X 10.6“ ir naujesnė versija

Kaina: Mokamos versijos prasideda nuo $ 169, 99, 30 dienų nemokamai

parsisiųsti

2. Readiris

Dėl itin galingos OCR programinės įrangos, kuri yra sudėtinga funkcijoms, medžioklė, bet ne visai stengiasi pradėti? Pažvelkite į „ Readiris“, nes tai gali būti, ko jums reikia.

Profesionalaus lygio programa „Readiris“ turi platų funkcijų rinkinį, kuris iš esmės yra identiškas anksčiau aptartam „ABBYY FineReader“. Nuo BMP iki PNG ir nuo PCX iki TIFF „Readiris“ palaiko keletą vaizdų formatų. Be to, PDF ir DJVU failus galima apdoroti taip pat gerai. Vaizdai gali būti gaunami iš skaitytuvo įrenginių, o programa taip pat leidžia nustatyti individualius apdorojimo parametrus šaltinio failams / atvaizdams, pvz., Išlyginimo ir DPI reguliavimui, prieš juos analizuojant. Nors „Readiris“ gali apdoroti mažesnės skiriamosios gebos vaizdus, ​​tik optimali raiška turėtų būti bent 300 dpi. Atlikus analizę, „Readiris“ nustato teksto sekcijas (arba zonas), o tekstas gali būti išgautas iš konkrečių zonų arba viso failo. Išgautas tekstas yra redaguojamas ir gali būti išsaugotas įvairiais formatais, pvz., PDF, DOCX, TXT, CSV ir HTM.

Be to, „Readiris Pro“ debesų taupymo funkcija leidžia tiesiogiai išsaugoti išgautą tekstą į įvairias debesų saugojimo paslaugas, pvz., „Dropbox“, „OneDrive“, „GoogleDrive“, o tada dar daugiau. Taip pat yra daug teksto redagavimo / apdorojimo funkcijų, o netgi brūkšninius kodus galima nuskaityti.

Apskritai, turėtumėte naudoti „Readiris“, jei norite naudoti patikimą teksto ištraukimo / redagavimo funkciją paprasta naudoti pakete, turinčioje platų įvesties / išvesties formato palaikymą. Vis dėlto „Readiris“ šiek tiek truputį tvarko dokumentų, kuriuose yra sudėtingų išdėstymų, pvz., Kelių stulpelių, lentelių ir kt.

Platformos prieinamumas: Windows 10, 8, 7, Vista ir XP; „Mac OS X 10.7“ ir naujesnė versija

Kaina: Mokamos versijos prasideda nuo 99 JAV dolerių, 10 dienų nemokamo bandymo

parsisiųsti

3. FreeOCR

Jei ieškote paprastos ir be jokios abejonės OCR programinės įrangos su tinkamu teksto atpažinimo galimybėmis, žiūrėkite ne tik „ FreeOCR“ . Nors ji negali būti perkrauta su visų rūšių išgalvotomis funkcijomis, ji vis dar veikia labai gerai, kas tai yra.

Remiantis itin populiariu „Google“ palaikomu „Tesseract OCR“ varikliu, „FreeOCR“ yra labai paprasta naudoti. Jis gali gauti nuskaitytus dokumentus, nuskaitytus skaitytuvais, taip pat leidžia įkelti vaizdus, ​​turinčius teksto turinį. Ne tik tai, kad jis taip pat gali išskleisti tekstą iš labai formatuotų daugialypių dokumentų. Programą galite ištraukti iš viso teksto iš įvesties PDF / vaizdo arba apibrėžti konkretų teksto fragmentą. Konversijų greitis yra gana geras, o konvertuotas tekstas gali būti išsaugotas tokiais formatais kaip TXT ir RTF arba eksportuojamas tiesiogiai į „Microsoft Word“. „FreeOCR“ palaiko visus pagrindinius vaizdo formatus, pvz., PNG, JPG ir TIFF.

Be to, „FreeOCR“ turi tam tikrų trūkumų. Tai pernelyg paprastas ir neturi jokių teksto apdorojimo funkcijų. Be to, išgauto teksto išdėstymas dažnai užsikimšęs, su persidengiančiomis linijomis ir stulpeliais. Naudokite jį tik tada, kai jums reikia tam tikrų pagrindinių OCR funkcijų, kad būtų galima naudoti retkarčiais.

Platformos prieinamumas: „ Windows 10“, „8“, „7“, „Vista“ ir „XP“

Kaina: Nemokama

parsisiųsti

4. „Microsoft OneNote“

„OneNote“ yra įspūdingai turtinga daugialypė programa, kurią lengva pradėti naudoti. Tačiau notetavimas nėra vienintelis dalykas. Jei naudojate „OneNote“ kaip savo darbo eigos dalį, galite naudoti tam tikrą pagrindinį teksto ištraukimą, nes jame įdiegtas OCR gerumas.

Naudojant „OneNote“ ištraukti tekstą iš vaizdų yra juokingai paprasta. Jei naudojate darbalaukio taikomąją programą, viskas, ką jums reikia padaryti, yra galimybė įterpti vaizdą į bet kurį iš nešiojamųjų kompiuterių ar skyrių. Baigę tiesiog paspauskite dešinį pelės klavišą ant nuotraukos ir pasirinkite parinktį Kopijuoti tekstą iš paveikslėlio . Visas teksto turinys iš nuotraukos būtų nukopijuotas į iškarpinę ir gali būti įklijuotas (taigi ir redaguojamas) bet kur, kaip reikalaujama. Nesvarbu, ar tai PNG, JPG, BMP, ar TIFF, „OneNote“ palaiko beveik visus pagrindinius vaizdo formatus.

Tačiau „OneNote“ teksto ištraukimo galimybės yra gana ribotos, ir jame negali būti pateikiami vaizdai, turintys sudėtingą teksto turinio išdėstymą, pvz., Lenteles ir poskyrius. Taigi turėtumėte tai atsiminti.

Platformos prieinamumas: Windows 10, 8, 7 ir Vista; „Mac OS X 10.10“ ir naujesnė versija

Kaina: Nemokama

parsisiųsti

5. GOCR

Pastaba: prieš pradedant darbą, svarbu žinoti, kad nors GOCR palaiko reguliarius vaizdų formatus, tokius kaip PNG ir JPG, tai nepavyko atpažinti per bandymus (atliekant „Windows 10“ veikiantį kompiuterį). Labai tikėtina, kad ji gali dirbti su šiais formatais Linux įrenginiuose, bet jei naudojate „Windows“, reikės konvertuoti šaltinio vaizdą (-us) į PNM formatą. Tai gali būti padaryta naudojant daugybę internetinių failų konvertavimo įrankių, tokių kaip šis.

Kas išskiria GOCR, išskyrus tai, kad ji tikrai neturi grafinės vartotojo sąsajos (GUI). Tai yra komandinės eilutės įrankis, todėl nėra paprasčiausia naudoti. Tačiau, kai esate patenkinti pagrindais, GOCR gali būti tikrai naudinga teksto ištraukimui iš vaizdų. Taip pat verta pažymėti, kad norint tinkamai veikti GOCR, šaltinio vaizduose turėtų būti aiškiai matomas tekstinis turinys ir, pageidautina, baltas fonas, nes įrankis tikrai neveikia su sudėtingais šaltinio failais. GOCR ištraukia tekstą iš vaizdų ir išsaugo juos TXT formatu. Nors jis palaiko keletą argumentų ir funkcijų, reikia žinoti tik kelis dalykus. Pavyzdžiui, norėdami išgauti tekstą iš PNM atvaizdo, komandinėje eilutėje turėtumėte įvesti šiuos duomenis.

X: pavyzdinis aplankas coc049 -i file.pnm -o file.txt

Čia, X: pavyzdinis aplankas yra vieta, kurioje yra GOCR komandinės eilutės įrankis, ir failas.pnm ir file.txt yra atitinkamai įvesties ir išvesties failai (abu yra toje pačioje vietoje kaip ir GOCR; jei vieta yra skirtinga, reikia nurodyti visą kelią). Taip pat, jei norite pakeisti vaizdo pilkos spalvos lygius, galite nurodyti skaitinę vertę kaip argumentą kartu su l. Spustelėkite čia, jei norite išsamiai skaityti apie naudojimą.

Apibendrinant, GOCR yra gana geras OCR įrankis, o kai kalbama apie teksto ištraukimą iš paprastų vaizdų, jis veikia ypač gerai. Tačiau tai labai ribota funkcijose ir reikalauja daug pastangų, kad galėtumėte dirbti.

Platformos prieinamumas: Windows 10, 8, 7, Vista ir XP; Linux; OS / 2

Kaina: Nemokama

parsisiųsti

Visi nustatyti konvertuoti vaizdus į tekstą?

Spausdintinio (ir ranka rašyto) teksto turinio skaitmeninimas yra labai naudingas, nes leidžia lengvai išsaugoti, redaguoti ir dalytis tekstu. Ir pirmiau aptariama OCR programinė įranga leidžia greitai atlikti tai, ką reikia padaryti, nesvarbu, kokie yra pagrindiniai arba patobulinti jūsų teksto gavybos poreikiai. Reikia profesionalaus lygio teksto ištraukimo funkcijų su geriausiais apdorojimo įrankiais? Eikite į „ABBYY FineReader“ arba „Readiris“. Ar pageidautumėte paprastesnės OCR programinės įrangos, kuri tiesiog padaro pagrindus? Naudokite „OneNote“ arba „FreeOCR“. Išbandykite juos ir pažiūrėkite, kaip jie dirba. Žinoti bet kurią kitą OCR programinę įrangą, kuri galėjo būti įtraukta į aukščiau pateiktą sąrašą? Šaukite toliau pateiktose pastabose.

Top