Online szolgáltatások szövegfelismeréshez

Előző

szolgáltatások
Üdvözlök minden blogolvasót!

Szerintem azoknak, akik gyakran dolgoznak a számítógépen (nem játszanak, vagyis dolgoznak), szembesülniük kellett a szövegfelismeréssel. Nos, például beszkenneltél egy részletet egy könyvből, és most be kell szúrnod ezt a részt egy dokumentumba. De a beszkennelt dokumentum egy kép, és szükségünk van szövegre - ehhez speciális programokra és online szolgáltatásokra van szükség a szöveg képből történő felismerésére.

Az elismerési programokról már írtam a korábbi bejegyzésekben:

– szöveg beolvasása és felismerése FineReaderben (fizetős program);

- dolgozni a FineReader analógjában - CuneiForm (ingyenes program).

Ugyanebben a cikkben a szövegfelismerő online szolgáltatásokra szeretnék összpontosítani. Hiszen ha 1-2 képből kell gyorsan szöveget szedni - nincs értelme különféle programok telepítésével vesződni...

Fontos!A felismerés minősége (hibák száma, olvashatóság stb.) nagymértékben függ a kép eredeti minőségétől. Ezért szkenneléskor (fotózáskor stb.) válassza a lehető legmagasabb minőséget. A legtöbb esetben 300-400 dpi minőség is elegendő lesz (a dpi a képminőséget jellemző paraméter. Szinte minden szkenner beállításainál ez a paraméter általában meg van adva).

Online szolgáltatások

A szolgáltatások működésének bemutatása érdekében képernyőképet készítettem az egyik cikkemről. Ez a képernyőkép minden szolgáltatáshoz feltöltésre kerül, amelyek leírását az alábbiakban közöljük.

1)http://www.ocrconvert.com/

felismerés

Nagyon szeretem ezt a szolgáltatást az egyszerűsége miatt. Bár az oldal angol nyelvű, jól működik oroszul. Nem kell regisztrálni. A felismerés megkezdéséhez 3 műveletet kell végrehajtania:

- feltölteni a képet;

- válassza ki a szöveg nyelvét, amely be van kapcsolvaképek;

- nyomja meg a felismerés indítása gombot.

Formátumtámogatás: PDF, GIF, BMP, JPEG.

Az eredmény az alábbi képen látható. Meg kell mondanom, a szöveget elég jól felismerték. Ráadásul nagyon gyorsan - szó szerint 5-10 másodpercet vártam.

2)http://www.i2ocr.com/

Ez a szolgáltatás a fentiekhez hasonlóan működik. Itt is le kell töltenie a fájlt, válassza ki a felismerési nyelvet, és kattintson a szöveg kibontása gombra. A szolgáltatás nagyon gyorsan működik: 5-6 másodperc. egy oldalon.

Támogatja a következő formátumokat: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Ennek az online szolgáltatásnak az eredménye sokkal kényelmesebb: azonnal megjelenik két ablak - az első a felismerési eredményt, a második az eredeti képet mutatja. Ezért a szerkesztési folyamat során meglehetősen könnyű javításokat végezni. Egyébként a szolgáltatásra sem kell regisztrálni.

3)http://www.newocr.com/

Ez a szolgáltatás több szempontból is egyedülálló. Először is támogatja az "újmódi" DJVU formátumot (egyébként a formátumok teljes listája: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Másodszor, támogatja a szöveges területek kiválasztását a képen. Ez nagyon hasznos, ha nem csak szöveges területek vannak a képen, hanem grafikus területek is, amelyeket nem kell felismerni.

A felismerés minősége átlagon felüli, regisztráció nem szükséges.

4)http://www.free-ocr.com/

Egy nagyon egyszerű szolgáltatás a felismeréshez: töltsön fel egy képet, adja meg a nyelvet, írja be a captcha-t (mellesleg ez az egyetlen szolgáltatás ebben a cikkben, ahol ezt meg kell tennie), és nyomja meg a gombot a kép szöveggé fordításához. Valójában mindent!

Támogatott formátumok: PDF, JPG, GIF, TIFF, BMP.

A felismerés eredménye átlagos. vannak hibákde nem sok van belőlük. Ha azonban az eredeti képernyőkép minősége jobb lenne, egy nagyságrenddel kevesebb hiba lenne.

PS

Ma ennyi. Ha tud más érdekes szolgáltatásokat a szövegfelismeréshez, ossza meg őket a megjegyzésekben, hálás leszek. Egy feltétel: kívánatos, hogy ne legyen szükség regisztrációra és a szolgáltatás ingyenes.

Minden rendben!

Következő

Olvassa el tovabba: