Szkennelés és szövegfelismerés

Jó napot!

Valószínűleg mindannyian szembesültünk azzal a feladattal, hogy egy papíralapú dokumentumot elektronikus formába alakítsunk át. Erre különösen gyakran van szükség azoknak, akik tanulnak, dokumentációval dolgoznak, szövegeket fordítanak elektronikus szótárak segítségével stb.

Ebben a cikkben ennek a folyamatnak az alapjait szeretném megosztani. Általában a beolvasás és a szövegfelismerés meglehetősen időigényes, mivel a legtöbb műveletet manuálisan kell elvégezni. Megpróbáljuk lépésről lépésre megérteni, mit, hogyan és miért.

Egy dolgot nem mindenki ért meg azonnal. A szkennelés után (a szkenner összes betűjének beolvasása) BMP, JPG, PNG, GIF formátumú képek lesznek (lehet más formátum is). Tehát ebből a képből szöveget kell kapnia - ezt az eljárást felismerésnek nevezik. A következők ebben a sorrendben lesznek.

1) Szkenner

A nyomtatott dokumentumok szöveggé alakításához szükség van egy szkennerre és ennek megfelelően a hozzá tartozó "natív" programokra és illesztőprogramokra. Segítségükkel beszkennelheti és elmentheti a dokumentumot további feldolgozásra.

Használhat más analógokat is, de a lapolvasóhoz mellékelt szoftver általában gyorsabban működik és több lehetőséget kínál.

Attól függően, hogy melyik szkennerrel rendelkezik, a működési sebesség jelentősen változhat. Vannak olyan szkennerek, amelyek 10 másodperc alatt tudnak képet kapni egy levélből, vannak olyanok, amelyek 30 másodperc alatt. Ha beszkennelsz egy 200-300 lapos könyvet, szerintem nem nehéz kiszámolni, hogy hányszoros lesz az időkülönbség?

2) Program az elismerésért

Cikkünkben megmutatom, hogyan dolgozhat az egyik legjobb dokumentum szkennelésére és felismerésére alkalmas programmal - az ABBYY FineReaderrel. Mivel a program fizetős, azonnal linket adok egy másikhoz - az ingyenes analóg Cunei Formához.Igaz, nem hasonlítanám össze őket, tekintve, hogy a FineReader minden paraméterben nyer, ajánlom kipróbálásra.

ABBYY FineReader 11

Hivatalos weboldal: http://www.abbyy.ru/

A maga nemében az egyik legjobb program. Úgy tervezték, hogy felismerje a képen lévő szöveget. Számos opció és funkció be van építve. Nagyon sok betűtípust meg tud különböztetni, még a kézzel írt változatokat is támogatja (bár személyesen nem próbáltam, de nem valószínű, hogy felismeri a kézzel írt változatot, hacsak nincs tökéletes kalligrafikus kézírásod). Az alábbiakban a vele való munkavégzés további részleteit ismertetjük. Megjegyezzük, hogy a cikk a program 11. verziójában végzett munkáról szól.

Általános szabály, hogy az ABBYY FineReader különböző verziói nem sokban különböznek egymástól. Könnyen megteheti ugyanezt egy másikban. A fő különbségek a program kényelmében, sebességében és képességeiben lehetnek. Például a korábbi verziók megtagadják a PDF és a DJVU megnyitását…

3) Dokumentumok szkenneléshez

Igen, ez az, úgy döntöttem, hogy a dokumentumokat külön oszlopba teszem. A legtöbb esetben beszkennelnek egyes tankönyveket, újságokat, cikkeket, folyóiratokat stb., vagyis azokat a könyveket és irodalmakat, amelyekre kereslet van. Mire vezetem ezt? Személyes tapasztalatból azt mondhatom, hogy a beolvasni kívánt dolgok nagy része valószínűleg már online van! Hányszor spóroltam meg időt, amikor ezt vagy azt a könyvet már beszkennelve találtam az interneten. Nem kellett mást tennem, mint átmásolni a szöveget egy dokumentumba, és tovább dolgozni vele.

Íme egy egyszerű tipp – mielőtt beolvasna valamit, ellenőrizze, hogy valaki már beszkennelte-e, és nem kell vesztegetnie az idejét.

2. Szövegbeolvasási lehetőségek

Itt nem beszélek a szkenner illesztőprogramjairól, programjairól, amelyekvele mentek, mert a szkennerek minden modellje más, az is mindenhol más, és nem lehet kitalálni, és még világosabban megmutatni, hogyan kell végrehajtani a műveletet.

De minden szkenner ugyanazokkal a beállításokkal rendelkezik, amelyek nagyban befolyásolhatják a munka sebességét és minőségét. Itt fogunk beszélni róluk. Sorrendben felsorolom.

1) Szkennelés minősége – DPI

Először állítsa be a beolvasási minőséget a beállításoknál 300 DPI-nél nem alacsonyabbra. Kívánatos akár többet is kiállítani, ha lehetséges. Minél magasabb a DPI, annál tisztább lesz a kép, és így annál gyorsabban megy végbe a további feldolgozás. Ezenkívül minél jobb a beolvasás minősége, annál kevesebb hibát kell később kijavítania.

A legjobb megoldás általában 300-400 DPI-t biztosít.

2) Szín

Ez a paraméter nagyban befolyásolja a szkennelési időt (egyébként a DPI is befolyásolja, de csak annyira, és csak akkor, ha a felhasználó magas értékeket állít be).

Általában három módot különböztetnek meg:

– fekete-fehér (tökéletes egyszerű szöveghez);

– szürke (táblázatokkal és ábrákkal ellátott szövegekhez alkalmas);

– színes (színes folyóiratokhoz, könyvekhez, általában olyan dokumentumokhoz, ahol a szín fontos).

Általában a beolvasási idő a színválasztástól függ. Végül is, ha nagy dokumentummal rendelkezik, még egy plusz 5-10 másodperc is az oldalon általában tisztességes időt vesz igénybe...

3) Fényképek

A dokumentumhoz nem csak szkenneléssel, hanem fényképezéssel is hozzájuthat. Általános szabály, hogy ebben az esetben más problémákkal kell szembenéznie: képtorzulás, elmosódás. Emiatt a beérkezett szöveg hosszabb további szerkesztésére, feldolgozására lehet szükség. Én személy szerint nem javaslom a kamerák használatát erre a célra.

Fontos megjegyezni, hogy nem mindenki ilyenA rendszer felismeri a dokumentumot, mivel a beolvasás minősége rendkívül alacsony lehet...

3. Dokumentumszöveg felismerés

Feltételezzük, hogy megkapta a dédelgetett szkennelt oldalakat. Leggyakrabban a következő formátumokban vannak: tif, bmb, jpg, png. Általában véve ez nem túl fontos az ABBYY FineReader számára...

Miután megnyitott egy képet az ABBYY FineReaderben, a program általában automatikusan elkezdi kiemelni és felismerni a területeket. De néha rosszul csinálja. Ehhez megfontoljuk a szükséges területek manuális kiválasztását.

Fontos! Nem mindenki érti meg azonnal, hogy egy dokumentum programban való megnyitása után az ablak bal oldalán megjelenik a forrásdokumentum, amelyben különböző területeket jelöl ki. A „felismerés” gombra kattintás után a program a kész szöveget megjeleníti a jobb oldali ablakban. A felismerés után egyébként célszerű ugyanabban a FineReaderben ellenőrizni a szöveget, hogy nincs-e benne hiba.

3.1 Szöveg

Ez a terület szöveg kijelölésére szolgál. Az ábrákat és táblázatokat ki kell zárni belőle. A ritka és szokatlan betűtípusokat manuálisan kell megadni...

A szövegterület kiemeléséhez figyeljen a FineReader tetején lévő panelre. Van egy "T" gomb (lásd az alábbi képernyőképet, az egérmutató pontosan ezen a gombon van). Rákattint, majd az alábbi képen kiválaszt egy szépen téglalap alakú területet, amelyben a szöveg található. Egyébként bizonyos esetekben oldalanként 2-3 szövegblokkot kell létrehozni, néha 10-12-t, mert a szöveg formázása eltérő lehet, és egy téglalap nem tudja kiemelni a teljes területet.

Fontos megjegyezni, hogy a képek ne kerüljenek a szövegmezőbe! Ezzel sok időt takaríthat meg a későbbiekben…

3.2 Képek

A képek és azon területek kiemelésére szolgál, amelyeknehéz felismerni a rossz minőség vagy a szokatlan betűtípus miatt.

Az alábbi képernyőképen az egérmutató a „kép” terület kiválasztásához használt gombon van. Egyébként ezen a területen az oldal bármely részét kijelölheti, és a FineReader ezt követően közönséges képként beilleszti a dokumentumba. Vagyis egyszerűen "hülyén" másol...

Általában ezt a területet a rosszul beolvasott táblázatok, a nem szabványos szövegek és betűtípusok, valamint maguknak a képeknek a kiválasztására használják.

3.3 Táblázatok

Az alábbi képernyőképen a táblázatok kiválasztására szolgáló gomb látható. Általában én személy szerint rendkívül ritkán használom. A helyzet az, hogy rutinszerűen (valójában) minden vonalat meg kell húzni az asztalon, és megmutatni, mit és hogyan kell programozni. Ha az asztal kicsi és nem túl jó minőségű, akkor erre a célra javaslom a "kép" terület használatát. Ezzel sok időt takaríthat meg, és gyorsan elkészíthet egy táblázatot egy kép alapján a Wordben.

3.4 Felesleges elemek

Fontos megjegyezni. Néha előfordulnak olyan felesleges elemek az oldalon, amelyek megnehezítik a szöveg felismerését, vagy egyáltalán nem teszik lehetővé a kívánt terület kiválasztását. Egy "radír" segítségével teljesen eltávolíthatók.

Ehhez lépjen képszerkesztő módba.

Válassza ki a "radír" eszközt, és válassza ki a kívánt területet. Ki lesz törölve, és egy fehér papírlap lesz a helyén.

Egyébként azt javaslom, hogy a lehető leggyakrabban használja ezt a lehetőséget. Próbálja meg törölni az összes kiválasztott szövegterületet, ahol nincs szükség szövegrészre, vagy a felesleges pontok, elmosódások, torzulások radírral vannak jelen. Ennek köszönhetően a felismerési folyamat gyorsabb lesz!

4. PDF/DJVU fájlok felismerése

Általánosságban elmondható, hogy ez a felismerési formátum semmiben nem különbözik a többitől - vagyis ugyanúgy dolgozhat vele, mint a képekkel. Az egyetlen dolog, hogy a program ne legyen túl régi, ha nem nyitja meg a PDF/DJVU fájlokat - frissítse a verziót 11-re.

Egy kis tanács. A FineReader dokumentum megnyitása után automatikusan elkezdi felismerni a dokumentumot. A PDF/DJVU fájlokban gyakran az oldal bizonyos területére nincs szükség a teljes dokumentumban! Egy ilyen terület eltávolításához az összes oldalon tegye a következőket:

1. Lépjen a képszerkesztő részhez.

2. Kapcsolja be a „kivágás” opciót.

3. Minden oldalon jelölje ki a kívánt területet.

4. Kattintson az Alkalmazás minden oldalra és a körbevágás gombra.

5. Hibák ellenőrzése és munkaeredmények mentése

Úgy tűnik, mi más probléma lehet, amikor az összes területet kiválasztották, majd felismerték - vedd és tartsd... Nem volt itt!

Először is okmányellenőrzés szükséges!

A bekapcsoláshoz felismerés után a jobb oldali ablakban lesz egy "check" gomb, ld képernyőkép lent. A rákattintás után a FineReader program automatikusan megmutatja azokat a területeket, ahol a program hibákat észlelt, és nem tudott megbízhatóan azonosítani egy adott karaktert. Csak annyit kell tennie, hogy egyetért-e a program véleményével, vagy beírja a szimbólumát.

Egyébként az esetek hozzávetőleg felében a program egy kész helyes szót kínál fel - mindössze annyit kell tennie, hogy kiválasztja a kívánt lehetőséget az egérrel.

Másodszor, az ellenőrzés után ki kell választania a formátumot, amelyben elmenti a munkája eredményét.

Itt a FineReader lehetővé teszi, hogy a teljes kört bejárja: egyszerűen átviheti az információkat egyenként a Wordbe, vagy elmentheti őkettucatnyi formátum. De még egy fontos szempontot szeretnék kiemelni. Bármelyik formátumot is választja, fontos a másolat típusának kiválasztása! Tekintsük a legérdekesebb lehetőségeket...

Pontos másolat

A felismert dokumentumban az oldalon kiemelt összes terület pontosan megfelel az eredeti dokumentumnak. Nagyon kényelmes lehetőség, ha fontos, hogy ne veszítse el a szöveg formázását. A betűtípusok egyébként nagyon hasonlóak lesznek az eredetihez. Ebben az esetben azt javaslom, hogy vigye át a dokumentumot a Wordbe, hogy ott folytassa a munkát.

Szerkesztett példány

Ez az opció jó, mert a szöveg már formázott változatát kapja meg. Vagyis nem talál eltérést a "kilométertől", ami az eredeti dokumentumban lehetett. Hasznos lehetőség, ha jelentős mértékben szerkeszti az információkat.

Igaz, nem szabad választani, ha fontos Önnek a tervezési stílus, a betűtípusok, a behúzások megőrzése. Néha, ha a felismerés nem volt túl sikeres, előfordulhat, hogy a dokumentum elferdül" a megváltozott formázás miatt. Ebben az esetben célszerű pontos másolatot választani.

Egyszerű szöveg

Egy lehetőség azok számára, akiknek csak a szövegre van szükségük az oldalról minden más nélkül. Alkalmas képek és táblázatok nélküli dokumentumokhoz.

Ezzel a dokumentum szkenneléssel és felismeréssel foglalkozó cikket zárjuk. Remélem, ezek az egyszerű tippek segítenek megoldani a kihívásokat…

Sok szerencsét!

Következő