{"id":3091,"date":"2022-07-04T09:31:23","date_gmt":"2022-07-04T09:31:23","guid":{"rendered":"https:\/\/precognox.com\/blog\/optikai-karakterfelismeres-es-szoveganalitika-a-modern-ugyvitelhez\/"},"modified":"2025-01-03T11:49:37","modified_gmt":"2025-01-03T09:49:37","slug":"optikai-karakterfelismeres-es-szoveganalitika-a-modern-ugyvitelhez","status":"publish","type":"post","link":"https:\/\/precognox.com\/hu\/blog\/optikai-karakterfelismeres-es-szoveganalitika-a-modern-ugyvitelhez\/","title":{"rendered":"Optikai karakterfelismer\u00e9s \u00e9s sz\u00f6veganalitika a modern \u00fcgyvitelhez"},"content":{"rendered":"<h2>A kih\u00edv\u00e1s<\/h2>\n<p>B\u00e1r a digit\u00e1lis transzform\u00e1ci\u00f3 \u00f6les l\u00e9ptekkel halad, m\u00e9gis sz\u00e1mos helyen jelent\u0151s kih\u00edv\u00e1st jelent az \u00e9vek-\u00e9vtizedek alatt felgy\u00fclemlett pap\u00edr alap\u00fa dokumentumok feldolgoz\u00e1sa. \u00c9s a feldolgoz\u00e1s alatt nem kiz\u00e1r\u00f3lag ezen dokumentumok digitaliz\u00e1l\u00e1s\u00e1t \u00e9rtj\u00fck, hanem annak automatikus szort\u00edroz\u00e1s\u00e1t, illetve mindazon sz\u00f6veganalitikai folyamatokat, amelyek lehet\u0151v\u00e9 teszik, hogy a k\u00e9s\u0151bbiekben p\u00e9ld\u00e1ul a dokumentumok kereshet\u0151s\u00e9ge is megoldott legyen. \u00dcgyfel\u00fcnk pedig \u00e9ppen ilyen megold\u00e1st keresett, amelyhez t\u00f6bb szakter\u00fclet tud\u00e1s\u00e1t kellett \u00f6tv\u00f6zni.<\/p>\n<h2>Az OCR technol\u00f3gia<\/h2>\n<p>Tudjon meg t\u00f6bbet az <a href=\"https:\/\/precognox.com\/optikai-karakterfelismeres\/\">optikai karakterfelismer\u00e9sr\u0151l<\/a>, annak szerep\u00e9r\u0151l \u00e9s el\u0151nyeir\u0151l.<\/p>\n<h2>Megval\u00f3s\u00edt\u00e1s<\/h2>\n<p>Az els\u0151 l\u00e9p\u00e9s az \u00fcgyf\u00e9l t\u00f6bb milli\u00f3 oldalnyi pap\u00edr alap\u00fa dokumentumainak digitaliz\u00e1l\u00e1sa volt. A szkennel\u00e9si folyamat el\u0151tt a dokumentumok vonalk\u00f3dokkal lettek ell\u00e1tva, amelyek seg\u00edts\u00e9g\u00e9vel m\u00e1r a digitaliz\u00e1l\u00e1s sor\u00e1n megval\u00f3sult a szort\u00edroz\u00e1s is, ehhez az ABBYY megold\u00e1s\u00e1t h\u00edvtuk seg\u00edts\u00e9g\u00fcl, amely vonalk\u00f3dok alapj\u00e1n k\u00e9pes sz\u00e9tszedi a szkennelt dokumentumokat. Ezut\u00e1n k\u00f6vetkezett az ABBYY OCR-rel megval\u00f3s\u00edtott optikai karakterfelismer\u00e9s, amely beazonos\u00edtja a digitaliz\u00e1lt dokumentumok sz\u00f6veges tartalm\u00e1t.<br \/>A sz\u00f6veges tartalmak kinyer\u00e9se ut\u00e1n a saj\u00e1t fejleszt\u00e9s\u0171 <a href=\"https:\/\/precognox.com\/tas-tagger\/\">TAS Tagger<\/a> seg\u00edts\u00e9g\u00e9vel kinyer\u00e9sre ker\u00fcltek az entit\u00e1sok \u00e9s az egy\u00e9b sz\u00fcks\u00e9ges metaadatok. A dokumentumok indexel\u00e9se ut\u00e1n azok kereshet\u0151v\u00e9 v\u00e1ltak a <a href=\"https:\/\/precognox.com\/hu\/termekek\/tas-insight-engine\/tas-enterprise-search-engine\/\">TAS V\u00e1llalati keres\u0151<\/a> fel\u00fclet\u00e9n, m\u00e9ghozz\u00e1 \u00fagy, hogy a fentiekben le\u00edrt m\u00f3don digitaliz\u00e1lt tartalmakra mutat\u00f3 tal\u00e1latokn\u00e1l egy plusz gomb seg\u00edts\u00e9g\u00e9vel az eredeti szkennelt verzi\u00f3 is el\u00e9rhet\u0151 \u00e9s megtekinthet\u0151.<\/p>\n<h2>Partners\u00e9g \u00f6tv\u00f6z\u00f6tt tud\u00e1ssal<\/h2>\n<p>Az \u00fcgyf\u00e9l elk\u00e9pzel\u00e9seinek megfelel\u0151 megold\u00e1s megval\u00f3s\u00edt\u00e1s\u00e1hoz sz\u00f6veganalitikai tapasztalatunkon t\u00fal alapvet\u0151 fontoss\u00e1g\u00faak voltak az ABBYY szolg\u00e1ltat\u00e1sai, amelyek k\u00e9pess\u00e9geiben ABBYY viszontelad\u00f3i partnereik\u00e9nt jogosan b\u00edzhattunk. Az \u00edgy \u00f6tv\u00f6z\u00f6tt tud\u00e1ssal kialak\u00edtott, a mai kor elv\u00e1r\u00e1sainak \u00e9s technikai sz\u00ednvonal\u00e1nak megfelel\u0151 megold\u00e1st \u00fcgyfel\u00fcnk el\u00e9gedetten alkalmazhatja.<\/p>\n<figure>\n\t\t\t\t\t\t\t\t\t\t<img width=\"1024\" height=\"682\" src=\"https:\/\/precognox.com\/wp-content\/uploads\/2024\/04\/concept-18290_1280.jpg\" alt=\"Optikai karakterfelismer\u00e9s\" decoding=\"async\" loading=\"lazy\" srcset=\"https:\/\/precognox.com\/wp-content\/uploads\/2024\/04\/concept-18290_1280.jpg 1024w, https:\/\/precognox.com\/wp-content\/uploads\/2024\/04\/concept-18290_1280.jpg 300w, https:\/\/precognox.com\/wp-content\/uploads\/2024\/04\/concept-18290_1280-768x512.jpg 768w, https:\/\/precognox.com\/wp-content\/uploads\/2024\/04\/concept-18290_1280.jpg 624w, https:\/\/precognox.com\/wp-content\/uploads\/2024\/04\/concept-18290_1280.jpg 1280w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>az optikai karakterfelismer\u00e9s sz\u00e1mos ter\u00fcleten alkalmazhat\u00f3<\/figcaption><\/figure>\n<h2>Szektorokon \u00e1tny\u00fal\u00f3 megold\u00e1s<\/h2>\n<p>Az optikai karakterfelismer\u00e9s (OCR technol\u00f3gia) sz\u00e1mos ter\u00fcleten ny\u00fajthat k\u00e9zenfekv\u0151 megold\u00e1st az \u00fcgyvitel moderniz\u00e1l\u00e1s\u00e1ra. Nem kiz\u00e1r\u00f3lag a pap\u00edr alap\u00fa dokumentumkezel\u00e9s eset\u00e9n, hanem azokban az esetekben is, amikor elker\u00fclhetetlen a pap\u00edr alap\u00fa \u00fcgyint\u00e9z\u00e9s \u00e9s ezen dokumentumok k\u00e9s\u0151bb is csak k\u00e9pi digitaliz\u00e1lt form\u00e1ban (szkennelve) \u00e1llnak rendelkez\u00e9sre (pl.: email mell\u00e9kletk\u00e9nt).<br \/>Mivel a mai napig t\u00f6bb szektor alkalmaz pap\u00edr alap\u00fa \u00fcgyvitelt bizonyos folyamatokn\u00e1l, \u00edgy sz\u00e1mukra komoly seg\u00edts\u00e9get jelenthet a kidolgozott megold\u00e1s. Mely ter\u00fcleteket lehetnek ezek? T\u00f6bbek k\u00f6z\u00f6tt azok, amelyek hivatalos dokumentumokat kezelnek, legyen sz\u00f3 jogr\u00f3l, k\u00f6vetel\u00e9skezel\u00e9sr\u0151l, lakoss\u00e1gi \u00fcgyint\u00e9z\u00e9sr\u0151l vagy nyilv\u00e1ntart\u00e1sr\u00f3l.<\/p>\n<h2>Az adatok el\u00e9r\u00e9se kulcsk\u00e9rd\u00e9s<\/h2>\n<p>Az <a href=\"https:\/\/hvg.hu\/tudomany\/20211228_abbyy_dokumentumkezeles_idoveszteseg_produktivitas_kutatas\">ABBYY kutat\u00e1sa<\/a> szerint 10-b\u0151l 6 alkalmazott munk\u00e1j\u00e1t nehez\u00edti meg a dokumentumokban tal\u00e1lhat\u00f3 adatok el\u00e9r\u00e9se \u00e9s 92 sz\u00e1zal\u00e9kuk egy teljes munkanapot is vesz\u00edt hetente a v\u00e1llalati dokumentumokban t\u00f6rt\u00e9n\u0151 kutat\u00e1ssal.<\/p>\n<h2>Kil\u00e9p\u00e9s a digit\u00e1lis t\u00e9rb\u0151l \u00e9s vissza<\/h2>\n<p>A folyamatos digitaliz\u00e1ci\u00f3s \u00e9s informatikai fejleszt\u00e9sek dac\u00e1ra nap mint nap szembes\u00fcl\u00fcnk azzal, hogy a honi \u00fcgyint\u00e9z\u00e9snek tov\u00e1bbra is szerves r\u00e9szei a pap\u00edr alap\u00fa hivatalos dokumentumok, amelyek kil\u00e9pve a digit\u00e1lis t\u00e9rb\u0151l, postai \u00faton \u00e9rkeznek a c\u00edmzetthez (norm\u00e1l-\u00e9s aj\u00e1nlott levelek, t\u00e9rtivev\u00e9nyes k\u00fcldem\u00e9nyek). Ezeket sokszor az al\u00e1\u00edr\u00e1sunkkal ell\u00e1tva kell visszajuttatni a felad\u00f3hoz, ami b\u00e1r bizonyos esetekben t\u00f6rt\u00e9nhet emailben vagy egy \u00fcgyint\u00e9z\u0151i port\u00e1lon kereszt\u00fcl felt\u00f6ltve is (szkennelve \u00e9s csatolva az al\u00e1\u00edrt p\u00e9ld\u00e1nyt), ett\u0151l m\u00e9g az adott \u201cdigitaliz\u00e1lt v\u00e1lasz\u201d nem lesz teljes k\u00f6r\u0171en alkalmas a k\u00e9s\u0151bbi feldolgoz\u00e1sra, hiszen abban p\u00e9ld\u00e1ul keresni sem lehets\u00e9ges. Ilyen esetekben teh\u00e1t mindenk\u00e9ppen egyes\u00e9vel kell majd a \u201ccsatolm\u00e1nyokban\u201d az \u00fcgyint\u00e9z\u0151nek kutatnia. K\u00f6nnyen bel\u00e1that\u00f3, hogy amennyiben ezeket a dokumentumokat az OCR technol\u00f3gia seg\u00edts\u00e9g\u00e9vel feldolgozzuk, akkor \u00cdgy azok m\u00e1r teljes m\u00e9rt\u00e9kben visszaker\u00fclnek a digit\u00e1lis t\u00e9rbe. Ezek ut\u00e1n pedig a <a href=\"https:\/\/precognox.com\/hu\/termekek\/tas-insight-engine\/tas-enterprise-search-engine\/\">megfelel\u0151 v\u00e1llalati keres\u0151megold\u00e1s<\/a> \u00e1ltal pillanatok alatt el\u00e9rhet\u0151v\u00e9 v\u00e1lnak a keresett inform\u00e1ci\u00f3k. A folyamat k\u00f6vetkezm\u00e9nyek\u00e9ppen pedig megval\u00f3sulhat a jelen kornak megfelel\u0151 \u00fcgykezel\u00e9s m\u00e9g akkor is, ha nem k\u00f6sz\u00f6n\u00fcnk el v\u00e9gleg a pap\u00edr alap\u00fa \u00fcgymenett\u0151l.<\/p>\n<p>Term\u00e9szetesen sz\u00e1mos m\u00e1s ter\u00fcleten is komoly el\u0151rel\u00e9p\u00e9s \u00e9rhet\u0151 el az optikai karakterfelismer\u00e9snek \u00e9s a sz\u00f6veganalitikai megold\u00e1soknak k\u00f6sz\u00f6nhet\u0151en, err\u0151l b\u0151vebben olvashat a <a href=\"https:\/\/precognox.com\/blog\/felejtse-el-a-papir-alapu-keresest\/\">Felejtse el a pap\u00edr alap\u00fa keres\u00e9st c\u00edm\u0171 blogcikk\u00fcnkben<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>A kih\u00edv\u00e1s B\u00e1r a digit\u00e1lis transzform\u00e1ci\u00f3 \u00f6les l\u00e9ptekkel halad, m\u00e9gis sz\u00e1mos helyen jelent\u0151s kih\u00edv\u00e1st jelent az \u00e9vek-\u00e9vtizedek alatt felgy\u00fclemlett pap\u00edr alap\u00fa dokumentumok feldolgoz\u00e1sa. \u00c9s a feldolgoz\u00e1s alatt nem kiz\u00e1r\u00f3lag ezen dokumentumok digitaliz\u00e1l\u00e1s\u00e1t \u00e9rtj\u00fck, hanem annak automatikus szort\u00edroz\u00e1s\u00e1t, illetve mindazon sz\u00f6veganalitikai folyamatokat, amelyek lehet\u0151v\u00e9 teszik, hogy a k\u00e9s\u0151bbiekben p\u00e9ld\u00e1ul a dokumentumok kereshet\u0151s\u00e9ge is megoldott legyen. \u00dcgyfel\u00fcnk [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1694,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[4],"tags":[],"class_list":["post-3091","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-mesterseges-intelligencia"],"acf":[],"_links":{"self":[{"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/posts\/3091","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/comments?post=3091"}],"version-history":[{"count":1,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/posts\/3091\/revisions"}],"predecessor-version":[{"id":3092,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/posts\/3091\/revisions\/3092"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/media\/1694"}],"wp:attachment":[{"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/media?parent=3091"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/categories?post=3091"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/precognox.com\/hu\/wp-json\/wp\/v2\/tags?post=3091"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}