TAS Tagger

Automatizálja a szöveg és médiatartalmak címkézését, kategorizálását és elemzését, javítva ezzel a dokumentumok, e-mailek és cikkek keresési lehetőségeit.

beszéljünk

Mi a TAS Tagger?

A TAS Tagger kifejlesztésének alapötlete egy olyan szoftver létrehozása volt, amely képes kinyerni és meghatározni a kulcsfontosságú kifejezéseket és témákat (címkék) a szöveges tartalmakból. Ezen kifejezések és a megnevezett entitások (személynevek, helyek, szervezetek, dátumok, stb.) azonosítása számítógépes nyelvészeti és gépi tanulási módszerekkel és eszközökkel történik. Az alkalmazott módszerek és eszközök kombinációja az ügyfél igényeitől függ.

Miért hasznos a TAS Tagger?

A TAS Tagger számos előnyt kínál. A nagyobb szövegtestek címkézése javítja a dokumentumok használati hatékonyságát:

  • gazdagítja az adataikat (a címkék metaadatok),
  • könnyebben kereshetővé teszi őket (dokumentációk vagy akár e-mailek),
  • javítja az adatminőségüket

Ezenfelül a TAS Tagger megoldás adatokat biztosíthat szövegek automatikus (gépi tanuláson alapuló) osztályozásához.

A TAS Tagger használata nem jelenti azt, hogy a cégnek fel kell adnia a jelenleg használt rendszereket, csupán segít ezeknek az alkalmazásoknak hatékonyabban működni, így emelve a betekintések megszerzésének folyamatát egy magasabb szintre.
Azonban, ha a komplex felhasználói igények megkövetelik egy új keresőmotor bevezetését az vállalati IT környezetben, a TAS Enterprise Search kiváló megoldás. Mindkét megoldás párhuzamos alkalmazása valódi Insight Engine-t helyez a kezébe.

A nagyobb szöveges tartalmak (szövegtörzsek) címkézésével a megoldás javítja a dokumentumok (szöveges tartalmak) használatának hatékonyságát, mivel a címkézés által adatgazdagítás történik (a címkék metaadatok), ezáltal növekszik az adatminőség. A címkék segítségével pedig könnyebben kereshetővé válnak a dokumentumok vagy akár az e-mailek. A TAS Tagger egyik legnagyobb előnye, hogy nem szükséges lemondani a cégen belül eddig alkalmazott keresőmotor használatáról, megoldásunk mindazonáltal elősegíti annak hatékonyabb működését. Amennyiben az összetett felhasználói igények miatt a vállalati informatikai közegben szükségessé vált új keresőmotor bevezetése is, akkor a TAS Vállalati kereső kiváló megoldást jelent, amely a TAS Tagger tudásával együtt egy igazi Insight Engine-t ad az Ön kezébe.

A vállalati adatvagyon kiaknázása a sikeres üzleti döntés alapja

A megfelelő üzleti döntések meghozatalához alapvető fontosságú a nagy mennyiségű vállalati adatban rejlő potenciál kiaknázása. Ehhez azonban elengedhetetlen, hogy a rendelkezésre álló céges tartalmakban felismerjük és megcímkézzük a számunkra fontos részleteket. Ezek a vállalati adatvagyonba tartozó tartalmak a legkülönfélébbek lehetnek: üzleti dokumentumok (szerződések, jegyzetek), interneten elérhető szövegek (cikkek és egyéb dokumentumok), tudományos tartalmak (esszék, disszertációk, közzétett kutatások), vagy akár e-mailek.

Bármit is jelentsen az érték a vállalat számára a vállalati adatokban, elengedhetetlen, hogy azt megfelelően ki lehessen nyerni és címkézni, függetlenül attól, hogy ezek az értékek hol rejtőznek: üzleti dokumentumokban (szerződések, jegyzetek), az interneten elérhető szövegekben (cikkek és egyéb dokumentumok), tudományos tartalmakban (esszék, disszertációk, közzétett kutatások) vagy akár e-mailekben.

ChatGPT? Integrálva

Az OpenAI ChatGPT megoldása a szöveganalitika területén is számos lehetőséget kínál.

A nyelvi modell integrációjával a TAS Tagger kezelőfelületén új szintre lépett a felhasználói élmény.

Integrált technológiák

A TAS Tagger egyszerre integrálja a technológiai óriások (Microsoft, IBM, Google, OpenAI – ChatGPT) szöveganalitikai csomagjait, illetve az egyes részterületek vezetőinek (Basistech, Neticle, Repustate, MeaningCloud) fejlett megoldásait. A TAS Tagger az integrált modulok tudásának egyesítésével a legismertebb és legszélesebb körben alkalmazott szövegfeldolgozási módszereket állítja csatasorba:

  • téma-, kulcsszó- és entitáskinyerés
  • névelem azonosítás
  • nyelvfelismerés
  • hangulat- és emócióelemzés
  • videó- és hangelemzés

Mindezek a módszerek az adott szektortól és szakmai területtől függetlenül működnek. A kinyert információk pedig azonnal feldolgozhatók a különböző részlegek szakértői által alkalmazott további rendszerekkel, így a felhasználók (elemzők, adattudósok, menedzserek, HR, értékesítési vagy marketing szakértők) és az alkalmazások (kereső motorok, BI eszközök, további az ügyfél által már használt megoldások) köre meglehetősen széles.

A fentieken túl a TAS Tagger új perspektívákat nyit a belső vagy külső Data Science csapat számára is, hiszen az automatikus címkék használata mellett felügyelt gépi tanulásos modelleket is készíthetnek, amelyek szintén hasznosíthatóak a vállalati infrastruktúrán belül.

A kézi címkézési funkció (annotáció) segítségével a dokumentumok előkészíthetőek a modellek építéséhez. Ezen modellek implementációja támogatja a szöveges tartalmak automatikus kategorizálását.

A megszerzett betekintéseken túl a szükséges információkat azonnal feldolgozhatják a különböző részlegek szakértői által alkalmazott további rendszerekkel.
Ezek az alkalmazások lehetnek:

  • keresőmotorok,
  • BI eszközök vagy
  • további piacvezető megoldások

A legismertebb és legszélesebb körben alkalmazott szövegfeldolgozási módszerek rendelkezésre állnak:

  • téma-, kulcsszó- és entitáskinyerés
  • nyelvfelismerés
  • hangulat- és emócióelemzés
  • videó- és hanganalitika

Mindezen módszerek a megadott szektoroktól és szakmai területektől függetlenül működnek. Így a felhasználók köre is széles lehet:

  • elemzők,
  • adattudósok,
  • kutatók,
  • menedzserek,
  • HR, értékesítési vagy marketing szakértők

A címkézési folyamat

  • a címkézendő szövegtest meghatározása
  • címkék meghatározása
  • a címkék pontosságának ellenőrzése
  • a címkézendő vállalati dokumentumok körének meghatározása
  • opcionálisan a vállalati adatokon túl a világhálón elérhető szöveges tartalmak legyűjtése a TAS Data Collector segítségével
  • címkék meghatározása automatikusan, vagy kézi címkézéssel
  • a kapott címkék felülvizsgálata
  • címkék lekérése tetszőleges számú további dokumentumokhoz

A TAS Tagger elemzi a szövegtestet és automatikusan meghatározza a címkéket. A lehetséges (felhasználható) címkék listáját az ügyfél akár előre is meghatározhatja. Ilyen esetben egy szakmai-szakterületi címke-adatbázist építünk a felhasználóval együttműködve.Az IDOL (Intelligent Data Operating Layer) a Micro Focus átfogó elemzési megoldását kínáló platform, melynek integrációjával lehetővé vált a videó- és hangelemzés is, így már a vizuális- és audio tartalmakhoz is rendelhetőek címkék. Ez az adatbázis fogja tartalmazni az előre meghatározott címkéket és a gépi tanulási modell ezt az adatbázist használja a címkézési folyamat során. A TAS Tagger kezelőfelületén lehetőség van arra is, hogy a címkék közötti relációt (tágabb és szűkebb kifejezések, alá- és mellérendelés) meg lehessen határozni. Például: a talált kifejezések, mint például az autó, a busz, a motorkerékpár, az autóbusz, a teherautó mind a „jármű” szóhoz kapcsolódnak. A Tagger egyúttal (a megadott kapcsolatok által) felismeri a szinonimákat, mint például a bicikli-kerékpár szópár. A TAS Tagger kezelőfelületén lehetséges a címkék közötti kapcsolatok felülvizsgálata – historizált vagy vizuális formában. A címke elfogadása után a szoftver tárolja azt. A rendszer egyúttal a szöveges tartalmat is tárolja.
Minél több kapcsolat és reláció van meghatározva, annál pontosabb címkézési eredmények érhetők el. Ezért mindig fontos, hogy a címke-adatbázis precízen kerüljön kialakításra.

graph view

A TAS Tagger kezelőfelület megjelenése

A TAS Tagger kezelőfelület a TAS Platform (TAS Cloud szolgáltatás) vagy On Premise (lokálisan telepített) keretein belül hozható létre. Megjelenése megfelel a TAS Platform arculatának. A kezelőfelület (GUI) felhasználóbarát és használata könnyen elsajátítható. A felület testreszabható, lehetséges az elemek egyenkénti módosítása az ügyféligényeknek megfelelően.

TAS Tagger felhasználói felület

A TAS Tagger grafikus felhasználói felületét a TAS Platformon (TAS Cloud szolgáltatás) vagy helyszíni (helyben telepített) keretek között lehet létrehozni. A Tagger megjelenése összhangban áll a TAS Platform vállalati arculatával. A megjelenítés és a felhasználói felület többi része is konfigurálható. Az adott megoldás az ügyfél igényeitől függ.