Intelligent search solution to support agricultural research work

Esettanulmány a MATE Kaposvári Campus és a Krizevci Agrár Főiskola számára fejlesztett keresőmegoldásról

A projekt

Az INTERREG támogatásával 2020 és 2022 között megvalósuló átfogó projekt célja, hogy egy komplex, többszintű képzési rendszer fejlesztésével és működtetésével javítsa a horvát-magyar határmenti térségben jelenleg működő, valamint potenciális élelmiszer láncok agilitását és ellenállóképességét. A tervezett képzési rendszer a rövid ciklusú tréningektől az alap- és mesterképzésen át a szakirányú továbbképzésig a teljes képzési vertikumot átfogja.

A Projekt részét képezi egy agrár élelmiszerlánc kereső alkalmazás fejlesztése, amelynek célja a MATE Kaposvári Campus-on zajló kutatói munka segítése, számos online szakmai forrás tartalmának gyűjtésével és azok kereshetővé tételével.

A Precognox által fejlesztett összetett szöveganalitikai megoldások teljes mértékben lefedik a Projekt során felmerülő feladatokat, az adatgyűjtéstől- és validálástól kezdve az intelligens keresésig.

a MATE Kaposvár Campus épülete (forrás: LinkedIn – MATE Kaposvár Campus)

Adatgyűjtés, mint a folyamat alapja

A sikeres kutatói munka megvalósításához első körben releváns és megbízható információkkal rendelkező portálok szöveges tartalmainak összegyűjtésére van szükség. Ehhez a TAS Data Collector megoldásunk nyújt segítséget, amellyel jelenleg 5 angol nyelvű, az agráriumi kutatómunka szempontjából releváns portál tartalmai kerülnek gyűjtésre.

Ezzel párhuzamosan zajlik az az oktatási, betanítási folyamat, amelynek során a megrendelő képessé válik az adatgyűjtés további 60-70 forrással történő kibővítésére, ehhez a Precognox biztosítja a TAS Data Collector-hoz tartozó, folyamatosan frissített és bővített tananyagot és emellett technikai támogatást is nyújt. Így, bár nagyobb megrendelői időbefektetéssel, de jóval kisebb költségek mellett érhető el az adatgyűjtés bővítése és karbantartása.

Hogyan zajlik az adatgyűjtés?

Az adatgyűjtés során a TAS Data Collector segítségével a hírek szűk lényegének* elhozatala, majd manuális és alacsony szintű (*regex-es “országkinyerés”, dátumtisztítás minták alapján) feldolgozása valósul meg. Ennek folyamán nem a teljes szöveges tartalmak, hanem azok bizonyos metaadatainak és attribútumainak (forrás, url, gyűjtés dátuma, létrehozás d., kategória, cím, absztrakt, PR-e) gyűjtése zajlik.

A sokszor tőmondatnyi absztraktokon alapuló keresés hatékonyságát pedig a későbbiekben a TAS Thesaurus Manager és a TAS Search Log Analyzer hivatott segíteni.

a TAS Data Collector felületén folyamatosan követhető az adatgyűjtési folyamat

Intelligens keresés

Természetesen az adatgyűjtés csak a projekt megvalósításának kiindulópontja, amelynek végcélja, hogy a már rendelkezésre álló tartalmakban a megrendelő egyszerűen és hatékonyan keresni legyen képes. A lekérdezéseket a felhasználó a TAS Vállalati kereső felületén hajthatja végre.
A kezelőfelületen elérhetőek a keresőmotorokra jellemző funkciók, így az összetett keresési-, valamint szűkítési (szűrési)-és sorbarendezési lehetőségek. Az egyes találatokra kattintva a felhasználó pillanatok alatt eljuthat az eredeti tartalomhoz.

Keresés extrákkal

A megrendelő számára a TAS keretrendszerben (ld. keretes bejegyzésünk) elérhető a hatékonyabb keresést szolgáló TAS Thesaurus Manager megoldás, amely egyfajta továbbfejlesztett szinonimaszótárként szolgál és amelyben az alábbi szókapcsolati relációk állíthatóak be:

  • szinonima
  • helyes forma
  • elírás
  • szűkebb kifejezés
  • tágabb kifejezés
  • nincs kapcsolat

A beállított relációk segítségével könnyedén megtalálhatóak a releváns tartalmak még a keresés folyamán történő elgépelés esetén is.

Minden egy helyen

A TAS Platform, mint keretrendszer tartalmazza mindazon megoldásokat és szolgáltatásokat, amelyekre a megrendelőnek szüksége van az adott szöveganalitikai feladat megoldásához. Így egy helyen elérhető például az adatgyűjtésre szolgáló TAS Data Collector, a TAS Vállalati kereső, a lekérdezési előzmények vizsgálatához segítséget nyújtó TAS Search Log Analyzer vagy éppen az intelligens kereséshez komoly támogatást biztosító TAS Thesaurus Manager “szinonimaszótár”, valamint a TAS User Management, a felhasználói jogosultságok beállítását segítő modul.
A MATE Kaposvári Campus projekt keretében alkalmazott szöveganalitikai megoldások nem fedik le maradéktalanul a TAS Platformon belül opcionálisan elérhető modulok teljes vertikumát, hiszen az olyan további szolgáltatásokat is tartalmazhat, mint a TAS Tagger, a TAS Alarmlist vagy a TAS News Reader.

a TAS Vállalati kereső kezelőfelülete

A TAS Platformon belül egy további szolgáltatás is a megrendelő rendelkezésére áll, ez a TAS Search Log Analyzer, amellyel a lekérdezések során használt keresési kifejezések vizsgálhatóak meg. A jól átlátható kezelőfelületen elemezhetőek az alábbiak:

  • keresési kifejezések: a keresett kifejezések listája
  • legnépszerűbb keresési kifejezések
  • az adott időszakban megvalósult keresések száma: a kifejezések listája a keresések számának csökkenő sorrendjében
  • szűrési lehetőségek: szavak, kifejezések, keresések és találatok száma, felhasználók, indexek, trendek, dátumtartomány (időszak) alapján
  • gyakori keresések eredmény nélkül
  • pozitív és negatív keresési trendek
a TAS Search Log Analyzer felületén a keresési kifejezésekkel kapcsolatos legfontosabb információk tekinthetőek át
a TAS Thesaurus Manager-ben létrehozott szókapcsolatok segítségével hatékonyabbá válik a keresési folyamat

Kereső applikáció az agrárium számára

A projekt eredményeinek szélesebb körű kihasználhatósága érdekében a keresőfelület a későbbiekben nem kizárólag a megrendelő számára lesz elérhető a TAS keretrendszeren belül, hanem webes fejlesztés keretében a nagyközönség számára is. Ennek fejlesztésében a Precognox partnere a WEB200 Internet Média Kft.

Az ingyenesen használható kezelőfelület várhatóan az év második felében lesz elérhető.

A kutatómunka szolgálatában

Az agrárszektor az egyik legdinamikusabban fejlődő ágazat, mely nagy mértékben köszönhető a területen zajló kutatásoknak. Az olyan adatgyűjtő- és keresőmegoldások, amelyek a jelen projekt keretében valósulnak meg, komoly segítséget nyújtanak a szakemberek számára, hogy még hatékonyabban dolgozhassanak az agráriumhoz kapcsolódó kutatás-fejlesztési projekteken.