„A mesterséges intelligencia egyrészt nem teljesen megbízható, másrészt nem mindig pontos, harmadrészt nincs etikája.” – interjú Dr. Magyar Gáborral, a NAV Mesterséges Intelligencia Munkacsoportjának elnökével
Míg korábban csak filmek, sorozatok alapötletét adta, az elmúlt évek egyik legtrendibb fogalmává nőtte ki magát a mesterséges intelligencia. De mi lehet a magyarázat az áttörésre, erre a nagy népszerűségre?
– A mesterséges intelligenciának legalább hatvanéves története van. De még jó húsz évvel később, amikor jómagam ezzel a tudománnyal kezdtem foglalkozni az egyetemen, még nagyon kevesek játszótere volt. Ehhez képest most 100 milliók használnak mesterséges intelligencia-eszközöket. A népszerűséggel valószínűleg együtt jár a marketing. Most olyannyira trendi márkává vált a mesterséges intelligencia, hogy már a porszívót, az elektromos fogkefét is ezzel a címkével árulják.
Hogy ezek után biztosan el tudjuk dönteni, mezei vagy AI-támogatott a porszívónk, definiálhatnánk a mesterséges intelligenciát!
– Javaslom, hogy lépjünk eggyel hátrébb. Azt is nehéz meghatározni, hogy mi az intelligencia. Nincs egyetlen közmegegyezéses definíció sem erre. A témával foglalkozó legfontosabb szakmai tanulmányokban is több mint harmincféle fogalommeghatározás szerepel. Egy lexikonszócikkben írnak öt sort erről, de nehéz két olyan lexikont találni, amelyben a fogalommeghatározás ugyanaz lenne. És áttérve a szóösszetételre, magára a mesterséges intelligenciára, el is érkezünk ahhoz a fontos kérdéshez, hogy mi is különbözteti meg az embert ettől a géptől? A kreativitás vagy az érzelem? A nagy érdeklődést éppen az váltotta ki, hogy két-három éve emberi nyelven tudunk társalogni egy nem emberi intelligenciával. És itt csatolnék vissza az előző kérdésre is, mert valójában az emberi nyelven való kommunikáció törte át a tömeges érdeklődés határát. Ha mindenképp szeretnénk egy dátumot rendelni ehhez, akkor – bár nagyon egy ütemben haladtak a nagy techcégek a fejlesztéssel – a társalgó modellekben az OpenAI által fejlesztett GPT3.5 nyilvánosságba robbanásához, azaz 2022 novemberéhez lehet kötni az áttörést. Azóta pedig, tetszik vagy sem, de megjelenik a mindennapjainkban az, amit közönségesen mesterségesintelligencia-alkalmazásnak vagy technológiának hívunk.
Még mindig a fogalomkörnél maradva: a mesterséges intelligencia mivel több mint a kódolás?
– Van egy nagy fal a szabályalapú rendszerek és a gépitanulás-alapú rendszerek között. A szabályalapú rendszer, vagy szakértői rendszer mesterséges intelligencia nélkül működik. Ha megvan az eljárás alanyának, az ügynek az összes adata, és ha megvan a szabály, akkor egy algoritmus alkalmazza a szabályt az adatokra, például kiszámol egy illetéket, vagy kimondja, hogy történt-e szabályszegés. Így például a részletfizetés elbírálásának automatizálásához nem szükséges mesterséges intelligencia, csak kódolás. Ha minden feltett kérdésre igen a válasz, akkor a gép legenerálhatja a kérelemnek helyt adó döntést. Ilyen kérdés például az, hogy a tartozás összege egymillió forint alatti, vagy, hogy magánszemély-e, aki benyújtotta a kérelmet. De más a helyzet például a banki hitelkérelem elbírálásánál. Ott nemcsak a folyószámla forgalmát vizsgálják meg, hanem a számlatulajdonos viselkedését is megbecsülik. Például monitorozzák, hogy határidőben fizet-e és tulajdonságai alapján besorolják valamelyik kockázati kategóriába. Az már szabályozási, etikai kérdés, hogy a bankok profilozhatják-e ügyfeleiket. Vagyis a gépi tanulás alapú rendszerek a számszerű adatok mellett viselkedéstípusok szerint is elemezhetnek. És attól teljesen függetlenül, hogy ez tetszik vagy sem, szinte az összes digitális óriáscég alkalmazza. Nemcsak a Google és a Facebook, de a Netflix is profiloz.
Az AI népszerűségét használta ki a NAV? Ezért jött létre 2022 tavaszán a NAV Mesterséges Intelligencia Munkacsoportja, a MIMCS?
– Nem a népszerűség, hanem a történelmi lehetőség vezetett a MIMCS-hez, amely nem a marketinges, népszerűségi kampányokra reflektál, hanem hídként köti össze az egyetemi, kutatóvilágot és a közigazgatást. A munkacsoport célja a NAV adatvagyonában meglévő értékek kiaknázása, és ennek révén a tudományos módszertanok és az adózási, adóztatási tapasztalatok szinergiájának kihasználása. Ezt egy kormányhatározat rögzíti is, ugyanúgy, ahogyan a testület feladatait is. E szerint a MIMCS-nek javaslatot kell kidolgoznia a szemantikus adatvagyon-kataszterre, valamint a gépi tanuláshoz szükséges címkézés módszertanára. Ugyancsak részei a küldetésnek a tanító algoritmusokkal kapcsolatos vizsgálatok, a validálási módszertan kidolgozása, és a nem kontrollált gépi tanulás fejlesztése.
Kétségtelen, hogy tudományos kihívás a kormányhatározatban foglaltak megvalósítása, ezzel együtt nem megkerülhető az a személyes jellegű kérdés, hogy a Budapesti Műszaki és Gazdaságtudományi Egyetem mesterségesintelligencia-tanszékének a vezetésével szemben milyen előnyöket nyújt, vagy izgalmakat rejt a MIMCS?
– A NAV adatgazdagsága minden vérbeli kutatót motivál. Ezért vesz részt a munkacsoport munkájában több, kiemelkedően jó egyetemi professzor és kutató. A legnagyobb kihívás egy laikusnak banálisnak tűnhet, de a mesterséges intelligencia tudományában jártas olvasó érti, hogy miért fontos az adatok pontos, jó előkészítése és rendszerezése. Teljesen másfajta rendezésre van szükség, mint amit eddig megszoktak az adószakmában. A NAV rendszerei alapvetően a bevallásokra épültek, amelyek évente, negyedévente, havonta érkeztek. Ez a fajta adatfeldolgozási rendszer a sok, gyakran érkező adat fényében kissé régimódinak számít. Teljesen más informatika szükséges a valós idejű adatok elemzéséhez. Az online pénztárgépek, az Online Számla, az eKÁER rendszeréből az ügyletekről azonnali adatok érkeznek. Annak ellenére, hogy a NAV a közigazgatás leginnovatívabb szerve, amely élen jár az adatkorszak fejlesztéseiben, de, a mesterséges intelligencia és az egyedülállóan széles körű adatállomány miatt mégis szükséges digitális átalakítása.
Ezek elég hosszú távú céloknak tűnnek. Van olyan projekt, amelytől konkrét eredmény várható valamikor a közeljövőben?
– A MIMCS-nek az a fő célja, hogy a NAV feladatellátását segítse, ehhez új eszközöket kísérletezzen ki, és hozzon be a rendszerbe. A végcél az, hogy ezek az eszközök be tudjanak épülni, segítsék a NAV szakembereinek munkáját. Számos, konkrét és kifejezetten NAV-os célokat szolgáló kutatási projektet indítottunk el.
A sajtóban is lehetett olvasni az újfajta kockázatelemzési modellekről, amelyek a mesterséges intelligenciára épülnek.
– Több ilyen is fut. Az online számlák között szokatlan számlákat kereső modellt emelném ki, mert ez már idén kijön az első eredményekkel. Több mint 3,2 milliárd számla van a NAV Online Számla rendszerében. A mesterséges intelligencia pedig pont arra való, hogy a nagyon sok adatban nagyon gyorsan szokatlan vagy tipikus jelenségeket keressen. Ez a két szélsőség, amire a leginkább alkalmas az automatizálás. Ez a konkrét kutatás szokatlanságokat keres a számlaadatokban. Például szokatlan, ha egy cég rendszeresen alumíniumöntvényeket vásárol, és az erről szóló több száz számla között hirtelen megjelenik egy nagyértékű, süteményekről szóló számla. A modell nem értékel, „csak” felhívja a figyelmet a szokatlansága miatt a süteményszámlára. Kétségtelen, hogy lehet teljesen szabályos egy-egy szokatlan számla mögötti ügylet. Így a példánkban lehet, hogy a cég a jubileumi ünnepségére rendelt süteményeket. De a szokatlansági vizsgálat rávilágíthat egy olyan jelenségre is, amelyet érdemes ellenőrzési eljárásban megvizsgálni, valamint alkalmas lehet a számla befogadójának figyelmeztetésére is.
A számla befogadójának a figyelmeztetésére most is van lehetőség, ehhez mit tud hozzátenni a mesterséges intelligencia?
– Az időtényezőt. Ez egy mesterséges intelligencia-modell, ami a gyakorlatban azt jelenti, hogy nem tucatnyi ember vizsgálja a számlákat a monitor mögött ülve, hanem a modell folyamatosan, 24/7-ben fut valós időben. Így sokkal hamarabb kiszűri a szokatlan számlát, a számlabefogadót még bőven azelőtt lehet figyelmeztetni, hogy az áfabevallásában levonásba helyezné a számlán szereplő áfa összegét.
Adózókat segítő alkalmazás fejlesztésén is dolgozik MIMCS?
– Több olyan projekt is fut, amelyik a NAV ügyfélcentrikus oldalát hívatott erősíteni. Egy idén indulót emelnék ki most közülük: a főtevékenység megbecslését. A vállalkozások társasági szerződésükben, vagy bejelentkezéskor beírják a TEÁOR-kódokat, van olyan, aki csak egyet-kettőt, de akad olyan is, aki százat is megjelöl. Mivel nincs jogszabályi kötöttség, a főtevékenységként megjelölt kód ritkán felel meg a valóságnak, jellemzően azért, mert az idő múlásával a főtevékenység megváltozik, vagy azért, mert már a cégalapításkor, bejelentkezéskor sem volt pontos. A főtevékenység meghatározásánál a mesterséges intelligencia felhasználja a NAV-nál rendelkezésre álló adatokat, így például az online számla, online pénztárgép adatait. A téma aktualitását az adja, hogy jövőre új TEÁOR-számok lesznek, 2025. január 1-jén lép ugyanis hatályba a gazdasági tevékenységek egységes ágazati osztályozási rendszere, a TEÁOR’25. A besorolásban segíthet MIMCS főtevékenységet meghatározó modellje
A vám vagy a bűnügy területén is tud újat nyújtani a MIMCS?
– Igen, a röntgenátvilágítás a határon több szempontból is kiemelendő tudományos projekt. A schengeni egyezmény előírása alapján az Európai Unió védelme szempontjából is fontos határállomásokat üzemeltetünk, ahol a vasúti és közúti forgalomban is használ a NAV röntgenberendezést. A pénzügyőrök elemzik a felvételeket, keresik az oda nem illő dolgokat: embert, cigarettát és más csempészárut. Arra készül most egy mesterségesintelligencia-modell, hogy rávilágítva ezekre a gyanús területekre, könnyítse a munkát. Erre a kutatásra a Semmelweis Egyetem kutatói csapatát kértem fel, mert az orvosok több mint száz éve röntgeneznek, igaz nem csempészárut, hanem embert. Ha képesek arra, hogy a tüdőröntgenen megtalálják a gyanús foltokat, ami az orvosok munkáját jelentősen megkönnyíti, hisz a gyanún felül álló részeket meg se kell nézniük, akkor a járművek és a vagonok átvilágításánál is használható a röntgenelemzési modell. Itt is a lényeges és problémás területeket kell megjelölni. Ráadásul az is fontos az, hogy a határon ne alakuljon ki forgalomtorlódás, gyorsnak kell lenni. Sokat segíthet a szakembereknek a MIMCS röntgenátvilágítási modellje, és az ellenőrzésre fordított időt is jelentősen csökkentheti. Ez a projekt abban is speciális, hogy jelenleg ezt kíséri a legnagyobb nemzetközi érdeklődés.
És merre tartunk? Dolgozik majd helyettünk? Eljöhet a Terminátor-szerű fordulat; a mesterséges intelligencia átveheti az uralmat?
– A munkánkban használjuk, szöveges összefoglalót, kivonatot tud csinálni. Például kérhetem, hogy egy tízoldalas adóhivatali tájékoztatóból készítsen egyoldalas összefoglalót. A mindenkit foglalkoztató kérdés az, hogy vajon jó lesz-e. Egyetlenegy mesterségesintelligencia-fejlesztő cég sem tudja garantálni, hogy egymillió esetben is mindig jó választ fog adni a gép. Nem 100 százalékosan megbízhatóak ezek a rendszerek, ez matematikai törvényszerűség. Vagyis az adószakma, így a NAV, a könyvelő, az adótanácsadó felhasználja a mesterséges intelligenciát mint segédeszközt, amely a munkáját megkönnyíti, de míg a mesterséges intelligencia nélkülözhető, a szakember nem.
Tíz-húsz év múlva sem, sőt úgy gondolom, hogy soha nem jutunk el arra a szintre, hogy az ember kihagyható lenne. Ennek három oka van. A mesterséges intelligencia egyrészt nem teljesen megbízható, másrészt nem mindig pontos, harmadrészt nincs etikája. Arról is sok vita folyik, hogyan lehet egy gép plurális gondolkodású. Erre még nincs megoldás. Például, ha egy településen arról folyik a vita, hogy a parkot, a járdákat vagy az óvodát újítsák fel, ott nem tud jó döntést hozni a mesterséges intelligencia.
Az alapvetésem az, hogy az eddigi találmányok – az emelőtől kezdve a keréken keresztül egészen a vasútig – a mi társadalmi létünket tették jobbá, gazdagabbá, könnyebbé. Ez érvényes erre a technológiára is, azért van, hogy segítsen. A gép tehát nem veszi át az uralmat az ember fölött, mint a sci-fi-sorozatokban. Nem egy gólemet hoztunk létre. De az igaz, ha rosszul szabályozzuk, vagy rossz napi gyakorlattal használjuk, akkor sok kárt tud okozni a mindennapokban az emberi kapcsolatokban. A feladatunk mindössze annyi, hogy megtanuljuk jól használni.
Névjegy