A gépek tőlünk tanulták:
Gépi látás a gyakorlatban

Sokkal több területen találkozhatunk a gépek látási képességeit használó alkalmazásokkal, mint gondolnánk. Ott vannak a telefonunk kamerájában, a car-sharing szolgáltatók ellenőrző rendszerében és természetesen az ipari környezetben is megannyi alkalmazásban bizonyítanak. Dacára a széleskörű felhasználhatóságnak, még mindig rengeteg problémába ütköznek a fejlesztők – és nem csak technikai szempontból: a gépi látás felhasználásának jogi és társadalmi korlátai is lehetnek.

A Beyond the Hype meetup-sorozat keretében a harmadik alkalom fókuszában a gépi látás állt. A téma, hasonlóan az IoT és a kollaboratív robotok kérdésköréhez, ismét vitaindító volt és az előadások nem csak az iparágban dolgozók számára szolgáltattak hasznos információkat.

main_pic

 

„A mesterséges intelligencia már a spájzban van”

Az este első előadója Németh András, a Dolphio Technologies technológiai vezetője (CTIO) volt, előadásában a mesterséges intelligencia és a gépi látás szoros kapcsolata került előtérbe. Az AI (MI = mesterséges intelligencia) fejlődése és terjedése az utóbbi években egyre dinamikusabbá vált, a kutatásoknak köszönhetően számos olyan alkalmazás öltött testet, amely könnyebbé teszi mindennapi életünket (gondoljunk csak a telefonos „asszisztensünkre”, vagy a képkeresés algoritmizálására). Ezek a hétköznapi egyszerűsítések pedig sok esetben kapcsolódnak a gépi látáshoz.

A gépi látás általános felhasználása azonban számos ponton akadályba ütközik. Németh András a vállalat által megvalósított projektekből hozott példákon keresztül szemléltette a hallgatóságnak, hogy milyen problémák léphetnek fel egy „látó alkalmazás” tervezése és telepítése során.

Vegyünk egy egyszerű minőségellenőrzési példát! Egy 10 cm hosszúságú, hasáb alakú munkadarab méretellenőrzését kívánjuk egy szállítószalag fölött elvégezni. Amennyiben a teljes munkadarabot le szeretnénk fotózni a vizsgálathoz, 100 px/mm relatív felbontásra lesz szükségünk, mivel a darab tűrése 0,1 mm-es tartományba esik, a mérésnél megkövetelt pontosság pedig 0,01 mm-es. Az adatok alapján egy 75 MP-es kamerára lenne szükségünk, ami messze meghaladja a forgalmazott eszközök képességeit. Belátható tehát, hogy a gépi látás alkalmazásával végzett vizsgálatokban nagyon fontos a megfelelő tervezés, a valóban szükséges méreteket tartalmazó területre szűkítés, illetve a mérést támogató körülmények kialakítása.

A vizuális inspekció egyik legfontosabb kihívása az emberek géppel történő helyettesítése során az, hogy az emberek önálló gondolkodásra képesek, míg a gépek nem. Utóbbiak is alkalmasak lehetnek döntések meghozatalára, ám ezt egy nagyon hosszú és alapos tanítási folyamatnak kell megelőznie. Ezen a ponton az AI, a Machine Learning (Gépi tanulás) és a gépi látás szorosan kapcsolódik egymáshoz. Ahhoz, hogy valódi minőségellenőrzési rendszert építhessünk, nemcsak jó kamerára van szükség, hanem megfelelő algoritmusra és vizsgálati stratégiára is.

Fontos paraméterek a vizsgálati rendszer kiépítése során a képalkotó eszközökön túl a feldolgozást végző rendszerek, illetve a közöttük kommunikációt biztosító csatornák is. Ez utóbbiak jelentik sok esetben azt a szűk keresztmetszetet, amely korlátokat szab a kezdeti elképzeléseknek. A gépi látást kutató és fejlesztő szakemberek számára ez azonban inkább kihívást jelent semmint megoldhatatlan problémát.

A felsorolt nehézségek ellenére Németh András hozzátette: „A gépi látás alkalmazása természetesen megtérülő befektetés lehet a gyakran és gyorsan ismétlődő vizsgálati feladatoknál. Hiszen a gépek nem fáradnak el, folyamatba integrálva működhetnek és egyszerre több paraméter elemzésére is képessé tehetők.” Ahhoz azonban, hogy a gépek, az emberekhez hasonlóan, értőn tekintsenek az eléjük tárt valóságra, még egy ideig várnunk kell.

A gép többet lát: csökkenő selejtarány a gyártásban

A FESTO AM Gyár- és gyártóeszköz fejlesztési vezetője, Fazekas Árpád valódi termelési tapasztalatokról számolt be a témával kapcsolatban. Budapesti gyárukban több olyan vizsgálati rendszert vezettek be a közelmúltban, amelyek a gépi látás képességeinek segítségével elemzik a gyártott darabok megfelelőségét.

Tipikus példa a termelésből az RFID kódok használata, amely a FESTO-nál megkönnyítette a szerszámok azonosítását és a gépek megfelelő beállítását is. A nagy számú konfigurációban elérhető levegőelőkészítő egységek vizsgálatában a kamera a rendelt tételek összeállítását ellenőrzi (pl. a manométer típusát összehasonlítja a megrendelő igényeivel vagy a csatlakozók méretét ellenőrzi).

Fazekas Árpád a selejtarány jelentős csökkenéséről számolt be. Az új tesztberendezésekkel szinte megszűntek a nem megfelelő konfigurációk szállításából származó veszteségek. Előadásában külön kitért továbbá az általuk tapasztalt hátrányokra, így a rendszer bonyolultságára, a szakemberigényre és a külső környezeti hatásokkal szembeni érzékenységre. Ugyanakkor hozzátette, hogy az automatizált rendszerek üzemeltetését megfelelően képzett emberekre bízva a meghibásodások jelentős része elkerülhető vagy rövid időn belül orvosolható.

„Minden zsebben van egy szuperszámítógép”

Az IP Systems-et képviselő Osgyán Balázs hétköznapi példákat hozott a gépi látás területéről az est harmadik előadójaként. Kiindulva a mobilbarát alkalmazásfejlesztésekből rávilágított arra, hogy életünket milyen mértékben uralják személyes IT eszközeink. Ezt pedig, mint lehetőség mutatta be, ugyanis az okostelefonokban használt megoldások fejlesztése az ipari rendszerek számára is hasznos tapasztalatokat jelenthet.

Tudja mi az a captcha? Ezek, az online térben felbukkanó ellenőrző feladványok nagyon fontos szerepet játszanak a gépek tanításában. Bizonyára találkozott már Ön is olyan feladvánnyal, amelyben az autó (esetenként, ház, arc, állatok, stb.) tartalmazó képrészleteket kellett megjelölni. Ezek a rövid feladványok segítenek a számítógépes algoritmusoknak abban, hogy később ők is könnyen felismerhessék ezeket az eléjük kerülő képeken.

Napjainkban már a lakossági piac is nyitott, sőt elvárásokat támaszt a gépi látással szemben. A szelfik világában a telefon kamerájában dolgozó mosolyfelismerő alapelvárás. Miért ne használhatnánk tehát a rendelkezésünkre álló megoldásokat mindennapi ügyeink intézésre?

Az IP Systems egy okos mobil leolvasó alkalmazás fejlesztésével kívánja forradalmasítani hazánkban a közműszolgáltatóknak szolgáltatott adatok beküldését. De Osgyán Balázs nemcsak ezt a példát mutatta be a meetup közönségének, hanem számos olyan, már széles körben elterjedt alkalmazást, amelyek szintén a gépek látási képességeire alapozzák működésüket (digitalizáló vagy AR környezetet létrehozó applikációk).

Tegyen egy próbát Ön is! Írja be a Google képkeresőbe a kedvenc színésze nevét! A találatok között nyisson megy egy -lehetőleg egészalakos – fotót a választott személyről, majd görgessen lejjebb a találati oldalon! Bizonyára elsiklott volna fölötte, de az oldalon megjelenő reklámokban megjelenő ruházati termékeket szemügyre véve nyilvánvaló hasonlóságot tapasztal majd a megnyitott képen szereplőkkel.  

A képfelismerés azon túl, hogy valódi segítséget jelenthet számos helyzetben, vitás kérdéseket is teremthet. A képelemzés, az online térbe feltöltött tartalmak értelmezése olyan információk összegyűjtését és felhasználását teszi lehetővé, amelyeket nem minden esetben tettek szándékosan nyilvánossá a tulajdonosaik. Szintén vitás helyzetet teremtett korábban a Google képfelismerő szolgáltatása is, amely a különböző bőrszínű személyeket tévesen sorolta kategóriákba.

A gépi látásban rejlő lehetőségek kibontakozásának tehát a technikai korlátokon túl jogszabályi és társadalmi aggályokkal szemben is helyt kell állnia. Az ilyen kérdésekben ugyanúgy etikus és biztonságos megoldásokkal kell szolgálnia a technológiának ahhoz, hogy tovább fejlődhessen és terjedhessen az alkalmazása.

További információ

A Com-Forth Kft. weboldalán.

A Green Fox Academy honlapján.