Kivonat
Olyan körülhatárol teret (szobát, utcát, épületet vagy nyílt terepet) tekintünk intelligensnek, amely a tér állapotát folyamatosan megfigyelő érzékelők célirányosan kiépített rendszerével van ellátva. Az érzékelőktől nyert információ feldolgozását követően egy mesterséges intelligencia alapú vezérlő algoritmus érzékelni tudja a térben zajló eseményeket, azokat bizonyos szempontok alapján egy megelőző tanulási folyamatot követően értelmezni, értékelni tudja, valamint az adott szituációnak leginkább megfelelő önálló döntést képes hozni.
A cikk áttekintést ad a világban folyó intelligens terekkel kapcsolatos kutatásokról és részletesen bemutatja az Intelligens Integrált Rendszerek Japán Magyar Közös Laboratórium e területen elért eredményeit. A cikk befejző fejezete gondolatébreztőnek felsorol néhány lehetséges alkalmazási területet.
Az írói képzelet szüleményei gyakran szolgálnak a mérnöki munkák kiindulópontjául. Pl. Verne korában elképzelhetetlennek tűnő – az akkori tudományos fantasztikus művekben felbukkanó – rendszerek a technológia fejlődésének köszönhetően napjainkban a mindennapos életünk szerves részévé váltak, mint például a telefon, televizó és a repülőgép. Természetesen ezek a rendszerek nem akkor és nem úgy jelentek meg, ahogy azt az írók megálmodták. Túl jutottunk 1984-en, de szerencsére a Nagy Testvér még nem figyel meg minket. Később, ahogy közeledtünk 2001-hez, Hideki Hashimoto professzort a Tokió Egyetemen egyre inkább az foglalkoztatta, hogy 2001-re megalkosson valami olyasmit, amelyet 2001. Űrodüsszeia című könyvben Arthur C. Clarke álmodott meg, nevezetesen a HAL nevű számítógéprendszert, amely képes az emberek mozgását és cselekedeteit kamerák segítségével követni, és az űrhajó eletronikus rendszereit vezérelni. Hashimoto professzor kutatásai nyomán az ’Intelligens tér’ kifejezés és az első ilyen megvalósított rendszer iSpace márkaneve 1996-ban robbant be a köztudatba [1,2]. Jelenleg ez az egyik legfontosabb kutatási területe az Intelligens Integrált Rendszerek Japán Magyar Közös Laboratóriumnak.
A kezdetekben az intelligens tér csupán két kamerából, számítógépből, és egy ‘házi’ készítésű feldolgozó szoftverből állt. A szofvert C-ben és tcl/tk nyelven íródott a mindenki által ingyenesen letölthető Real-Time Linux operációs rendszer környezetben. Később egy nagyméretű kivetítőt (254x192 cm) is csatoltak az Intelligens térhez, amelyen a rendszer immár válaszokat is adhatott. Ezek után a rendszer mobil robotokkal bővült, amelyek már ténylegesen az emberek segítségére lehettek. Kamerák száma tíz fölé növekedett (ld. 1. ábra). A kutatás az intelligens ember-gép rendszerekre fókuszál.
Napjainkban Japán szerte Hashimoto professzornak több tucat követője akadt. Ezek közül néhányat emelünk ki [3]. Elsőként kell megemlíteni az ugyan csak a Tokió Egyetemen berendezett Intelligens Robot Szobát, amely abban az értelemben több egy egyszerű robotokkal betelepített szobánál, hogy a padló, székek, a polcok és általában a bútorok stb. tele vannak érzékelőkkel (leginkább nyomásérzékelőkkel), így nyomon követhető, hogy a személy merre jár, hol ül le, mennyi ideig marad egy helyen, mikor melyik szekrényt nyitja ki, mit vesz ki onnan stb. Mindezekből a szoba megpróbálja megtanulni a szobában lakó személy viselkedési szokásait. Pl. ha este fáradtan megérkezik, akkor az első útja a bárpulthoz vagy a könyvespolchoz vezet-e.
Több egyetemen foglalkoznak kézmozdulatokkal vezérelt önjáró robotokkal [4], illetve villamos autókkal [5]. A tér folyamatosan figyeli az ember kezét, amely sokszor véletlenszerű, illetve más tevékenységgel kapcsolatos mozgásokat végez. A térnek először azt kell eldöntenie, hogy az adott mozgássor az intelligens térnek szóló parancs-e vagy egyéb tevékenység. Ehhez a térnek meg kell tanulnia bizonyos jellemzőket (kéz helyzete, a mozgás sebessége, stb.), amelyek alapján felismeri a neki szóló parancsokat. A Tokyo Metropolitan Institute of Technology egyetemen az intelligens térrel kiegészített parkolóban az ember kinézi, hogy hova szeretne parkolni, rá mutat egy üres parkolóhelyre, és az elektromos autó az intelligens tér segítségével automatikusan beáll a kijelölt helyre (a [6] japán nyelvű honlapról rövid videók letölthetők a kézmozdulatokkal vezérelt vezetőnélküli elektromos autóról).
Gifu közelében létrehoztak egy „Sweet Valley”-re átnevezett és így a „Silicon Valley”-re alliteráló helyen egy kutató intézetet. Gifu vezetése nem kisebb célt tűzött maga elé, mint hogy a túlnépesedett Tokióból áthelyezze az ország fővárosát az ország geometriai közepére, vagyis Gifuba. A japán gondolkodásmódra jellemzően ennek egy fontos lépéseként egy szellemi központot hoztak létre. E központ egyik büszkesége a COSMOS, a 3D virtuális szoba.
A névválasztást a következő angol kifejezés rövidítésével szokták magyarázni: COsmic Scale Multimedia Of Six-faces), de ez inkább szójáték. A COSMOS valójában egy 3mx3m-es szoba, amelynek mind a hat oldalára vetítővásznat lehet kihúzni, és azokon hat darab speciális kivetítő segítségével hat darab sztereóképet lehet megjeleníteni [7,8] (ld. 2. ábrát). A sztereókép a két szemünkkel látott két kép egyidejű megjelenítését jelenti, ha ezt szabad szemmel nézzük, akkor egy szellemképes vásznat látunk. Ezzel szemben, ha ezeket a sztereóképeket egy speciális szemüveggel nézzük, amelyik a két szemünk számára szétválasztja a két képet, akkor egy csodálatos 3D világ tárul elénk. Egyszerű sztereónézőket már sok évtizede készítenek, a COSMOS annyival több ezeknél, hogy a szemüvegen van egy pozícióérzékelő is. Ha elmozdítjuk a fejünket, akkor ezt a COSMOS érzékeli, és valós időben kiszámítja az új fejpozíciónak megfelelő sztereóképet, mind a hat irányban. Ha elérkezünk egy virtuális falhoz, akkor nyugodtan átléphetünk azon, és a COSMOS máris azt vetíti elénk, ami a falon belül látható. Ismeretes, hogy a grafikai számítások nagyon erőforrás igényesek, így a COSMOS működését is több nagyteljesítményű számítógép segíti.
Talán a fenti példákból érzékelhető, hogy a japán egyetemi kutatás szemléletében egy kicsit eltér az európaitól [9]. Úgy tartják, hogy az egyetemeknek 10-15 évvel a legfejlettebb technológiát képviselő ipar előtt kell járniuk, mert ha egy hallgató a jelen technológiai szintjét, a jelen iparában alkalmazható műszaki megoldásokat ismerné meg az egyetemen, akkor az iparba kikerülve azonnal visszahúzó erővé válna, ezzel szemben, ha olyan dogokat tanul meg, amelyek csak 10-15 év múlva válhatnak iparilag alkalmazhatóvá, akkor tudat alatt hosszú évekig az újdonságokat részesíti előnyben a döntéseiben és a fejlesztésekben. Mindannyian nosztalgiával szoktunk az egyetemi évekre gondolni, de ez az érzelmi kötődés kiterjed az első önállóan megoldott feladatokra, a feladat kapcsán elsajátított és sikerrel alkalmazott műszaki megoldásokra, matematikai eszközökre is. Az új műszaki megoldások alkalmazását sokszor csak az akadályozza, hogy először nehéz megbecsülni a fejlesztéshez szükséges időt. A szűkre szabott határidők miatt mindenki azt az utat részesíti előnyben, amelyet egyszer már végigjárt. A japán ipar nem csak az új munkaerőt, hanem az általa hozott új ismereteket is igényli, mindezt azzal is kifejezi, hogy anyagilag is értékeli a tudományos fokozatot. A posztgraduális képzésből kikerülő magasan képzett hallgatók többsége az iparban is talál tudományos felkészültséget igénylő feladatokat. Még egy szemléletbeli különbség, a Japán kormány az ezredfordulót megelőzően kialakult ázsiai válság hatására kétszeresére növelte az egyetemek és a kutatások központi támogatását, hogy pótolják a válság miatt kiesett ipari forrásokat, mivel a kormány a kutatókra komolyan számított, amikor a válságból kivezető utat kereste. Feltételezhetően ez a szemlélet is valamilyen mértékben hozzájárult ahhoz, amit japán csodának neveznek
Az intelligens tér kutatásának egy másik ágát az Óceán másik oldalán a „Mindenütt Jelenlévő Számítástechnika (Ubiquitous Computing)” névvel szokták illetni. [10], és ez a számítástechnika harmadik paradigmáját jelöli. Az első paradigma a kötegelt feldolgozás volt, amikor egy számítógépet sok ember használt lyukkártyákkal sorban állva. Aztán jött a személyi számítógépek kora, vagyis egy ember, egy gép. Most jutottunk el oda, amikor a számítástechnikai eszközök mindent behálóznak, mindenütt jelen vannak és egy emberre több számítástechnikai eszköz is jut, hisz ide tartoznak már a mobiltelefonok, PDA-ak, elektronikus naptárak stb. A Mindenütt Jelenlévő Számítástechnika segítségével lehet a teret intelligenssé tenni, de Mindenütt Jelenlévő Számítástechnika kutatások sokkal inkább magukra az eszközökre és az eszközök integrálhatóságára, vagyis az Intelligens Tér alapjául szolgáló technikai környezet megteremtésére, és nem annyira a teljes tér intelligenciájára irányulnak. Erre tipikus példa az MIT-n folyó „Intelligens Oxigén” Projekt
Az elnevezés onnan származik [11], hogy a számítástechnika úgy vesz körül minket, mint az oxigén, amelyet minden pillanatban ösztönösen és tudattalanul belélegzünk, és csak akkor veszünk tudomást a létezéséről, ha valamiért eltűnik. A számítástechnika is minden pillanatban jelen van a környezetünkben, de ahhoz hogy az oxigénhez hasonlóan tudomást se vegyünk róla, és csak ösztönösen használjuk, az ember-gép kapcsolatnak egyszerűnek és az ember számára természetesnek kell lenni. E kutatásnak a középpontjában a természetes emberi kommunikáció (beszéd, mozdulatok, gesztusok) megértése áll (ld. 3. ábra), hogy észre se vegyük, amikor egy géppel társalgunk, vagy amikor egy gép teljesíti kívánságainkat.
Az Intelligens Virtuális Iroda [12] azért készült, hogy modern technológiákkal segítse az emberek munkáját: így sokkal odaadóbban és hatékonyabban végezhetik mindennapos teendőiket. Ez azon a feltevésen alapul, hogy a hagyományos irodákban dolgozó emberek napjuk nagy részét kommunikációval töltik. Életük telefonok, faxok, e-mailek között zajlik. Manapság a kommunikációnak ez a módja bárhonnan elérhető, akár otthonról is. Ez a projekt az emberek munkáját hivatott segíteni – bárhonnan, bármikor – anélkül, hogy feladnánk a hagyományos otthon kényelmét. Ez különösen fontos lehet a fogyatékkal élők számára, mert egy virtuális irodában egyenrangú munkaerővé válhatnak. Az Intelligens Iroda az Egyesült Államok területén működik, oda bárki bejelentkezhet, és azon keresztül bonyolíthatja az ügyeit (faxokat, telefonokat, levelezéseit). Mód van videó konferencia lebonyolítására is, de természetesen időnként elengedhetetlen a személyes találkozó vagy személyes jelenlét az értekezleteken. Az ilyen eseményekre valóságos termet lehet igényelni a virtuális iroda fenntartójától, de az ilyen termekért nem kell folyamatosan fizetni, elegendő a tényleges megbeszélések idejére kibérelni.
Ada [13] egy szórakoztató rendszer, amely egyszerre több emberrel is kapcsolatba tud lépni fények és hangok segítségével. 5 hónap alatt 553,700 látogató találkozott vele a 2002-es Swiss Expon.
Ada felfogható egy mesterséges élőlénynek, aki játszik a látogatókkal. Audio-vizuális és egyéb érzékelőkkel tartja a kapcsolatot a külvilággal, például: nyomásérzékeny járólapokkal szerez tudomást arról, hogy hol és merre járnak nagyobb csoportok. Irányérzékelő mikrofonokkal határozza meg a hozzá beszélő látogatók helyztetét, térfigyelő kamerák segítségével felismer bizinyos mozdulatokat, gesztusokat. Válaszként egy kivetítőn valósidejű animációkat jelenít meg, amelyekbe élő képeket is belekever, a padló alatt színes fényeket villogtat, fénycsóvákkal pásztáz és mesterségesen előállított zenével szórakoztatja csodálóit. A hagyományos számítógépekkel ellentétben, amelyek szabály alapúak, az Ada egy neurális hálózat, amely megpróbálja utánozni az agyunk működését: tud tanulni és „megjósolhatatlan” lépéseket tud tenni. Az Ada reakciói mindig az aktuális lelkiállapotától függenek. A emberekhez vagy az állatokhoz hasonlóan az Ada a célirányos viselkedésével fejezi ki saját magát, amelyet a saját akarata vezérel. Ada-t úgy tervezték, hogy látogatói egy újszerű szintetikus lényként ismerjék meg. Találkozás az Ada-val egy kísérlet, amely ahhoz hasonlítható, mint amikor egy másik lénnyel találkozunk: ösztöneinktől vezérelve megpróbáljuk felfedezni a másikat, hogy önállóságot és biztonságot szerezzünk maguknak.
Az Intelligens terünket a Mindenütt Jelenlévő Számítástechnikára alapoztuk. A 4. ábra a számitástechnika harmadik paradigmájának megjelenését mutatja be a robottechnika területén. Korábban az egy robot-egy számítógép jegyében a roboton lévő saját intelligenciát próbálták növelni. A mindenütt jelenlévő számítástechnika korában a robot érzékelői és intelligenciája elosztható a térben. Ez, azzal a könnyen belátható előnnyel jár, hogy a robot olyan helyekről is információt kaphat, amelyek előtte takarásban vannak, illetve olyan eseményekről is értesülhet, amelyek tőle időben és térben távol történtek. De ez egy másik típusú problémát vet fel. Ugyanis sokkal nagyobb mennyiségű információt tudunk mikrofonokkal és kamerákkal begyűjteni, mint amennyit a leggyorsabb hálózaton keresztül továbbítani tudunk. E problémának a megoldása az, ha nem csak az érzékelőket osztjuk el a térben, hanem az intelligenciát és ezzel együtt az adatfeldolgozást.
Az intelligens tér koncepcióját az 5. ábra szemlélteti. Az intelligens tér egyik legfontosabb alkotóeleme a DIND (Distributed Intelligent Network Device, Elosztott Intelligenciájú Hálózati Eszköz). A DIND egységekhez érzékelők és beavatkozó eszközök csatlakoznak. Az érzékelőktől származó, sokszor redundáns (esetleg egymásnak ellentmondó) információkból lokális (DIND szintű) és az egész teret átfogó intelligens algoritmusokat felhasználva rekonstruáljuk a teret, vagyis egy olyan virtuális teret alkotunk, amely nem csak passzív elszenvedője a manipulációinknak, hanem az intelligens tér megpróbálja megérteni, hogy mi zajlik benne és esetleg a tér aktívan beavatkozok a térben lezajló eseményekbe. A különböző intelligens érzékelő DIND eszközök önállóan és egymással együttműködve alkotják a teljes tér intelligenciáját. Az Intelligens Térben mozgó minden intelligens egység intelligens érzékelőkkel rendelkezik. Ezeknek a mozgó intelligens egységeknek akkor is működniük kell, amikor a külső környezet megváltozik, ilyenkor a térben betöltött szerepüket önálló döntéssel meg kell változtatniuk. A mozgó egység mindig tudja a térben betöltött szerepét, és segíteni tudja a térben tartózkodó embert. Minden egyes mozgó egység egyidejűleg több csatornán keresztül kapja az érzékelők (kamerák, mikrofonok érzékelő kesztyűk) információit, továbbá a többi mozgó egység megerősítő információit is megkapja. Ezekből a sokszor redundáns (esetleg egymásnak ellentmondó) információkból a mozgó egységek egy virtuális tétként rekonstruálják az őket körülvevő teret. Ezen túlmenően a mozgó egységek a térben tartózkodó emberekkel is közlik az általuk rekonstruált virtuális teret. A kijelzés attól válik intelligensé, hogy alkalmazkodni tud az őt használó egyén kívánalmaihoz. Így az intelligens térben az emberek és a mozgó egységek együtt tudnak működni.
Az Intelligens Tér leggyengébb láncszeme az információs csatorna sebessége (sávszélessége). A jelenleg hozzáférhető leggyorsabb hálózatokon is az érzékelőkkel szerzett információ mennyiségnek csak egy töredéke vihető át, ezért nagyon fontos az információ lokális előfeldolgozása, illetve más megközelítésben az intelligencia elosztás a térben. Az egyes DIND egységek egy hierarchikus rendszerben kapcsolódnak egymáshoz, kialakítva az információ áramlás különböző szintjeit (lásd. 6. ábra). Minden DIND egységnek három alapfunkciója van: érzékelés, feldolgozás és kommunikáció más szintekkel A 6.b ábrán csak érzékeltetni akartuk a hierarchikus felépítést, részletesebb leírás a [1,2] irodalomban található. Napjainkban egyre többen foglalkoznak az épületen belüli lokalizációval. Kint a szabadban GPS segítségével a pozíció meghatározása megoldottnak tekinthető, de épületen belül ez még mindig komoly problémát jelenthet. A DIND elnevezés kifejezetten a Hashimoto laboratóriumhoz tartozik, de Japánban és szerte a világban sokan foglkoznak olyan egységek kifejlesztésével, amelyet DIND-nek tekinthetünk. Jelenleg fejlesztés alatt áll egy olyan egység, amely egy CMOS kamerából és három nagy teljesítményű digitális jelprocesszorból (DSP-ből) áll. Várhatóan néhány éven belül piacra kerülhet. A DIND kutatás egy másik ága az úgy nevezett middleware technológiához vezetett. Ennek lényege, hogy olyan szoftver felületetet kell kialakítani, amelyen keresztül a legkülönbözőbb egységek egymáshoz csatlakoztathatók legyenek egy grafikus interfészen keresz segítségével. Az egyes szoftver és hadver elemekket elegendő grafikusan összekötni, és a rendszer működésre képes (ld. 7. ábra). A kamera, pontosabban a kamerától származó videojel folyam összeköthető egy megjelenítő ablakkal, vagy egy élkereső ablakkal és csak ezt követően egy megjelenítő ablakkal. A különbség látható az ábrán. Egy másik példa a DIND-re a siketek kézjeleinek felismerése (ld. 8. ábra).. Ez az egység a teljes képi információ helyett csak az egyes ujj izületek elfordulási szögét, illetve a felismert betű jelét küldi tovább. A képen a kéz az U betű jelét mutatja. A baloldalon az eredeti videokép, a jobboldalon a kéz animált megjelenítése látható.
A virtuális 3D laboratórium kialakítása tudományos szempontból nem jelent kihívást, de segít abban, hogy az eredményeink látványosabban jelenjenek meg (Lásd 9. ábra). Ebbe a munkába könnyen bevonhatjuk a legfiatalabb hallgatókat is, így egyrészt az eredményeinket a hallgatók szélesebb köréhez tudjuk eljuttatni, másrészt segít a nagy teherbírású elszánt hallgatók kiválasztásában. A 3D laboratórium is Real-time Linux környezetben készült, ugyancsak ingyenesen letölthető Coin/Open Inventor valamint Open GL könyvtárak segítségével. Mindez talán bizonyítéka lehet annak, hogy bonyolult grafikai és valósidejű rendszereket is lehet nyitott forráskódú, ingyenes szoftverekre építeni. Természetesen a Real-time Linux operációs rendszernek meg vannak a maga korlátjai, de hazánkban messze nem terjedt el annyira, mint amennyire használható lenne.
Ez egy olyan önjáró robot, amelyre egy mozgatható (pan-tilt) kamerát, mikrofont, számítógép monitort és haptikus (erő, fizikai kontaktus) érzékelőt szereltünk fel ld. 10. ábra. A robotok vezérlésére és megjelenítésére az ún. „Plalyer” nyílt forráskódú, ugyancsak ingyen letölthető hálózati szoftver környezetet használtuk [14].
Az első lépésben az emberek körvonalát határozzuk meg és emeljük ki a háttérből [1,2] (lásd. 11. ábra). A második lépés a fej és a kéz helyének meghatározása (lásd. 12. ábra). Nagyon egyszerű, de kellően megbízható algoritmusok léteznek, amelyek segítségével fel lehet ismerni az emberi bőrszínt, és ennek segítségével a fej és a kéz helyzetét, amelyek általában nincsenek elfedve ruhadarabokkal. Ennek fontos szerepe lehet később bizonyos abnormális viselkedések felismerésében, pl. ha mindenkinek a keze a feje fölé emelkedik, vagy a földre kerül.
Sztereó kamera párokat alkalmazva az ember (pontosabban a fej) 3D pozíciója meghatározható (lásd. 13. ábra). Több kamera pár figyeli a teljes területet és ezek által belátható tartományok átfedik egymást.
Az intelligens tér figyeli és tárolja a sétáló ember mozgását (lásd. 14. ábra). Erre alapozva utasíthat egy robotot, hogy kövesse az embert úgy, mintha egy láthatatlan rugó lenne az ember és a robot között. Ha az ember hirtelen sietni kezd, akkor a robot kicsit lemarad, ha hirtelen leáll, akkor egy kicsit közelebb szalad a robot. A virtuális rugó rugalmasságát és csillapítását változtatni tudjuk.
Terjedelmi okok miatt csak az alapötlet ismertjük, részletek [8] irodalomban találhatók. A 15. ábra egy nagyon egyszerű példán keresztül szemlélteti, hogy miért lehet fontos a közlekedési szokások ismerete. Tegyük fel, hogy egy amerikai (ide írhatnánk magyart is) és egy japán ember rohan egymással szemben egy szűk folyosón. Az amerikaiban a jobboldali közlekedés miatt az van berögződve, hogy jobbra térjen ki, viszont tudjuk, hogy Japánban baloldali közlekedés van, és a japán ezért balra akar kitérni, így könnyen összeütközhetnek. Tegyük fel, hogy az előző eset egyik szereplője nem személy, hanem az Intelligens Tér által irányított robot. A 16. ábrán példaként két különböző közlekedési szokást mutatunk be. Az egyiket úgy jellemezhetjük, hogy minden akadálytól olyan távol, amennyire csak lehet. A másik egy rejtőzködő, az akadályok mögött megbúvó stílus. Hasonlóan definiálhatjuk a jobb, illetve baloldali közlekedési szokásokat. A különböző közlekedési szokások leírásának alapelvét a 17. ábrán mutatjuk be. A személy (robot) körül meghatározzuk az akadályokat. Ezek az akadályok taszítják (az akadály elkerülésére serkentik) vagy vonzzák (az akadály megközelítésére ösztönzik) a közlekedőt. A különböző irányok vonzó és taszító erőit összegezve határozhatjuk meg a tényleges haladási irányt. Ezek az erők a különböző irányokban különbözők lehetnek (pl. jobboldali közlekedésnél az út jobboldala vonz, a baloldal taszít), függenek az akadály távolságától, a személy (robot) sebességétől, az akadályok sűrűségétől, de még az egyén kedélyállapotától is, ezért a kognitív tudomány eredményeit is fel kívánjuk használni.
A legegyszerűbb esetben egy potenciál térrel is le lehet írni pl. egy „jobbra-hajts” közlekedési szabályt (ld. 18. ábra), de bonyolultabb esetben ez nem megfelelő, mert .pl. nem tartalmaz információt arra vonatkozólag, hogy egy akadályt miként lehet megkerülni. Ha az akadályok túl sűrűen vannak elhelyezkedve, akkor az ember sokkal közelebb megy az akadályokhoz. Pl. ha egy kisebb turistacsoport lazán áll valahol, akkor az ember az egész csoportot megkerüli, ezzel szemben, ha egy hatalmas tüntetés áll útjában, akkor kénytelen akár a testi kontaktust is vállalva átfurakodni magát a tömegen.
Ismeretes, a kamerák, számítástechnikai eszközök ára rohamosan csökken. Egyre több térfigyelő rendszert telepítenek és egyre több emberre lenne szükség, akik a képernyőt figyelve beavatkoznak, ha valamilyen szokatlan eseményt tapasztalnak, de szemben számítástechnikai eszközök árával, a biztonsági személyzet fizetése nem csökken, hanem inkább nő, ezért egyre nagyobb jelentősége lehet egy olyan intelligens térnek, amely bizonyos egyszerű kritériumok alapján meg tudja tanulni a térben zajló normális eseményeket, és azokat meg tudja különböztetni a szokatlantól. Egy könnyen érthető alkalmazási példa, egy bekamerázott bankfiók, ahol a felvett képeket feldolgozó szoftver felismeri, ha rendkívüli helyzet áll elő. Kérdés azonban, hogy milyen jelek alapján ismerhető fel a rendkívüli esemény? A bankrablás kétségkívül ilyen. A tenyerek fejmagasság fölé emelkednek („kezeket fel!”), vagy a fejek, kezek a padló szintjére kerülnek, ha a támadó az ügyfeleket, alkalmazottakat hasra fekteti (ld. 19. ábra). A képeken megjelenhetnek olyan személyek, akiknek az arca nem látható. Fel kell tehát ismerni a fejeket és a kezeket, ami a bőrszín alapján történhet meg. A digitalizált felvételeken meg kell keresni az emberi bőr színére jellemző kódokat. A következő lépés a helyzet meghatározása. Ugyanazt a fejet, kezet (pontosabban annak leképezését) meg kell keresni két különböző kamera képén. Ha tudjuk a kamerák helyzetét, akkor előbb-utóbb kiszámítható, meghatározható a személyek helyzete is. És rekonstruálhatóak a támadás fontos részletei. További szorosan vagy lazán kapcsolódó kutatási témákat találhatunk a [9] irodalomban.
Egy teljesen más jellegű alkalmazás lehet a vakvezető robot. Tokióban van egy pályaudvar, ahol több metró és vasúti vonal csatlakozik, és ahol naponta 2 millió ember fordul meg. Ez az állomás egy olyan többszintes föld alatti labirintus, ahol még a tősgyökeres japánok is gyakran eltévednek. A vakok számára az aluljáró a legnehezebb típusú terep, és a japánok eddig is nagyon sokat fordítotattak a vakok segítésére. Pl. a lépcsők korlátain brile írással tájékoztaják őket, hogy merre járnak, továbbá gyakorlatilag mindenütt az utcán és az aluljárókban bottal vagy cipőtalpon keresztül kitapintható sávokat helyeznek el, de ennél is nagyobb segítség lehet számukra egy vakvezető robot (ld. 20. ábra), amely egy ilyen labirintusban elkalauzolja őket, kiválasztja a legkevésbé zsúfolt utat. Ugyanez a robot sok ember életét mentheti meg, ha egy földrengés vagy tűz miatt pánikba esett embereket megfelelően tudja terelni. Ha a robotot az egész állomást behálózó intelligens tér informálni tudja az optimális menekülési utakról, akkor megakadályozhatja, hogy az emberek a vesztükbe rohanjanak.
Egy nagy kiterjedésű és összetett felügyeleti rendszer hatalmas területeket - városokat vagy akár egész országokat is lefedhet. Az érzékelők száma több ezerre vagy tízezerre is rúghat attól függően, hogy milyen jellegű információkra van szükségünk. Az általános intelligens felügyeleti rendszer fejlesztése kivitelezhető a ma hozzáférhető eszközökkel. A fenti általános felügyeleti rendszer egyik alkalmazása az intelligens-Épület, amely különböző intelligens -Szobák kombinációi egy egységes rendszerben (ld. 21. ábra). Az események (szokatlan viselkedésformák, behatolók jelenléte) érzékelhetők és a különböző forrásokból szerzett információ összegyűjthető. Például a rendszer egy birtokháborítót érzékel (és azonosít) a szobák egyikében. Ha az azonosított személy a későbbiekben egy másik szobába megy át, a mozgása a felügyeleti rendszer segítségével követhető az egész épületen belül. A megfigyelt területen - ezen információk alapján - a megfelelő lépések kezdeményezhetők. A kritikus események megjeleníthetők a grafikus kezelői felületen, az operátorok azonosíthatják az események forrását, illetve ők is közvetlenül beavatkozhatnak.
E cikket Orwell „1984” című könyvének említésével kezdtük és a záró mondatokkal is erre a műre kell utalnunk. Az intelligens tér olyan távlatot nyithat előttünk, amely sok tekintetben kényelmesebbé teheti az életünket, de egészen biztos, hogy azoknak, akik olvasták Orwell kiváló könyvét, a Nagy Testvér jut eszébe az intelligens tér hallatán. A szerző nagyon reméli, hogy létezik a fejlődésnek olyan iránya, amelyben az Intelligens Tér az embereket szolgálni, és nem megnyomorítani fogja.
Hivatkozások:
[1] http://dfs.iis.u-tokyo.ac.jp/Research/smc/index.html
[2] Peter Korondi, Hideki Hashimoto, ”INTELLIGENT SPACE, AS AN INTEGRATED INTELLIGENT SYSTEM”, Keynote paper of International Conference on Electrical Drives and Power Electronics, Proceedings pp. 24-31. 2003.
[3] http://www.ics.t.u-tokyo.ac.jp/ipa/ipa2001/publication/satomori/rr2.html
http://www.mech.chuou.ac.jp/made/index_e.htm
[5] http://www.fml.ec.tmit.ac.jp/
[6] Eri Sato, Toru Yamaguchi,”HUMAN TO ROBOTS COMMUNICATION USING ONTOLOGICAL NETWORK SYSTEM”, International Journal of Innovative Computing, Information and Control ICIC International c°2006 ISSN 1349-4198, Volume 2, Number 1, February 2006
http://www.stp.pref.gifu.jp/htmlstpc/cosmos.htm
[8] S. Mizik, P. Baranyi, P. Korondi, and M. Sugiyama „Virtual Training of Vector Function based Guiding Styles”, Transactions on AUTOMATIC CONTROL and COMPUTER SCIENCE, ISSN 1224/600X vol. 46(60) No.1 pp. 81-86. 2001.
[9] P. Korondi “Gondolatok a Tokió Egyetemen folyó mérnökképzésről”, I-II. Rész Electrotechnika, vol. 91. no. 5 pp.204-207, and no.6. pp.253-256. 1998.
[10] http://www.cc.gatech.edu/classes/cs6751_97_fall/projects/say-cheese/marcia/mfinal.html
[11] http://oxygen.lcs.mit.edu/Overview.html
[12] http://www.theintelligentoffice.com