A Neumann Társaság blogja az informatika, robotika legmenőbb témaköreiről – újszerű megközelítésben.

Kvantumugrás

Kvantumugrás

Humanoid robotok

2020. szeptember 30. - ferenck

Ha a valóságban talán nem, de mozivásznon majdnem mindenki látott már emberre hasonlító, két lábon járó humanoid robotot. A sci-fi filmek túlnyomó többségében ők a robotok, közülük is különösen a ma már bőszerű anyagokból készülő androidok úgy beszélnek, cselekednek, sőt, általában éreznek is, mint mi (mármint a tudományos-fantasztikumban).

A valóságban egyelőre messze járunk a filmekben látottaktól. A döbbenetes szenzorarzenállal felszerelt humanoidok mesterséges intelligenciája meg sem közelíti a Homo sapiensét, de csekélyebb értelmi képességű állatokét sem.

Mire jók akkor ezek a szerkezetek?

Fejlesztésüket gyakorlati célok mozgatják, például azért hasonlítanak ránk, mert ember által készített eszközökkel kell dolgozniuk, általunk kialakított környezetekkel és egyre inkább velünk kell valamilyen szintű interakciókat folytatniuk, például idősekre vigyáznak. A média- és a szórakoztatóiparban szerepelnek, az oktatásban segédkeznek, vagy az egészségügyben dolgoznak, mint ahogy a Covid-19 első hulláma alatt egy budai magánklinikán előszűrést és tájékoztató végzett Pepper

Egyértelmű, hogy ha a humanoidok „életében” ennyire fontosak az ember-gép kapcsolatok, akkor jobb, ha hasonlítanak ránk, mert könnyebben befogadjuk őket.   

Munkavégzés és kommunikáció mellett készülhetnek tudományos, kísérleti jelleggel is, többek között a két lábon történő helyváltoztatás, a mozgás vagy az emberre jellemző más tulajdonságok tanulmányozására.

humanoidd0.jpg

Általában van felsőtestük, két karjuk és lábuk. Egyesek csak ennyiből állnak, torzóként töltik be rendeltetésüket, például recepciós munkát. Majdnem mindig van fejük, bár ez sokszor csak űrhajós-sisakféle szerkezet. Az egyik leghíresebb humanoid, a Honda Asimója kifejezetten a Holdon járó asztronautákra emlékeztet.

Más robotokkal összehasonlítva, lábuk (már amelyiknek van) egyelőre nem annyira ügyes, mert ugyan jönnek-mennek, látványelemként, ha kell, futnak vagy táncolnak is, viszont néhány kivételtől, például a Boston Dynamics másodikgenerációs Atlasától (2016) eltekintve, túl lassan mozognak. A mentési műveleteknél, veszélyes környezetben, változatos terepeken bármikor bevethető Atlas lehet a mérföldkő, a vízválasztó.

Az emberi arc, a szemek és a száj, arckifejezések és -mozgások pontos utánzása, androidok építése a legnehezebb feladat. Ezen a területen hagyományosan Japánban, majd Dél-Koreában, de az utóbbi évtizedekben már az Egyesült Államokban is értek el kimagasló eredményeket.

Jelenleg a texasi eredetű, 2013 óta Hongkong-székhelyű Hanson Robotics műhelyében készülnek a legélethűbb emberutánzatok (Einstein, Philip K. Dick). 2016-os Sophia androidjuk világhírűvé vált, szerepelt a Cosmopolitan címlapján, randevúzott Will Smith-szel, rengeteg televíziós fellépése volt, megkapta a szaúdi állampolgárságot. Gondosan tervezett programok (beszédfelismerés, szájszinkronizálás, mozgáskoordináció) jóvoltából beszélget, énekel, sétál, táncol, játszik, figyeli és követi az arcokat, vicceket mesél stb.

humanoidd4.jpg

Hollywoodban színészként is gondolnak rájuk; az első, Erica 2021-ben debütált. Japán tudósok fejlesztése, és nem véletlenül – a korábban szinte csak ipari alkalmazásokban gondolkozó nyugati, elsősorban észak-amerikai világ ugyan felzárkózott, de a humanoid robotikában azért változatlanul a kelet-ázsiai szigetország a világelső.

 

Frissítve: 2023. július 26.

Mire jók a robotok?

Isaac Asimov regényeitől vagy a Csillagok háborújától kezdve, a kortárs sci-fi és cyber-fiction irodalomig, filmekig, rengeteg robotot láthattunk, olvashattunk róluk. Élőben is találkozhattunk velük, hiszen technológiai rendezvények közkedvelt szereplői, sőt, már kávézókban és éttermekben is dolgoznak, például felszolgálnak. 

De mik is ők?

Mivel a „robot” szó a mai tudományos és köznyelvben világhálón, virtuális terekben tevékenykedő szoftverektől kezdve egyszerűen programozható kezelőkészülékeken (például statikus gépkarokon) keresztül két lábon járó emberszerű szerkezetekig szinte mindenre használatos, célszerű pontosan definiálni azt, hogy mit értünk roboton. A legmodernebb álláspont szerint: a fizikai világban működő, környezetüket érzékelő, bizonyos, a szoftverszintű mesterséges intelligenciákkal összehasonlítva, általában kezdetleges intelligenciával rendelkező mobil ágenseket, amelyek önálló viselkedési algoritmusokat és döntési mechanizmusokat használnak. Emlékeztethetnek is az emberre (humanoidok), állatokra (négy- és többlábú szerkezetek), meg nem is (fűnyírók stb.).

A robotika gyökerei az ókori Hellászig és Alexandriáig nyúlnak vissza, a maiakat előlegező első kísérleteknek a XVIII. századi nyugat-európai automaták, például a francia Jacques de Vaucanson fuvolistája vagy gépkacsája és az akkori japán vallási fesztiválok „mechanikus emberei” tekinthetők.

robot.jpg

A csehül, szlovákul és lengyelül szolgamunkát, oroszul munkát jelentő rabotából eredő robot szót Karel Čapek bátyja, Josef Čapek találta ki 1921-ben, miután testvére megkérdezte, minek nevezze készülő drámájának (Rossum’s Universal Robots, RUR) főszereplőit. A sci-fi színművet több nyelvre lefordították, világszerte játszották, a nyugati és japán (technológiai) kultúrára egyaránt óriási hatást gyakorolt. Az RUR sikerét követően indult el a robotika második világháborúig tartó első nagy hulláma.

robot1.jpg

A modern fejlesztések az 1940-es évek második felében kezdődtek, az 1960-as évek elején pedig munkába álltak az amerikai ipari robotok. Az első digitálisan működő és programozható szerkezet, az 1954-es Unimate-et George Devol dolgozta ki.

A terület iparággá vált, a mai kereskedelmi és ipari robotok egy sor feladatot pontosabban és megbízhatóbban végeznek el, mint az ember. Túl veszélyes, koszos vagy monoton tevékenységekre szintén alkalmasabbak. Használatuk a gyártásban, futószalag mellett, csomagolásban, az űrkutatásban, a hadászatban, az egészségügyben is elterjedt, és a szórakoztató célú, otthoni robotok sem ritkák.

robot2.jpg

Az eddigi fejlesztések három generációban foglalhatók össze.

Az első generációsok kizárólag vezérléssel működtethetők, a számítógép programja adja meg mozgásuk útvonalát, határozza meg az elvégzendő tevékenységeket. A környezet változásait nem érzékelik.

A második generációsok környezetüket érzékelőkkel vizsgálják, az így szerzett és a saját működésükről nyert információk alapján a számítógép bármikor képes módosítani a robot mozgását, például kikerüli a váratlanul útjába került akadályokat. Feladataikat magas szintű programnyelven határozzák meg.

A jelenleg általában kutatási alkalmazásokban megtalálható harmadik generációnál egyértelmű a mesterséges intelligencia térhódítása: jól alkalmazkodnak a környezet változásaihoz, alakokat és helyzeteket ismernek fel, hanggal is vezérelhetők, amire képesek hanggal válaszolni, önálló döntéseket hoznak, bonyolult feladatokat oldanak meg, alkalom adtán maguktól módosítják a betáplált programot. Segítségükre vannak tanuló algoritmusaik; általuk hasznosítják korábbi tapasztalataikat.

 

Frissítve: 2025. július 4.

Gépi látás – képes-e egy komputer látni?

Számítógépek hatalmas tömegben képesek személyeket felismerni, megkülönböztetik az oroszlánt a tigristől, sörgyári futószalagon szűrik ki a hibás üvegeket, rosszindulatú daganatot azonosítanak, vagy művészi szintű képeket alkotnak, pontosabban alkotnak újra.

Napjainkban már az okostelefonokon is megtalálhatók mesterséges intelligenciával dolgozó alkalmazások, például a DALL-E, a Stable Diffusion vagy a Midjourney aktuális verziója. Használatuk mindennapos, korábbi képszerkesztő appoknál pedig még ennyire sem tűnik fel, hogy a képernyőzár feloldásakor MI serénykedik a háttérben. 

De mit tud, mitől különleges egy ilyen app, és miért fontos a mögötte álló technológia?

latas.jpg

A több tudományterülethez kapcsolódó számítógépes látás vagy gépi látás a jelenlegi mesterségesintelligencia-kutatás egyik referenciapontja. Biológiai mintát, fejlett élőlények, leginkább az ember képérzékelését és -feldolgozását, az egyik legbonyolultabb érzékszervi tevékenységet próbálja utánozni, majd igyekszik automatizálni az agyunkban lejátszódó folyamatokat.

Egy számítógépes látórendszer álló-, vagy mozgóképekből, képsorozatokból próbál információkat kivonatolni, megérteni és számszerűsíteni, és a későbbiekben hasznosítani. Az adatkinyerés a képfeldolgozás, az adatok kiértékelése a képelemzés. A rendszer minden egyes képpel tanul, bővíti és újabb feladatok elvégzésére használja ismereteit.

latas1.jpg

Az összes gépi látórendszer két szorosan összefüggő tulajdonsága, az érzékelő-készség és a felbontás alapján minősíthető: hogyan működik rossz fényviszonyok között, észlel-e alig látható részleteket, illetve mennyire képes például tárgyakat megkülönböztetni egymástól.

Míg az emberi szem a 390 és 770 nanométer közötti hullámhosszú fényt észleli, addig a gépi rendszerek digitális képszenzorai szélesebb tartományban működnek, a legfejlettebbek az infravörös, az ultraviola és a röntgensugarakat is tudják érzékelni. A mélységi, sztereóérzékeléshez nagyteljesítményű processzorral rendelkező számítógép, nagyfelbontású kamerák, sok memória, és természetesen mesterséges intelligencia szükséges. Ezeket a rendszereket rengeteg ipari, egészségügyi, katonai stb. alkalmazásra, többek között kézírás-, tárgy-, mintafelismerésre, anyag- és pénzvizsgálatra, elektromos alkatrészek vagy orvosi képek elemzésére használják.

latas2.jpg

Egyes rendszerek a hét minden napján, napi huszonnégy órában elemeznek képeket, kutakodnak utánuk a világhálón. Gigantikus szerkesztett képi adatbázisokká válnak, fogalmak vizuális modelljeit tartalmazzák, kapcsolatrendszerekkel, szöveg-kép párokkal. Élő és élettelen objektumokat, jeleneteket, cselekvéseket, történéseket, tulajdonságokat azonosítanak, címkéznek, katalogizálnak, és eközben megismerik a képi világ szerkezetét.

latas0.jpg

Mindenhol bevethetők, ahol kell gépi érzékelés: robotoknak tanítják meg, hogy ne csak nézzenek, hanem lássanak is. És persze bárkit és bármit meg is figyelhetnek.      

A címben feltett kérdésre válaszolva: igen, számítógépek tényleg képesek látni, de egyelőre még nem úgy, mint az ember.

 

Frissítve: 2025. július 3.

Közösségi hálózatok

 Facebookot mindenki használja, mégis szinte naponta mondja valaki, hogy most már nem, kész, vége, nem bocsátja többé adatait Mark Zuckerberg rendelkezésére, és egyébként is a boomerek terepe. Vagy egyszerűen ráun, és valami másra, például a Tik Tokra cseréli.

De honnan jöttek a közösségi hálózatok, miért alakulhattak ki ezek a gigászi internetes médiabirodalmak?

Az emberi természetből fakad, hogy szociálisan aktívak vagyunk, közösségre vágyunk. Így „programozták” a Homo sapienset, ez az „alapbeállításunk.” Ősidők óta mindig megpróbálunk kapcsolatot teremteni másokkal, hálózatokat kialakítani egymással.

A digitalizáció és az információs társadalom korában bővültek a lehetőségeink, nagyon könnyen megtaláljuk az online érintkezés módjait is, a fizikai valóság mellett az interneten aktív társadalmi életet élhetünk. A különféle közösségihálózat-platformok és alkalmazások döbbenetesen kitágították a lehetőségeket.

Ma már egy csomó kapcsolat születik, erősödik és hal el ezeken a hálózatokon; és még fizikai találkozás, kézfogás sem kell hozzájuk.

A Facebook, az Elon Musk által X-re átnevezett egykori Twitter, a LinkedIn, a WhatsApp, az Instagram, a TikTok és a többi a közösségimédia-honlapokon kapcsolnak össze barátokat, családokat, munkatársakat, fogyasztókat, ügyfeleket. Egyaránt lehet társadalmi és üzleti rendeltetésük, vagy akár egyszerre mindkettő.

sn0.jpg

Maga a közösségi média az információ, ötletek, üzleti tervek és az önkifejezés más formáinak létrehozását, virtuális közösségekkel való megosztását és az együttműködést segítő interaktív számítógépes technológiák összessége. A jelenállapot kialakulását egyrészt a 2000-es évek elején megjelent, azóta folyamatosan fejlődő web 2.0-ás technológiák, másrészt az okostelefonok 2000-es évek második felében indult térhódítása tették lehetővé.

Az első közösségi hálózatról megoszlanak, de abban egyeznek a vélemények, hogy web 2.0 és okostelefónia előtti időkig kell visszamennünk: egyesek az 1996-ban alapított Bolt.com-ot, mások az egy évvel később indult SixDegrees.com-ot tartják annak.

Ugyan már nagyon sok és különféle közösségi hálózatot ismerünk, több sarkalatos ponton mégis találunk közöttük átfedéseket:

  1. mindegyik internetalapú,
  2. a felhasználó által létrehozott tartalmak az éltetőerejük,
  3. a felhasználók az adott hálózatnak megfelelő profilt készítenek maguknak,
  4. a hálózati szolgáltatások a felhasználói profilokat más személyekkel és csoportokkal kötik össze, így alakulnak ki online közösségek.

Hogy állunk ma, melyik hálózatot használják a legtöbben? Az alábbi ábrán láthatjuk, hogy 2025. júniusban a Facebook, a YouTube, az Instagram, a WhatsApp és a TikTok volt az öt legnépszerűbb, mint ahogy azt is, hogy az ötből négy Meta-tulajdon.

screenshot_2025-07-03_at_18_56_57.jpg

 

 

Frissítve: 2025. július 3..  

Internet, ember nélkül – a dolgok internete

Egyre többet hallunk az intelligens otthonról, internetes kapcsolattal rendelkező jégszekrényekről, tapasztalunk meg rajtunk lévő „okos” tárgyakat. De miért is hasznosak ezek a technológiák? 

Szűkebb és tágabb környezetünk infokommunikációs képességekkel rendelkező tárgyai óriási hálózatokban kapcsolódnak össze. Hálózataik gigantikus rendszert alkotnak – ez a rendszer a dolgok internete (Internet-of-Things, közismert rövidített formában IoT).

iot.jpg

A világháló túlnőtt a számítógépeken, okostelefonokon, tableteken, mára szinte az összes tárgyba „beleköltözött.” A városi közlekedéstől a környezetvédelemig, az egészségügytől a háztartási berendezésekig és a mezőgazdasági alkalmazásokig, az élet minden területét behálózzák ezek az „okos tárgyak.”

Az IoT hálózat alkotóelemei, például az érzékelők (szenzorok) tőlünk, emberektől függetlenül végzik napi munkájukat: adatokat gyűjtenek, továbbítanak és egyre gyakrabban fel is dolgoznak. Beágyazott számítási lehetőségeik miatt minden egyes alkotóelem azonosítható, önálló IP-címe van (a hálózati azonosítás ezzel az internetprotokoll-címmel történik). A kapcsolódások nyolcvan százaléka három technológiához kötődik. wi-fi, Bluetooth, mobil megoldások (2G, 3G, 4G, 5G, LTE-M, NB-IoT). 

 Az állapotukról tájékoztatást adó, a környezettel interakciókat folytató parányi műszerek felderítik és mérik személyek helyváltoztatását, hőmérsékletet, fényviszonyokat stb. A hűtőszekrénytől, egészségi állapotunkat figyelő eszközöktől, állatokba ültetett chipektől kezdve az intelligens otthon vagy a parkoló kütyüiig a „buta” tárgyakat ők alakítják át adatokat létrehozó „dolgokká.”

iot0.jpg

Nélkülük nem fejlődhetnének ezek a tárgyak például lakásunkat automatizáló, életünket kényelmesebbé tevő információs hálózatokká. Ebben az ember nélküli hálózatban tényleg minden mindennel összefügg.

Az épülő-bővülő rendszer irdatlan mennyiségű egységből, több tízmilliárd szenzorból, közel 27 milliárd végpontból áll, és a növekedés mértéke hónapról hónapra egyre drasztikusabb. 2030-ra a globális piac 12,5 billió dollárosra bővül.

Az eredetileg a rádiófrekvenciás azonosítást (RFID) és az internetet közös nevezőre hozó IoT különféle technológiai folyamatokat, trendeket köt össze:

  1. elektronikus készülékek méretcsökkenését,
  2. a beágyazott rendszerek és az érzékelők elterjedését,
  3. vezeték nélküli kapcsolódást,
  4. folyamatosan növekvő adattárolási kapacitásokat,
  5. az elemek élettartamának bővülését.

És mindez mire jó nekünk? 

A dolgok internete könnyebbé teszi a hétköznapokat, a háztartásoknak energiát spórol, hatékonyabb vele a közlekedés, a hulladékkezelés stb. Szinte végtelen lehetőségek tárházát nyitja meg, a szenzorok folyamatos adatgyűjtése viszont komoly biztonsági problémákat is felvethet.

Speciális változata, az „üzleti dolgok internete” (Internet of Business Things, IoBT) a vállalati világ adatait összegyűjtve, folyamatok hatékonyságát növeli, átláthatóbbá tesz cégeket.

 

Frissítve: 2025. július 2.

Mire jó a kiterjesztett valóság?

Az utóbbi években megszokhattuk, hogy például az utcán sétálva, okostelefonunk kamerájával elég körülnéznünk, és a képernyőn egy sor hasznos adat jelenik meg az utunkba kerülő boltokról, éttermekről: mettől meddig tartanak nyitva, hol és milyen különlegességeket ehetünk, és így tovább.

Mii történt közben, készülékünk mitől ismeri ennyire az aktuális környezeted?

ar.jpg

A technológia neve kiterjesztett valóság (Augmented Reality, AR); lényege: valódi, fizikai környezetek számítógéppel létrehozott vagy átalakított hanggal, grafikával, videóval, GPS-adattal stb. kibővített közvetlen vagy közvetett élő látványaként írhatók le.

ar4.jpg

Kiindulópontja, hogy gépi látással, tárgyfelismeréssel és más fejlett, általában mesterségesintelligencia-alapú megoldásokkal az információ interaktívvá, digitálisan módosíthatóvá válik. Az AR ezekkel a kiegészítő infókkal, például valamilyen sportesemény közvetítésére montírozott eredménnyel gazdagítja az eredeti képet, mozgóképet, összességében a digitális világ elemeivel az érzékelésünket.

Virtuális tartalommal bővíti, „terjeszti ki” fizikai közegünket, de, ellentétben a „rokon” virtuális valósággal (VR), az AR felerősíti valóságérzékelésünket, míg a VR szimulált világgal helyettesíti az igazit.

Az AR nem szakít ki a valóságból, hanem hozzáad valamit, gazdagítja, hasznos információkat tudunk meg a környék kávéházairól, az áruház ruhaosztályának kínálatáról stb., és bónuszként a hirdetők is megkapják vele a környezetfüggő adatokat.

ar3.jpg

Paradox módon a kiterjesztett valóság mutatja meg, hogy a virtuális valóság óriási előnye egyben a hátránya is: egyetlen más médiumban sem összpontosítunk csupán a tartalomra, sehol nem szűnik meg teljesen a külvilág, csak a VR-ben. Annyira belemerülünk, hogy semmi mást nem csinálunk, nem csinálhatunk közben, nincs internetes böngészés, chat, közösségi hálózatok, csak a szimulált képzeletbeli közeg (bár már vannak kísérletek arra, hogy a felhasználó mégis kapcsolatban maradjon a külvilággal)..

A felhasználónak a digitális adalékokkal kevert valóság élményét nyújtó, az élményben elmerülést, de nem teljes alámerülést adó, sisakkal működő első AR-rendszert, az amerikai pilóták gyakorlását támogató Virtual Fixture-t a korai 1990-es években fejlesztették.

A technológia a 2000-es évek második felében robbant be a köztudatba, azóta az Adobe Flashtől, interaktív játékplatformokig, az oktatásig, az egészségügyig és az építőmunkásoknak helyszíni információkat megjelenítő sisakokon keresztül az első változatában megbukott Google szemüvegig (Google Lense) vagy a Microsoft HoloLens-éig egyre többen fejlesztenek izgalmas megoldásokat.

Az egészen széleskörű ismertséget és népszerűséget azonban egy játék, a Niantic 2016-os Pokemon Goja hozta el az AR-nek, amelyet azóta például  az Apple is használ az X utáni iPhone-okban.

Egyértelművé vált, hogy a napról napra változó kiterjesztett valóság a jelen és a közeljövő egyik meghatározó infokom technológiája.

 

Frissítve: 2025. július 2.

Virtuális valóság – mikor lesz fősodor?

A virtual reality, röviden VR a valósággal akár azonos, akár attól teljesen eltérő, több érzékszervre ható szimulált élmény. Főként a szemet és a fület célozza meg, és ugyan kezdetleges, kísérleti szinten, de léteznek már a tapintás, sőt, a szaglás és az ízlelés illúzióját keltő virtuálisvalóság-megoldások is.

Tulajdonképpen a VR elődjének tekinthetjük azokat a repülésszimulátorokat, amelyeket az amerikai légierő kezdett el fejleszteni a második világháború után. 1962-ben Mort Heilig mozigépész szabadalmaztatott egy Szenzoráma nevű szimulátort: sztereóhangzást, mechanikus rezgéseket, légáramlatot és illatokat egybegyúró készüléket.

1968-ban a számítógépes grafika egyik atyja, Ivan Sutherland megtervezte a világ első VR-sisakját, amelyet azonban ekkor még nem hívtak így. A virtuális valóság kifejezést mai értelmezésében a hetvenes években ötlötte ki a szakterület alapítója, Jaron Lanier (a réalité virtuelle-r először a francia és világszínház-forradalmár, Antonin Artaud használta az 1930-as években, de ő a színházat értette rajta). Lanier és a modern programozás egyik úttörője, Alan Kay adatkesztyűvel, fejre erősíthető monitorral kísérleteztek. A jövő telefonjának tekintették a VR-t, az életminőség javulását, a televízió leváltását várták tőle.

vr6.jpg

A nyolcvanas években kikísérletezett, az évtized végére és a következő elejére a köztudatba robbant VR a jövő csúcstechnológiájának tűnt akkoriban, a felhasználóbarátnak egyáltalán nem nevezhető, ormótlan sisakok és a sok technikai hiba azonban hátráltatták a fejlődést.

vr3.jpg

Először az 1990-es, majd a 2010-es évek közepén tűnt, de legalábbis prognosztizálták úgy, hogy a virtuális valóság széles körben elterjed, ám részsikerek ellenére sem történt meg a nagy áttörés, és 2025-ben sem szaladgálnak a jellegzetes sisakot viselő emberek az utcán.

A technológia ennek ellenére egyre népszerűbb, csak másként, más területeken (játékok mellett például az oktatásban), mint ahogy és ahol számítottak rá. Pár év alatt a manapság inkább headsetnek nevezett sisakválaszték is szépen bővült: a Facebook által felvásárolt Oculus termékei a legismertebbek, aztán jött az Apple 2023 júniusában bejelentett csúcsdarabja, a Vision Pro, ami a prognózisokkal ellentétben nem forgatta fel a piacot (túl drága)..

vr4.jpg

A mostani VR-rendszerek a sisak, ritkább esetben szemüveg kijelzőjén megjelenített élethű képsorozatokat létrehozva érik el, hogy fizikailag is a teremtett térben érezzük magunkat, el- és alámerüljünk benne (immerzió).  

A komputerek teljesítménye sokáig nem volt elegendő megfelelő minőségű képi világ létrehozására, a mai gépkapacitások, szoftverek, videokártyák és kivetítők viszont már kielégítik az elvárásokat. A 2000-es évek végére drámaian javult a felhasználói élmény, és a hatás sem maradt el: a katonai és orvosi alkalmazások mellett az ipariak és az üzletiek is szaporodnak. Átlagfogyasztói szinten viszont még sokáig várhatunk az áttörésre, bár az USA-ban már ma is többmillióan használják a virtuális valóságot.

vr8.jpg

 „A VR nagykorúvá érett” – jelentette be 2010-ben James Oliver amerikai kutató.

A várt mértékű elterjedést azonban hátráltatja a csúcsminőségű headsetek ára, ami szerencsére folyamatosan esik, bár 3500 dolláros kezdőárával, a Vision Pro ebből a szempontból is tipikus Apple-termék.

Alternatívaként, többen igyekeznek kiaknázni a VR, mobiltelefónia, játékok és 3D nyomtatás egyesítésében rejlő lehetőségeket, és próbálnak egyedibb és olcsóbb darabokat, headset helyett karcsúbb szemüvegeket fejleszteni. De a térhódításnak a VR előnye, a teljes elmerülés sem segít, mert annyira a képzeletbeli közegben vagyunk, hogy közben a fizikai valósággal minden kapcsolatunk megszakad.

 

Frissítve: 2025. július 1.

Tanulnak a gépek

A tanulás alapvető folyamat a valamilyen szintű értelemmel rendelkező biológiai lényeknél. A számítástudomány bebizonyította: nemcsak az emberek és az állatok, de gépek is képesek tanulni.

Ugyan másként, mint az élővilág erre alkalmas szereplői, tudásukat viszont akár mesterségesen intelligens programok is folyamatosan gyarapíthatják.

De hogyan? 

A számítástudomány egyik legfontosabb mai ága az „új mesterséges intelligenciának” is hívott gépi tanulás. Főként azért nevezik így, mert ma ez az MI legnépszerűbb, legismertebb területe.

A kifejezést Arthur Lee Samuel, az IBM kutatója találta ki 1959-ben. Samuel abból indult ki, hogy a nehezen vagy egyáltalán nem változtatható utasítások, parancsok helyett, egy program a természetből, főként az evolúciótól, és annak eddigi (tudtunk szerinti) koronájától, a Homo sapienstől ellesett modellekből okosodhat. 

gepi_tanulas0.jpg

Ezt emberi felügyelettel vagy felügyelet nélkül egyaránt megteheti, megerősítéses tanulásnál pedig maga a rendszer jutalmazza, vagy, ha kell, bünteti az algoritmus teljesítményét. A gép a megtanultak alapján alkalmazkodik a környezetéhez, nem követi el többször ugyanazokat a hibákat. Szűkebb értelemben információkat kivonatol adatokból, mintázatokat, szabályszerűségeket fedez fel bennük, és döntéseket is hoz. 

gepi_tanulas1.jpg

A terület a számítógépek és az internet széleskörű elterjedésével, valamint a statisztika térnyerésével, az 1990-es évektől egyre meghatározóbbá, a következő évtizedekben pedig megkerülhetetlenné vált.

Mivel a napjainkat jellemző óriási és folyamatos adatrobbanás, a big data korában elképesztő mennyiségű adat keletkezik, feldolgozásuk, információvá alakításuk egyre kifinomultabb, gépi tanulás és automatizálás nélkül elképzelhetetlen megoldásokat igényel. Komputeres segítség nélkül az ember már nem tudna megbirkózni a feladattal.  

A gépi tanulás típusai közül a mélytanulás (deep learning) a legismertebb. Lényege, hogy a nagymennyiségű gyakorlóadaton csiszolódó rendszer a kontextus függvényében, a korábbiaknál mélyebb tudásra szert téve, rétegről rétegre haladva a „mélybe”, ismer fel tárgyakat, állatokat stb., és tanul meg döntést hozni, például megállapítja, hogy az adott képen látható állat kutya és nem macska, vagy kikövetkezteti a következő szót egy szövegben.

Címkékkel lát el egyszerű képeket: például ha felcímkéz kellő számú (sok ezer vagy millió) olyan képet, amely lovat ábrázol, később nem csak felismerni lesz képes a lovakat, hanem meg is tudja különböztetni őket más állatoktól.

A mélytanuló algoritmusok programozás helyett következtetéssel, tapasztalataik alapján jönnek rá, hogy a ló nem azonos például a tehénnel. Egyre mélyebb szintekre ásó adatábrázolás kell hozzá: emlősökről, négylábú emlősökről, négylábú patás emlősökről van szó, és így tovább, végül kizárásos alapon, csak a ló marad.   

gepi_tanulas.jpgA gyakorlatban a gépi tanulás azért lehet sikeres, mert viszonylag egyszerű algoritmusok sok gyakorlás után is képesek komoly feladatokat végrehajtani. Például a rendszer kap egy adatbázist a páciensről és a cukorbetegségről, majd megfelelő mennyiségű tanulás után diagnosztizálja a bajt.

A technológia a hétköznapok részévé vált, az Amazon termékajánlója, a Netflix filmajánlóhoz, a Facebook és az X (az egykori Twitter) a felhasználónak megmutatásra kerülő bejegyzések kiválasztásához egyaránt gépi tanulást használ. Ezek az algoritmusok javasolnak könyveket, adnak tanácsot, hogy kivel randizzunk, és kivel ne, vagy éppen a meghirdetett állásra legalkalmasabb jelöltet is segítenek kiválasztani. 

 

Frissítve: 2025. július 1. 

Szingularitás – van a jövőnek határa?

A mindenhova beáramló, egyre többet tudó és egyre kisebb kütyük mögött a gyorsuló ütemű technológiai fejlődés áll. De elgondolkozunk-e azon, hogy a változás sebessége meddig tartható fenn, meddig növelhető, s hogy eljön-e az a pont, amikor a gépi értelem – mesterséges intelligencia, MI – túlszárnyalja teremtőjét, az embert?

A számítástudomány kezdetei óta sokakban felmerült a kérdés, hogy lehet-e okosabb a technika, mint az ember, s ha ez bekövetkezik, milyen lesz a világunk. 

Neumann János már az 1950-es évek elején prognosztizálta a technológiai fejlődésnek azt a határpontját, amit kb. harminc éve szingularitásnak neveznek. A különleges ponttól egy új valóság kezdődik.

Hogy az emberi intellektus fejlődésének egyenese és a robbanásszerű technológiai fejlődés találkozási pontja mikor következik be, erről megoszlanak a vélemények. Egyesek 2050-ben, mások csak a 22. században számítanak az eljövetelére. Sok szakértő szerint viszont soha nem valósul meg, a fogalmat fantáziálásnak tartják, mert a növekedés nem határtalan.

singularity_1.jpg

I. J. Good, angol statisztikus, Alan Turing korábbi munkatársa 1965-ben az ember utolsó találmányaként írta le a majdani ultraintelligens gépet, utána jön is rögtön az intelligencia-robbanás.

Vernor Vinge, sci-fi író és matematikus, egy 1993-as tanulmányban már nevén – szingularitásnak – nevezte a jelenséget, és a következőt prognosztizálta: „Harminc éven belül meglesznek a technológiai eszközeink az emberfeletti intelligencia létrehozásához. Nem sokkal ezt követően az emberiség kora véget ér.”

A prognózisok tehát azt állítják, hogy eljön az az idő, amikor az emberi fejlődés más dimenzióba lép át.

A szingularitás abszolút szaktekintélyének Ray Kurzweil feltaláló és jövőkutató számít. 2005-ös Közel a Szingularitás című könyvének (és a 2024-es frissített változatnak is) alaptézise, hogy évente megduplázódik a – főként teljesítményben és sávszélességben – mérhető gépi kapacitás, így huszonöt év alatt körülbelül milliárdszoros növekedés várható a kétezres évek elejéhez képest. Ezzel a tempóval az informatika és a kommunikáció minősége és hatékonysága mellett a ma még bonyolultabbnak látszó biológiai és az agy információ-feldolgozó folyamataira vonatkozó ismereteink szintén drasztikusan növekednek, és a növekedés hatásai felmérhetetlenek. Az ember túlléphet saját biológiai létén.

singularity2_1.jpg

Kurzweil másik fontos hipotézise, hogy az információtechnológia nemcsak gépek és szoftverek együttese, hanem életünk egészét átalakító jelenség.

Ennek két legfőbb aspektusát emeli ki:

  • a számítógépes hardver és szoftver képes lesz az emberi intelligenciát utánozni,
  • illetve, hogy a természetes és a mesterséges intelligencia egymással kölcsönhatásban fejlődik. A Homo sapiens gépi intelligenciát teremt, amelynek fejlődése visszahat az emberre, az emberi fejlődés pedig az MI-re, és így tovább. Kurzweil szingularitás-huroknak (Singularity Loop) nevezi ezt a visszacsatolás-alapú spirális fejlődési ívet.

singularity3_1.jpg

Az embert „másoló” számítógépek fejlődése ugyanis nem-biológiai intelligenciát eredményez (amelynek kezdetleges, de egyre hatékonyabb formáit már jó ideje használjuk, és amelyek 2022-ben „berobbantak” a köztudatba). A két intelligenciatípus között az egyik legfontosabb különbség, hogy a humán gyakorlatilag állandó, a gépeké viszont folyamatosan növekszik. Ezért jön különös, a mai ítéletalkotásunktól teljesen eltérő világ a szingularitás után. Azokat az időket azért is nehéz előrejelezni, mert a mesterséges és a természetes intelligencia összenövése drasztikusan átalakítja majd a civilizációt, mivel a nem-biológiai formák is biológiai tervek szerint készülnek majd. Ugyanakkor maga a biológia is megkérdőjeleződik – mi számít biológiainak, és mi nem?

 

Frissítve: 2025. június 30.

Kvantumugrás

Képzeld el a jövőt! Hol leszel tíz év múlva? Mivel fogsz foglalkozni, kikkel és hogy töltöd a szabadidőd?

Biztosan van egy optimista forgatókönyved – és ebben biztosan van informatika, robotok, fejlődés…

És biztosan van egy pesszimista forgatókönyved – klímaváltozás, globális problémák – de a problémákra a válaszok megadásában segíthet az IT.

Tegyünk egy cool túrát az informatikai kultúrába! Aki az új évezredben született, beleszületett az IT-be, tudja, hogy mi a pálya: számodra egy szuper hivatás lehet, jobbnál jobb állásokkal, kihívásokkal – a világ számára pedig eszközök, módszerek sokasága.

kvantum_ugras1.jpg

Robotok, önvezető autók, mesterséges intelligencia, kiborgok, virtuális valóság, kvantumszámítógépek. Nézzünk a közhelyek mögé – milyen távlatokat rejtenek az IT legmenőbb témakörei?

Kvantumugrásra készülünk, ez mennyiségi és minőségi ugrás: hétről hétre reflektorfénybe állítunk egy-egy témát, megnézzük, az miért érdekes, miért lesz kikerülhetetlen a jövőben – vagy már most is az.

Kicsit rugaszkodjunk el a szokásos nézőponttól, lássuk a jövőt!

Kik vagyunk?

A blogot a Neumann Társaság készíti, Magyarország legrégebbi informatikai szervezete. Találkozhattál már velünk, ha informatikai versenyeken veszel részt (eHód, OKTV, Logo, Nemes Tihamér, Neumann versenyek, számos robotika verseny, informatikai diákolimpiai felkészítés) vagy ha ECDL-képzéssel fejleszted digitális kompetenciáidat.

Ki a blog szerkesztője?

Kömlődi Ferenc jövőkutató, író, képzőművész és világutazó. Foglalkozott cyberkultúrával és elektronikus tánczenével, volt az első magyar mesterségesintelligencia-portál szerkesztője, rendszeresen ír a transzhumanizmusról, a 3D-nyomtatásról, szuperfarmokról, ember-gép kapcsolatról.

süti beállítások módosítása