Fedezd fel a világot a Google Lens segítségével
Unokabátyám a feleségével új hobbit talált magának a pandémia idején. Az Országos Kéktúra megszállottjai lettek. Azóta szinte minden hétvégén bakancsot húznak, és már kora hajnalban útnak indulnak az előre kiválasztott szakaszon, hogy végül teljesíthessék a legnépszerűbb hazai túramozgalom mintegy 1170 kilométeres távolságát. Kirándulásaikról rendszeresen posztolnak a közösségi médiában, megemlítve, hány kilométert tettek meg, mennyire volt nehéz az útvonal, milyen természeti és épített látnivalók mellett haladtak el aznap. Izgalmas képeken örökítik meg a legszebb természeti jelenségeket, és szinte minden beszámolóban akad néhány fotó a tájegység különleges virágairól és más növényekről. Egyikük sem botanikus, még hobbikertésznek sem mondanám őket, és nem pakolnak a hátizsákba a kulacs és a szendvicsek mellé kis növényhatározót, mégis olyan virágokat ismernek fel játszi könnyedséggel, mint az indás ínfű, a szívlevelű tündérvirág vagy éppen a tavaszi hérics. Mintha a téma elismert szakértői lennének. Vajon hogyan képesek a Csóványos többórás csúcstámadása után még azzal is foglalkozni, hogy milyen virágot láttak a negyedik kilométer megtétele után a sáros ösvényen? A megoldást jelen esetben egy népszerű telefonos alkalmazás, a Google Lens szolgáltatja. A techóriás még 2017-ben mutatta be Google Pixel telefonok kameráit „felokosító” fejlesztését, ami
a mesterséges intelligenciát ötvözi a gépi tanulással és látással.
Az idővel már az App Store-ból és a Play áruházból egyaránt letölthető alkalmazás okoseszközeinket intelligens, vizuális asszisztensekké alakítja át. A képalapú keresés nem a Google innovációja volt, a terület úttörőjének a szintén ingyenes TinEye alkalmazást tartják.
Mindent felismer
A Google Lens rendkívül egyszerű elven működik. Ha valamire ráirányítjuk a telefon kameráit, az alkalmazás pillanatok alatt azonosítja és meg is mondja, hogy mit látunk. Az eredmények kifejezetten pontosak, és több választási lehetőséget is megjelenítenek, amennyiben rendelkezésre állnak. A Lens összehasonlítja az adott fotón látható tárgyakat a más képeken láthatókkal, majd a talált képeket az eredetire vonatkozó hasonlóság és relevancia alapján rangsorolja. Természetesen a képelemző technológiát használó applikációval nem csak klasszikus növényeket vagy állatokat tudunk felismerni; helyek azonosítására, különböző tárgyak detektálására is alkalmas.
Ha térképmódba váltunk, a lefotózott tárgyhoz, épülethez vagy egyéb jelenséghez hasonlókat keres a Google pontos helymeghatározással. És még ennél is többre képes! Ha a kamera lencséit egy étterem vagy egy bár előtt állva a bejáratra irányítjuk, a képernyőnkön nemcsak a séf aktuális ajánlatát, hanem a koktélokról írt kommenteket és véleményeket is elolvashatjuk. Abban is segít, ha nem tudjuk eldönteni, megvegyünk-e egy könyvet a boltban. Telefonunk a borító alapján ugyanis hozzáférést biztosít az író és a kötet értékeléseihez.
A Google Lens azonosítani tudja az épületeket, például megjelenítheti a nyitvatartási időt, és még rövid leírást is adhat a felhasználóknak. Arra is képes, hogy érdekes információkat nyújtson egy kamera elé kerülő, több száz évvel ezelőtt készült műalkotásról. A Google egy fotón szereplő arc alapján azonosíthat személyeket is. Feltéve, hogy elég híres az illető. Sztársportolók, hollywoodi színészek és a legfontosabb országok vezetői esetében jó eséllyel helyes válaszokat kaphatunk egyetlen kép alapján is. Bár a Lens arcfelismerő kapacitása folyamatosan bővül, a szomszéd néni portréjának feltöltésekor azért még ne számítsunk sikerre…
Az alkalmazás felhasználási lehetőségei közé tartozik – bármilyen furcsán hangzik elsőre – az egyszerűsített wificsatlakozás is. Ehhez csupán arra van szükségünk, hogy képet készítsünk a beltéri egységen található SSID-matricáról, melynek feldolgozásával a telefon automatikusan csatlakozik a hálózathoz anélkül, hogy háromszori elütés után nagy nehezen sikeresen be tudnánk pötyögni a tizennyolc kis- és nagybetűből, illetve arab számokból álló kódot. Szállodai szobákban az intelligens szövegkijelölés funkció segít, mert felismeri a nyomtatott szöveget, majd digitális szöveggé alakítja. A telefon kameráját a szövegre irányítva ki tudunk emelni egy szövegrészt, amit be tudunk illeszteni például a wifi bejelentkezési képernyőjére. Létezik egy „másolás számítógépre” lehetőség is, ha számítógépen a Google Chrome böngészőjét használjuk, és ugyanabba a Google-fiókba vagyunk bejelentkezve, mint a telefonunk, akkor a szöveget közvetlenül a gépünkre is elküldhetjük.
A digitális tanár
A Google fejlesztése nagy hatással lehet az oktatásra is. A Lens képes beolvasni a kézzel írt szöveget, és digitálisan szerkeszthetővé alakítja. Nem meglepő módon a kézírás minősége erősen befolyásolja az eredményt, de egy olvasható íráskép mellett akár néhány pillanat alatt el tudjuk juttatni a saját eszközeinkre a jegyzeteinket. A fejlesztés audiovizuális élményekkel is szolgál: egy könyvoldal beolvasása után a „hallgatás” funkcióra kattintva a telefonunk hangosan, meglepően természetes hangon olvassa fel a szöveget vagy éppen a kézzel írt mondatainkat. Nem kell kétségbe esnünk akkor sem, ha gyermekünk házi feladatát kell ellenőriznünk. Ha elakadtunk a kétismeretlenes matematikai egyenlet harmadik lépésénél, netán nem tudjuk, miért robbant ki a harmincéves háború, akkor csak koppintsunk a „házi feladat súgója” szűrőre, és ezután készítsünk képet a feladatról. A Lens megmutatja azokat a lépéseket, amelyek segítenek a kérdéses egyenlet levezetésében, és elárulja azt is, hogy a sokak szerint vallásháborúként definiált pusztítás valójában a Német-római Birodalmon belül a megerősödésre törekvő császári hatalom és az abszolutizmussal szembeszálló választófejedelmek között húzódó ellentétekre vezethető vissza. A házi feladatok súgója funkció azt is lehetővé teszi, hogy több nyelven válaszoljon a kérdésekre, és beállíthatjuk a keresési eredmények kívánt nyelvét.
A Google Lens más élethelyzetekben is segíthet áthidalni a nyelvi akadályokat.
A „fordítás” szűrőjével több mint száz nyelv válik elérhetővé. Így a külföldi utazások során nem okoz többé kínos pillanatokat egy ismeretlen nyelvű étlap vagy egy kiállítási darabra kihelyezett leírás. Az alkalmazás automatikusan felismeri az írott nyelvet, és közvetlenül megjeleníti a fordítást a telefon képernyőjén.
Ha fényképet készítünk egy e-mail-címről vagy telefonszámról, például szórólapról, aláírásról vagy névjegykártyáról, beolvashatjuk telefonszámok és e-mail-címek kinyeréséhez. Ehhez csak a galériába kell lépni, és kiválasztani az adott fotót, majd a „lencse” és a „szöveg” lehetőséget. A telefonszámra koppintva akár hívást is kezdeményezhetünk, vagy akár új telefonos névjegyet is létrehozhatunk.
Hogyan szórjuk könnyen a pénzünket?
A Google fejlesztése átalakítja a vásárlási szokásainkat is. Feltehetőleg még nem készültek publikus kutatások arról, mennyire ugrott meg az impulzusvásárlásaink száma, de talán jobb nem szembesülni az eredményekkel. Egy biztos, ha a telefonon böngészve megakad a szemünk egy izgalmas, vonzó terméken, a Lens segítségével megkereshetjük az online webshopokban – és azonnal meg is vásárolhatjuk. Ehhez csak egy képernyőfotót kell készítenünk, mire az applikáció feldobja a megvásárolható termékek listáját, árakkal és kattintható linkekkel. Ugyanígy működik a valódi boltokban is, ha látunk valamit, amit meg szeretnénk venni. A fotó elkészítése után megkapjuk az online kereskedők ajánlatait. A „hasonló képek keresésével” meglévő fényképei segítségével kereshetünk új információkat. A Lens referenciaként tekint a termékre, és ahhoz hasonló stílusú és megjelenésű darabokról dob fel alternatívákat. Így könnyen találhatunk a kedvenc cipőnkhöz hasonló, mégis más márkanév alatt futó, akár olcsóbb változatot. A többkeresős funkció ennél összetettebb kutatásokra is lehetőséget biztosít. Amennyiben azt szeretnénk, hogy például a táskánk pillangós mintája visszaköszönjön a ruhánkon is, készítsünk fotót a táskáról, csúsztassunk felfelé az ujjunkkal, majd írjuk be a ruha kifejezést, és máris válogathatunk lepkés darabok között. A funkció használatával a telefon vonalkódokat is képes beolvasni, így megtudjuk az adott termék nevét és főbb jellemző adatait. A „vásárlás” elem kiválasztásával a keresés alternatív árucikket is javasol, ha az eredetileg kiválasztott nem elérhető az áruházban.
A Multisearch a közelben lévő dolgok, például a helyi éttermek ételeinek keresésére is szolgál. Tegyük fel, hogy egy városnéző hétvége során megkívántunk egy négysajtos pizzát, de nem tudjuk, hol van a közelben egy olasz étterem. Csak húzzuk a pizza fotóját a Lensben, és adjuk hozzá a „közelemben” kifejezést a kereséshez; a fejlesztés akár az értékelésekkel együtt listázza a közeli éttermeket, ahol az étlapon szerepel a kiválasztott fogás.
Az applikáció alkalmas arra is, hogy felkutassuk egy kép eredetét.
Ez akkor lehet igazán hasznos, ha engedélyt szeretnénk kérni a tulajdonostól a felvétel használatára. Vagy tisztában szeretnénk lenni azzal, hogy az általunk készített és publikált fotókat hol használták még fel az interneten. A Lens azt is megmutatja, hogy a doméncímedhez kapcsolódóan mely képeket ismeri (indexelte) a Google. Emellett vizsgálja a fotókhoz rendelt metaadatokat (alternatív szövegek, fájlnevek, leírások és képaláírások), elemzi a képfájl méretét, felbontását is.
Bőrbetegségek azonosítása
A Google idén egyelőre még csak az Egyesült Államokban vezette be egyik legérdekesebb funkcióját, amivel bemerészkedik az egészségügyi szolgáltatások világába. Az applikáció képes különböző bőrbetegségek azonosítására is. Nemcsak a karok, lábak, arc, hanem más testrészek esetében is működik az alkalmazás, legyen az akár egy dudor az ajkakon, hajhullás vagy egy folt, vonal a körmön. A techóriás az új funkció leírásánál reményét fejezte ki, hogy elég információt tud majd nyújtani felhasználóinak ahhoz, hogy felismerjék, nem halogatható a szakorvos felkeresése. A hozzáértők kritikusan fogadták ezt a funkciót. Érvelésük szerint a bőrbetegségek azonosításánál az ilyen szoftverek kevésbé pontosak a sötétebb bőrtónusú felhasználók esetében. Egy korábbi kutatás megállapította, hogy a mesterséges intelligencia rendszerek képzésére használt számos, szabadon elérhető képadatbázisból hiányoznak a bőrtípus-kategóriákra vonatkozó adatok és a sötét bőrű személyekről készült képek.
2017-es bevezetése óta a Google Lens népszerűsége folyamatosan nő, és ezzel párhuzamosan szolgáltatásai is egyre profibbak lettek. Tavaly ősszel tette meg az eddigi legnagyobb előrelépést a szoftver, hiszen már a mindenki által használt Google Keresőben is ez a rendszer biztosítja a hátteret az általános képkeresések esetében. Rajan Patel, a Google egyik alelnöke ezzel kapcsolatban arra hívta fel a figyelmet, hogy nem gyakran változik a Google főoldala, de ha mégis, az hatalmas dolog. A Google Lens megannyi hasznos funkcióval könnyíti meg mindennapjainkat, ugyanakkor érdemes tisztában lenni azzal is, hogy a praktikus extrákért cserébe rengeteg adattal – a kiválasztott termékekkel, az elkészített fotókkal és a felismert szövegekkel – folyamatosan bővítjük a keresőóriás rendszerét, a rendszer pedig, felhasználva azokat, még tovább fejleszti magát. A Google naplózza azt is, ki, hol és mikor vette igénybe a szolgáltatását. Mindezek ellenére erre a helyzetre nyugodt szívvel mondhatjuk, hogy win-win. Azzal ugyanis tisztában kell lennünk, hogy minden IT-óriáscég ingyenes szolgáltatását használva saját adatainkkal fizetünk.•
Címlapkép forrása: Shutterstock.com/Flystock