A Google I/O 2026 bemutatta a Gemini Spark-ot, az Android XR szemüveget és az MI-ügynökök új korszakát

Google I/O 2026: a Gemini ügynökké válik

A Google éves fejlesztői konferenciáját tegnap tartották Mountain View-ban, és egyetlen téma uralta: olyan MI-ügynökök, amelyek nem csupán válaszolnak a kérdésekre, hanem cselekednek. A keynote sztárja a Gemini Spark volt, amelyet a Google „0-24 MI-ügynöknek" és személyes digitális partnernek nevez — képes a felhasználó nevében eligazodni a digitális világban.

A Spark mellett a Google bemutatta a Gemini 3.5 Flash-t, amely immár általánosan elérhető: kódolásban, ügynöki feladatokban és multimodális benchmark-okban is felülmúlja az előző 3.1 Pro-t, miközben 4x gyorsabb a hasonló frontier modelleknél. Az árazás 1,50/9 dollár egymillió input/output token-re, 1 millió token-es kontextusablakkal. Az erősebb Gemini 3.5 Pro jelenleg tesztelés alatt áll, és jövő hónapra várható.

Szintén debütált a Gemini Omni, egy új modellcsalád, amely képet, hangot, videót és szöveget fogad, és valós tudásra alapozott videót képes generálni — egyértelmű lépés az igazán multimodális MI-alapú alkotóeszközök felé.

A hardverfronton a Google bejelentette az első Android XR okosszemüveget, amely ősszel érkezik a Samsung, Qualcomm, Gentle Monster és Warby Parker együttműködésében. A szemüveg a Gemini MI-t közvetlenül a látómezőbe helyezi: valós idejű navigáció, fordítás és tárgyfelismerés — és figyelemre méltó módon iPhone-nal is párosítható. A Google emellett bemutatta a Googlebook-ot, egy új prémium hardvercsaládot, amelynek magja a Gemini.

Az új AI Ultra előfizetési szint havi 100 dollárért fejlesztőket és haladó felhasználókat céloz, hozzáférést biztosítva a legújabb Gemini modellekhez, beleértve a Spark-ot is.

Források: Tom's Guide, 9to5Google, Android Central

Négy kínai labor, 12 nap, egy üzenet: itt a nyílt súlyú árháború

Figyelemre méltó erődemonstrációként négy kínai MI-labor 12 napon belül adott ki nyílt súlyú kódoló modelleket április végén és május elején: a Z.ai GLM-5.1, a MiniMax M2.7, a Moonshot Kimi K2.6 és a DeepSeek V4 (Pro és Flash változatban).

Ezek a modellek nem pusztán olcsó alternatívák — valóban versenyképesek. A Kimi K2.6 87-es pontot ért el a kódolási benchmark-okon, natív 300 ügynökös swarm-támogatással, míg a DeepSeek V4 Pro 89-re jutott (egyedi DeepClaude harness-szel) és 1 millió token-es kontextusablakot kínál. Mind a négy modell következtetési költsége kevesebb mint harmada a nyugati frontier modellekének, mint amilyen a Claude Opus.

A következmények jelentősek: a DeepSeek V4 Pro május 31-ig 75%-os promóciós kedvezményt kínál, és az árverseny az iparág várakozásainál jóval gyorsabban élesedik. Az ügynöki alkalmazásokat fejlesztő programozók számára, akiknek nagy volumenű következtetésre van szükségük, a gazdasági egyenlet rohamosan átrendeződik.

Források: Abhishek Gautam, Artificial Analysis, CoderSera

A Claude Mythos Preview átment a mérföldkő-jelentőségű kiberbiztonsági teszten — és zár alatt marad

Az Anthropic április 7-én bejelentett Claude Mythos Preview modellje az első MI, amely sikeresen teljesítette az Egyesült Királyság MI Biztonsági Intézetének „The Last Ones" (TLO) értékelését — egy 32 lépéses vállalati hálózati támadásszimulációt, amelynek elvégzése emberi szakértőknek jellemzően 20 órába telik. A Mythos a teljes támadási láncot — felderítéstől a teljes domain-átvételig — a tíz kísérletből háromszor oldotta meg, átlagosan 22 lépést teljesítve a 32-ből.

Ami még megdöbbentőbb: a Mythos önállóan felfedezte és kihasználta a CVE-2026-4747 jelű, 17 éves távoli kódfuttatási sebezhetőséget a FreeBSD NFS-implementációjában — ez egy MI-rendszer által talált valódi zero-day.

Az Anthropic nem hozta nyilvánosságra a Mythos Preview-t a kiberbiztonsági kockázatokra hivatkozva. Ehelyett elindította a Project Glasswing-et, egy iparági konzorciumot az alapvető rendszerek sebezhetőségeinek feltárására és javítására, és felügyelt hozzáférést biztosított több mint 40, kritikus szoftvereket karbantartó szervezetnek.

A Mythos-ügy közvetlenül felgyorsította a szakpolitikai lépéseket: katalizátorként hivatkoztak rá az USA új, piaci bevezetés előtti MI-tesztelési megállapodásainál (lásd alább).

Források: Anthropic Red Team, UK AISI, Bishop Fox

Az USA kormánya kieszközölte a piaci bevezetés előtti MI-tesztelést a Microsoft-tól, a Google-tól és az xAI-tól

A National Institute of Standards and Technology (NIST) bejelentette, hogy a Microsoft, a Google és az xAI vállalta: korai hozzáférést biztosít kiadás előtti MI-modelljeikhez a kormányzati biztonsági értékeléshez — csatlakozva az OpenAI-hoz és az Anthropic-hoz, amelyek 2024-ben írtak alá hasonló megállapodást.

Az egyezmények lehetővé teszik a NIST Kereskedelmi Minisztériumon belüli MI Szabványügyi és Innovációs Központja számára, hogy az új modelleket nemzetbiztonsági és közbiztonsági kockázatok szempontjából értékelje, mielőtt azok a nyilvánossághoz kerülnének. A központ eddig már több mint 40 MI-modellt vizsgált meg.

A lépést széles körben a Claude Mythos Preview képességeire adott közvetlen válaszként értékelték, amely a MI offenzív kiberpotenciáljával kapcsolatos aggodalmakat fordulóponthoz juttatta. Bár nem formális szabályozási előírásról van szó, az önkéntes megállapodások azt jelzik, hogy egyre szélesebb az egyetértés: a frontier MI-modelleknek független felülvizsgálaton kell átesniük, mielőtt deploy-olják őket.

Források: CNN, Washington Post, CNBC

Az AWS saját pénztárcát ad az MI-ügynököknek az AgentCore Payments-szel

Az Amazon Web Services elindította az Amazon Bedrock AgentCore Payments előzetesét a Coinbase és a Stripe közreműködésével. A rendszer lehetővé teszi, hogy az MI-ügynökök önállóan hajtsanak végre stablecoin-alapú mikrofizetéseket feladatvégzés közben — API-hozzáférést, adatfolyamokat és fizetős tartalmakat vásárolva a felhasználó nevében.

A tranzakciók nagyjából 200 milliszekundum alatt záródnak USDC-ben, az Ethereum Base layer-2 hálózatán és a Solana-n. A fejlesztők választhatnak Coinbase pénztárca vagy Stripe Privy pénztárca között, a végfelhasználók pedig stablecoin-nal vagy bankkártyás fiat-fizetéssel tölthetik fel egyenlegüket.

A biztonsági kontrollok beépítettek: az ügynökök kizárólag a felhasználó kifejezett engedélyével tranzaktálhatnak, és munkamenetenkénti költési limitek érvényesülnek. A korai tesztelők között van a Warner Bros. Discovery is, a bővítési tervek között pedig szállodafoglalás és utazási tranzakciók szerepelnek.

Az indulás fontos mérföldkő az AWS által „ügynöki gazdaságnak" nevezett jövőkép felé — egy olyan világ, ahol az MI-ügynökök a felhasználó által meghatározott kereteken belül önálló gazdasági szereplőként működnek.

Források: AWS Blog, CoinDesk, The Block