Skip to content
Gondolatok

A modell megtalálta a hibát. A főcím tört be.

2026. június 28.·2 perc olvasásSok a szakszó? Olvasd köznyelven, AI-átiratban.

Irányíts rá egy agentet egy kódbázisra, és talál benne hibákat. Amiket a Phora-ban futtatok, több hibát hoznak felszínre, mint amennyit kézzel valaha megtaláltam volna: biztonsági réseket, holt ágakat, évek óta észre nem vett elcsúszásokat. A megtalálás a könnyebbik fele. Kezdeni velük valamit már másik munka, és általában lassabb, emberibb.

Aki ilyen eszközökkel dolgozik, annak ez a különbség annyira hétköznapi, hogy unalmas. Aztán országos hír lett belőle – rossz igével elmesélve.

Az Anthropic Mythos nevű modelljét egy ellenőrzött red-team teszten az NSA saját, titkos rendszerei ellen futtatták. Órák alatt szinte mindegyikben talált sebezhetőséget. Mire a hír elért hozzánk, a „talált sebezhetőséget” már „betört” lett – és egy AI állítólag egy délután alatt feltörte az NSA-t.

Három különböző ige

Megtalálni egy rést és kihasználni nem ugyanaz a mozdulat. Megtalálni egy zárt hálózatban, ahová valódi támadó sosem jutna be, megint harmadik dolog. A tesztet futtató tisztviselők ki is mondták: a modell gyorsan felszínre hozta a hibákat, de nem használta ki őket – egy szándékosan megismételhetetlenre épített környezetben.

Ebből a pontosságból semmi nem jut át. Mark Warner szenátor idézte az NSA vezetőjét: „nem hetek, hanem órák alatt hatolt be szinte minden titkos rendszerünkbe.” Az Economist leközölte. Egy héttel később a közösségi média már ennyire egyszerűsítette: „az Anthropic feltörte az NSA-t”, az eredeti cikk szerzőjének pedig helyreigazítást kellett kiadnia. A helyreigazítás nem jutott sehová.

A képesség valódi. Nem ez benne az ijesztő.

Itt viszont a megnyugtató verzió is megbukik. Egy modell, amelyik órák alatt szinte minden rést megtalál egy megerősített, titkos hálózatban, nem semmi. A brit AI Security Institute a Mythost lényegesen erősebbnek minősítette támadó kiberképességben mindennél, amit addig tesztelt. Egy korábbi változata állítólag egy 27 éves hibát talált az OpenBSD-ben, az egyik legkeményebben védett kódbázisban a világon. A képesség valódi. Csak épp nem az a rajzfilm, aminek eladták.

A rajzfilmnek pedig ára van. Egy modell, amelyik ilyen jól talál hibát, pontosan az, amitől azt akarod, hogy a tieidet találja meg elsőként – mielőtt valaki kevésbé barátságos teszi. Több mint száz biztonsági vezető írta meg a kormánynak, hogy a visszavonás valószínűleg többet segít az ellenfélnek, mint amennyit bárkit megvéd, mert ugyanaz a modell körülbelül olyan jól védekezik, ahogy támad. Az ige, amit választasz, eldönti, hogy fegyvert látsz-e vagy füstjelzőt.

Olvasd el az igét

Mostanában szinte hetente „csinál” egy modell valamit, ami közelről szűkebbnek és érdekesebbnek bizonyul a főcímnél. Megtalálta, nem kihasználta. Laborban mutatta meg, nem a szabadban. A kettő közti távolságban lakik a valódi ítélet – és pont ezt a távolságot hivatott eltüntetni egy főcím.

Nem az aggaszt, hogy egy modell órák alatt talál egy hibát. Az aggaszt, hogy egy szabály is órák alatt születik – a rossz igére építve.

Semmi nem tört be az NSA-ba. Egy mondat tört be.

Mindig van következő szint.

Ha tetszik, amit látsz (akár terméket, akár csapatot raksz össze), szívesen beszélek róla.