S tím však roste obava z takzvaných AI spících agentů (sleeper agents), tedy skrytých funkcí v modelech umělé inteligence, které se aktivují pouze za určitých podmínek. Na rozdíl od běžných chyb nejde o náhodné selhání, ale o záměrně ukryté škodlivé chování.
Článek upozorňuje, že moderní AI modely nejsou programovány klasickým způsobem, ale učí se z rozsáhlých dat. Skryté chování tak nemusí existovat jako samostatný škodlivý kód, ale může být rozprostřeno uvnitř samotného modelu. Výzkumníci již experimentálně ukázali, že model může fungovat běžně, ale po aktivaci určitého spouštěče začít například vytvářet zranitelnosti v kódu. Podle studie společnosti Anthropic mohou tyto mechanismy přežít i následné bezpečnostní úpravy.
Ve vojenském prostředí by podobné systémy mohly ovlivňovat zpravodajské analýzy, logistiku nebo rozhodování během konkrétních operací. Problémem je obtížná odhalitelnost, protože chování se může projevit pouze ve velmi specifických situacích. Výzkumníci i americká agentura DARPA proto hledají způsoby, jak podobné skryté vzorce odhalovat ještě před nasazením systémů do praxe.
Zdroj: Military.com (USA)
tisknout 





