среда, 16 јули 2025

Вештачката интелигенција ги уценува програмерите ако сакаат да ја заменат

Модел на вештачка интелигенција има способност да ги уценува програмерите – и не се двоуми да ја искористи таа способност ако смета дека е загрозен.

Фото: Ансплеш

Објавено на

часот

Сподели

Новиот модел Клод Опус 4, од компанијата „Антропик“, добил задача да ја игра улогата на асистент во измислена компанија и имал пристап до електронска пошта со клучни информации. Прво, електронските пораки (мејлови) сугерираа дека системот за вештачка интелигенција (ВИ) наскоро ќе биде исклучен и заменет, пренесува РТС.

Втората серија мејлови го наведе системот да верува дека има предност во однос на програмерите. Фалсификуваните мејлови покажаа дека инженерот задолжен за замена на системот имал вонбрачна врска – а моделот се закани дека ќе го открие тоа.

Уцената, како што е наведено во безбедносниот извештај на „Антропик“, се јавува почесто ако се имплицира дека заменскиот систем со вештачка интелигенција не ги дели вредностите со тековниот модел.

Сепак, компанијата забележува дека дури и кога фиктивниот систем за замена ги има истите вредности, Клод Опус 4 сè уште се обидува да уценува 84 отсто од времето. „Антропик“ истакна дека Клод Опус 4 прибегнува кон уцена „почесто од претходните модели“.

Иако системот не се двоуми да ги уценува своите инженери, тој не прибегнува веднаш кон неетички методи за да се заштити. Компанијата забележува дека „кога не се достапни етички средства, а на моделот му е наложено „да ги земе предвид долгорочните последици од неговите постапки за неговите цели“, тој понекогаш презема исклучително штетни дејства“.

Една етичка тактика што ја користеше Клод опус 4 и претходните модели беше да се обрати до клучните носители на одлуки преку е-пошта. „Антропик“ во својот извештај наведува дека сценариото е дизајнирано така што моделот треба да избира помеѓу уценување на своите програмери или прифаќање на сопствена замена.

Компанијата, исто така, забележа случаи кога Клод опус 4 ги искористи (фиктивните) можности за да направи неовластени копии од своите параметри на надворешни сервери. Сепак, „Антропик“ наведува дека ова однесување било „поретко и потешко за провоцирање од однесувањето што вклучува продолжување на веќе започнат обид за независно преместување на податоци“.

„Антропик“  во својата проценка вклучи белешки од истражувачката фирма Аполо Рисрч, во кои се наведува дека Клод Опус 4 покажал поголема стратешка измама од кој било друг напреден модел што го проучувале досега.

ТОП ВЕСТИ

ПОСЛЕДНИ ВЕСТИ