BET
30364.13
0.67%
BET-TR
72377.05
0.66%
BET-FI
104017.89
2.43%
BETPlus
4394.83
0.66%
BET-NG
2258.03
0.33%
BET-XT
2607.15
0.75%
BET-XT-TR
6075.02
0.73%
BET-BK
5878.54
1.09%
ROTX
68689.01
0.68%

Anthropic reacționează după directiva guvernului SUA de suspendare a accesului la modelele Fable 5 și Mythos 5

Autor: Financial Market
3 min

Guvernul Statelor Unite, invocând autorități legate de securitatea națională, a emis o directivă de control al exporturilor prin care solicită suspendarea accesului la modelele Fable 5 și Mythos 5 pentru toți cetățenii străini, indiferent dacă aceștia se află în interiorul sau în afara SUA. Măsura se aplică inclusiv angajaților Anthropic care nu sunt cetățeni americani.

Efectul direct al acestei decizii este că Anthropic trebuie să dezactiveze brusc accesul la Fable 5 și Mythos 5 pentru toți clienții săi, pentru a se conforma cerințelor legale. Accesul la celelalte modele Anthropic nu va fi afectat.

Potrivit Anthropic, scrisoarea nu a oferit detalii concrete privind îngrijorările de securitate națională invocate. Înțelegerea companiei este că autoritățile americane ar fi identificat o metodă de ocolire a mecanismelor de siguranță, cunoscută drept „jailbreak”, aplicată modelului Fable 5.

Anthropic precizează că a analizat o demonstrație a acestei tehnici, utilizată pentru identificarea unui număr redus de vulnerabilități minore, deja cunoscute anterior. Compania susține că aceste vulnerabilități par relativ simple și că alte modele disponibile public pot ajunge la aceleași rezultate fără a necesita o metodă de ocolire a restricțiilor.

În ceea ce privește măsurile de siguranță ale modelului Fable, Anthropic reamintește poziția prezentată la momentul lansării:

Compania afirmă că a implementat mecanisme robuste de protecție, menite să reducă semnificativ riscul ca Fable să fie utilizat în scopuri legate de atacuri cibernetice sau alte activități riscante. Potrivit Anthropic, aceste măsuri au fost chiar criticate de unii utilizatori ca fiind prea restrictive.

În săptămânile premergătoare lansării Fable, compania a colaborat cu guvernul SUA, cu UK AISI, cu mai multe organizații private independente și cu echipe interne pentru a testa, timp de mii de ore, rezistența sistemelor de siguranță ale modelului.

Aceste teste ar fi arătat, potrivit Anthropic, că mecanismele de protecție ale Fable sunt semnificativ mai eficiente decât cele ale oricărui model implementat anterior. Compania mai susține că niciun tester nu a reușit până acum să identifice un „jailbreak universal”, adică o metodă capabilă să ocolească pe scară largă sistemele de siguranță ale modelului și să deblocheze o gamă extinsă de capabilități cibernetice.

Totuși, Anthropic admite că o rezistență perfectă la tentativele de tip jailbreak nu pare posibilă în prezent pentru niciun furnizor de modele AI. Potrivit companiei, toate mecanismele de siguranță utilizate în industrie sunt vulnerabile la forme non-universale de jailbreak, care pot genera anumite informații în contexte specifice. De asemenea, Anthropic consideră probabil ca, în viitor, să fie descoperite și metode universale de ocolire a protecțiilor.

Din acest motiv, compania spune că a adoptat pentru Fable 5 o strategie de „apărare în profunzime”. Obiectivul a fost ca eventualele metode de jailbreak să fie fie înguste și limitate, în cazul celor non-universale, fie foarte costisitoare de realizat, în cazul celor universale. Această abordare este combinată cu monitorizare atentă, pentru detectarea rapidă și blocarea eventualelor atacuri reușite.

CITESTE SI:  Program pentru IMM-uri: cursuri de educație digitală, consultanță și granturi de până la 1 milion de lei prin Business Forward

Anthropic explică totodată că tocmai din acest motiv a impus o politică de păstrare timp de 30 de zile a datelor clienților care utilizează Fable. Deși această schimbare implică anumite costuri comerciale în relația cu clienții, compania susține că ea este necesară pentru a putea cerceta și reduce riscurile asociate tentativelor de jailbreak.

Compania afirmă că își menține sprijinul pentru această strategie de apărare în profunzime, considerând că ea reduce riscurile asociate modelului Fable și le aduce la un nivel comparabil cu riscurile modelelor deja disponibile în industrie.

Anthropic mai susține că nu a primit până acum o notificare privind un posibil jailbreak non-universal care să fi generat un rezultat cu adevărat periculos. Potrivit companiei, exemplele comunicate până acum au constat fie în răspunsuri benigne, fie în constatări minore care nu oferă un avantaj specific modelului Mythos.

Până în prezent, susține Anthropic, guvernul american a prezentat doar verbal dovezi privind un posibil jailbreak și non-universal. Acesta ar consta, în esență, în solicitarea adresată modelului de a analiza o anumită bază de cod și de a remedia eventuale vulnerabilități software.

Compania afirmă că a analizat un raport despre care consideră că stă la baza directivei guvernamentale și că a validat faptul că nivelul de capabilitate demonstrat acolo este deja disponibil pe scară largă prin alte modele, inclusiv OpenAI GPT-5.5. Anthropic subliniază că astfel de capabilități sunt utilizate zilnic de specialiștii în securitate cibernetică pentru protejarea sistemelor informatice.

Compania precizează că se conformează directivei legale emise de guvern și că elimină accesul la Fable 5 și Mythos 5 pentru toți utilizatorii. Cu toate acestea, Anthropic afirmă că nu este de acord cu ideea că identificarea unui potențial jailbreak îngust ar trebui să ducă la retragerea unui model comercial utilizat de sute de milioane de persoane.

În opinia companiei, dacă acest standard ar fi aplicat la nivelul întregii industrii, rezultatul ar fi, practic, blocarea lansării de noi modele de inteligență artificială de frontieră de către toți marii furnizori.

Anthropic susține că guvernul ar trebui să aibă capacitatea de a bloca implementările nesigure, însă doar în cadrul unui proces prevăzut de lege, transparent, corect, clar și fundamentat pe date tehnice. Compania consideră că acțiunea actuală nu respectă aceste principii.

Ti-a placut acest articol?

Ti-a placut acest articol?

Susține activitatea Financial Market.

Contribuția lunară poate fi anulată în orice moment folosind link-ul din email.