Warstwa promptu
Czy da się oszukać agenta
Testujemy, czy ktoś może obejść zasady Twojego agenta i zmusić go, żeby zdradził dane klienta albo zrobił coś, czego nie powinien. To dziś najczęstszy atak na agentów AI - prompt injection.
Audyt bezpieczeństwa agentów AI i zgodność z EU AI Act. Dla firm, które już pracują z AI lub planują wdrożenie.
Każdy agent wystawiony do klientów ma trzy potencjalne wektory ataku. Audytujemy wszystkie - od warstwy promptu po warstwę danych.
Warstwa promptu
Testujemy, czy ktoś może obejść zasady Twojego agenta i zmusić go, żeby zdradził dane klienta albo zrobił coś, czego nie powinien. To dziś najczęstszy atak na agentów AI - prompt injection.
Warstwa narzędzi
Każdy agent ma uprawnienia: czyta dane, wysyła wiadomości, sięga do innych systemów. Sprawdzamy, jak daleko sięga, gdy coś pójdzie nie tak, i pilnujemy, żeby nie narobił szkód poza swoim obszarem. Te same zasady bezpieczeństwa agentów, które publikuje Anthropic.
Warstwa danych
Patrzymy, jak agent obchodzi się z danymi osobowymi Twoich klientów i czy jest zgodny z RODO. Jeśli kwalifikuje się jako system wysokiego ryzyka, dokładamy zgodność z EU AI Act - zanim sprawdzi to ktoś inny.
Zaczynamy od 30-minutowej rozmowy, resztę robimy sami. Testujemy tak, żeby Twój agent przez cały czas działał u klientów. Kończymy raportem z listą napraw i godziną na omówienie.
30 minut online. Poznajemy Twojego agenta: jakie ma dane, do czego ma dostęp i gdzie styka się z Twoim klientem. To jedyny moment, który zabiera Ci czas.
Automatyczny atak plus ręczne scenariusze z Twojej branży - takie, których gotowy skaner nie wymyśli. Pokazujemy, gdzie da się podejść agenta i co to oznacza dla Twoich danych.
Prześwietlamy agenta pod kątem EU AI Act: co już spełnia, czego brakuje i co trzeba poprawić. Zakres zależy od tego, jak ryzykowny jest agent.
Raport: każda luka, jej ryzyko i konkretna naprawa, od najpilniejszej. Na koniec godzina online - przechodzimy przez raport i wiesz, od czego zacząć.
Następny ruch
Zostaw kontakt, odpowiemy w 24h z terminem pierwszej rozmowy.