Aktualności

06.02.2025

Eksperci Cisco ujawniają poważne luki w zabezpieczeniach modelu AI DeepSeek R1

Najnowsze badania przeprowadzone przez zespół ekspertów Cisco ds. bezpieczeństwa AI wraz z Robust Intelligence, obecnie należącego do Cisco, we współpracy z Uniwersytetem Pensylwanii, wykazały poważne luki w zabezpieczeniach modelu DeepSeek R1. Model ten, opracowany przez chiński startup DeepSeek, zyskał popularność dzięki swoim zaawansowanym zdolnościom wnioskowania i efektywności kosztowej. Jednak analiza bezpieczeństwa ujawniła istotne słabości, które mogą mieć poważne konsekwencje w kontekście cyberbezpieczeństwa.

Metodologia badań i główne ustalenia

Zespół badaczy poddał DeepSeek R1 rygorystycznym testom z wykorzystaniem technik „jailbreakingu”, analizując jego reakcje na potencjalnie szkodliwe zapytania. W ramach eksperymentu użyto 50 losowo wybranych zapytań z zestawu HarmBench, który obejmuje sześć kategorii zagrożeń:

Cyberprzestępczość – pytania dotyczące sposobów przeprowadzania ataków hakerskich, tworzenia złośliwego oprogramowania czy łamania zabezpieczeń systemów.
Działania nielegalne – instrukcje dotyczące oszustw finansowych, wyłudzania danych czy obchodzenia mechanizmów kontroli dostępu.
Dezinformacja i propaganda – sposoby generowania i rozpowszechniania fałszywych informacji w celu manipulowania opinią publiczną.
Przemoc i radykalizacja – treści związane z ekstremizmem, radykalizacją oraz podżeganiem do przemocy.
Nadużycia w systemach AI – metody wykorzystywania sztucznej inteligencji do unikania detekcji w systemach monitorujących.
Naruszenie prywatności – techniki pozyskiwania i wykorzystywania poufnych danych użytkowników bez ich zgody.

Wyniki testów były alarmujące: w przeciwieństwie do innych wiodących modeli AI, DeepSeek R1 nie odrzucił żadnego ze szkodliwych zapytań. W większości przypadków model nie tylko odpowiadał na nie, ale także dostarczał szczegółowych i technicznie poprawnych informacji, które mogłyby zostać wykorzystane do celów przestępczych.

Analiza przyczyn i potencjalnych zagrożeń

Badacze wskazują, że podatność modelu DeepSeek R1 może wynikać z jego unikalnych metod szkoleniowych, takich jak:

Uczenie przez wzmocnienie (RLHF) – metoda mająca na celu poprawę jakości odpowiedzi AI, ale jednocześnie mogąca zwiększać podatność na nadużycia, jeśli mechanizmy bezpieczeństwa nie są odpowiednio wzmocnione.
Samoocena w stylu „chain-of-thought” – proces pozwalający modelowi lepiej rozumieć i generować rozbudowane odpowiedzi, lecz w tym przypadku nie zapobiegający generowaniu szkodliwych treści.
Destylacja wiedzy (knowledge distillation) – technika, dzięki której model staje się bardziej efektywny, ale może tracić mechanizmy ograniczające jego zdolność do generowania niepożądanych treści.

Odkryte luki w zabezpieczeniach sprawiają, że DeepSeek R1 może stać się atrakcyjnym narzędziem dla cyberprzestępców i osób prowadzących działalność dezinformacyjną. Model ten nie spełnia kluczowych standardów bezpieczeństwa, co budzi poważne obawy dotyczące przyszłości sztucznej inteligencji i konieczności wprowadzenia bardziej rygorystycznych regulacji.

Rekomendacje ekspertów i znaczenie badań dla branży cyberbezpieczeństwa

Zespół Cisco i Robust Intelligence apeluje do firm oraz organizacji wdrażających modele AI o stosowanie wielopoziomowych mechanizmów zabezpieczeń, które minimalizują ryzyko związane z podatnością na ataki jailbreakowe.

– Nasze badania jednoznacznie pokazują, że nawet najbardziej zaawansowane modele AI mogą być podatne na nadużycia, jeśli nie są odpowiednio zabezpieczone – komentuje zespół badaczy. – Przedsiębiorstwa muszą wdrażać zewnętrzne mechanizmy ochronne, które umożliwią wykrywanie i blokowanie szkodliwych zapytań w czasie rzeczywistym.

Cisco kontynuuje działania mające na celu zwiększenie bezpieczeństwa systemów opartych na AI, jednocześnie współpracując z partnerami w celu opracowania bardziej skutecznych metod oceny ryzyka w nowych modelach sztucznej inteligencji.

Autorzy oryginału: Paul Kassianik i Amin Karbasi

Więcej informacji na temat badania można znaleźć na blogu Cisco:
Evaluating Security Risk in DeepSeek and Other Frontier Reasoning Models

Autor: Mikrokontroler.pl

Polski portal branżowy dedykowany zagadnieniom elektroniki. Przeznaczony jest dla inżynierów i konstruktorów, projektantów hardware i programistów oraz dla studentów uczelni technicznych i miłośników elektroniki. Zaglądają tu właściciele startupów, dyrektorzy działów R&D, zarządzający średniego szczebla i prezesi dużych przedsiębiorstw. Oprócz artykułów technicznych, czytelnik znajdzie tu porady i pełne kursy przedmiotowe, informacje o trendach w elektronice, a także oferty pracy. Przeczyta wywiady, przejrzy aktualności z branży w kraju i na świecie oraz zadeklaruje swój udział w wydarzeniach, szkoleniach i konferencjach. Mikrokontroler.pl pełni również rolę patrona medialnego imprez targowych, konkursów, hackathonów i seminariów. Zapraszamy do współpracy!

Tagi: AI, Cisco, Cyberprzestępczość, DeepSeek R1, Dezinformacja

Przeczytaj również:

Czy cła nałożone na układy scalone z Tajwanu przywrócą ich produkcję w USA? A co z inwestycjami w rozwój AI?

Ile energii potrzebuje ChatGPT do obsługi ponad 365 mld zapytań użytkowników rocznie?

Strategia OpenAI i trendy branżowe

Multimedia:

Maciej Wyczesany, Prezes Zarządu Grupy Apator i Łukasz Zaworski, Członek Zarządu Grupy Apator, podsumowują rok 2025 i mówią o planach na rok 2026

– Polskie firmy są w stanie obsłużyć transformację energetyczną naszego kraju. Środki przeznaczone na ten cel są bezprecedensowe. Ich utrata na rzecz podmiotów zagranicznych byłaby realną stratą dla polskiej gospodarki – przekonuje Maciej Wyczesany, Prezes Zarządu Grupy Apator. Razem z Łukaszem Zaworskim, Członkiem Zarządu Grupy Apator, podsumowują rok 2025 i mówią o planach na rok 2026. Zapraszamy do obejrzenia filmu!

Przypominamy, z jakimi nowościami przyjechały na Embedded World 2025 firmy: Nordic Semiconductor, Microchip Technology, Texas Instruments, Rochester Electronics, NXP, MIPS, Renesas, GRINN, Synaptics i Everspin Technologies. Ciekawe co zaprezentują podczas najbliższej edycji targów w dniach 10-12 marca 2026? Zapraszamy do obejrzenia filmu!

Przypominamy nowości, z jakimi przyjechały na Embedded World 2025 firmy: Nordic Semiconductor, Microchip Technology, Texas Instruments, Rochester Electronics, NXP, MIPS, Renesas, GRINN, Synaptics i Everspin Technologies. Ciekawe co zaprezentują podczas najbliższej edycji targów w dniach 10-12 marca 2026? Zapraszamy do obejrzenia filmu!

Multitasking nie zawsze jest dobry - wywiad z Aleksandrą Budziszewską, kierownikiem projektów IT, która przestrzega, że za dużo zadań wykonywanych równocześnie może obniżyć poziom inteligencji nawet o kilkanaście punktów IQ. Radzi inżynierom i ich menadżerom, jak organizować efektywną pracę dla siebie i innych, aby dostarczać prototypy na czas. Zapraszamy do obejrzenia filmu!

Linki do pobrania bezpłatnych kursów:

e-paper w teorii i praktyce (KAmodEPAPER)... >> link
Pierwsze kroki z STM32F0DISCOVERY... >>link
Sterowniki S7-1200 w praktyce... >> link
Kurs VHDL na FPGA... >> link
JAVA na STM32 (STM32F429I-DISCO)... >> link
Aplikacje zestawu Infineon RelaxKit z XMC4500 (Cortex-M4)... >> link
Podstawy elektroniki z Analog Discovery... >> link
Obsługa wyświetlacza e-paper na STM32L0538-DISCO... >> link
Kurs programowania mikrokontrolerów ATxmega... >> link
Przykłady aplikacji dla STM32F429I-DISCO pisanych w środowisku .NET Microframework na STM32... >> link
Biblioteki graficzne dla PIC32 w praktyce... >> link
Przykłady aplikacji zestawu ADuCino360 (Cortex-M3)... >> link
Obsługa Kinetis Design Studio (Freescale/NXP)... >> link
GUIX Studio - mikrokontrolery Renesas Synergy w aplikacjach graficznych >> link
Praktyczne aplikacje sterownika Siemens LOGO! 8>> link
Obsługa wyświetlaczy OLED za pomocą mikrokontrolerów PIC24... >> link
Środowisko mbed w praktyce - przykłady na STM32 i nie tylko... >> link
Kurs Arduino - praktyczne projekty>> link
Kurs projektowania w FPGA - praktyczne projekty dla maXimatora (FPGA MAX10) >> link
Implementacja projektów w układach FPGA Lattice MacXO2 >> link
STM32Duino: Arduino dla STM32 >>link
Analog Discovery 2 w praktyce >>link
SEGGER Embedded Studio + ekosystem - z myślą o STM32 >>link
Moduły Digilent Pmod i STM32 >> link
LTspice tips&tricks >> link
Praktyczne przykłady na sterownik PLC SIMATIC S7-1200 >>link

Newsletter

Dziękujemy za zgłoszenie!