Dlaczego lokalne AI przestało być bezpiecznym azylem?

Każdego dnia światło dzienne ujmują nowe fakty dotyczące bezpieczeństwa – a raczej jego rażącego braku. Jesteśmy świadkami fascynującego, choć przerażającego procesu: przy pomocy narzędzi AI z szaf wyciągane są trupy exploitów sprzed kilkunastu lat, a badacze wykopują szkielety podatności, które tkwiły tuż pod naszymi nosami. Na tych kruchych fundamentach budowaliśmy nasze „bezpieczne” rozwiązania. Co gorsza, obok starych błędów pojawiają się zupełnie nowe, specyficzne dla ekosystemu AI.

„Ja tam mam Ollamę uruchomioną lokalnie, mnie te wycieki z chmury nie dotyczą” – to zdanie, powtarzane jak mantra przez tysiące użytkowników, właśnie straciło na aktualności.

Kiedy Llama zaczyna krwawić: CVE-2026-7482

Użytkownicy Ollamy, jednego z najpopularniejszych narzędzi do lokalnego uruchamiania modeli językowych (LLM), mają powody do niepokoju. Pojawiła się krytyczna podatność ochrzczona mianem „Bleeding Llama”. To bolesne przypomnienie, że samo odcięcie się od gigantów takich jak OpenAI czy Google nie czyni naszej infrastruktury niezdobytą twierdzą. Infrastruktura AI stała się nowym, głównym frontem w globalnej walce o dane.

Techniczna anatomia zagrożenia

Podatność CVE-2026-7482 otrzymała w skali CVSS bardzo wysoki wynik 9.1. Jest to luka typu
Remote Code Execution (RCE), która pozwala napastnikowi na przejęcie kontroli nad systemem bez jakiejkolwiek konieczności uwierzytelnienia. W świecie, gdzie automatyzacja i agenci AI coraz częściej mają dostęp do naszych prywatnych plików i systemów operacyjnych, taki „wytrych” w rękach cyberprzestępców jest scenariuszem z gatunku tych „katastrofalnych”.

Identyfikator: CVE-2026-7482
Wynik: CVSS 9.1 (Krytyczny)
Wektor ataku: Złośliwe pliki modeli GGUF
Podatne wersje: Ollama < 0.17.1

Mechanizm ataku: GGUF jako koń trojański

Wektor ataku opiera się na formacie plików GGUF, który jest standardem dla kwantyzowanych modeli uruchamianych na procesorach graficznych i konsumenckim sprzęcie. GGUF (GPT-Generated Unified Format) to popularny format plików stworzony do wydajnego uruchamiania modeli sztucznej inteligencji (LLM oraz modeli generujących obrazy, takich jak FLUX) lokalnie na komputerze. Pozwala uruchamiać duże modele na sprzęcie klasy konsumenckiej dzięki ich kompresji (kwantyzacji) przy minimalnej utracie dokładności. Napastnik może przygotować spreparowany plik modelu, który po załadowaniu przez podatną wersję Ollamy wykorzystuje błędy w zarządzaniu pamięcią. Wynikiem jest możliwość zdalnego wycieku zawartości pamięci serwera lub wykonania dowolnych komend.

Co dokładnie może zostać skradzione?

Wiele osób zakłada, że jedynym ryzykiem jest utrata „rozmowy z chatbotem”. Prawda jest znacznie bardziej brutalna. Atakujący mogą uzyskać dostęp do:

Kluczy API i zmiennych środowiskowych, często przechowywanych w pamięci procesu do integracji z zewnętrznymi bazami danych czy narzędziami.
Promptów systemowych, czyli „instrukcji bazowych”, które stanowią własność intelektualną wielu firm budujących rozwiązania oparte na AI.
Historii konwersacji zawierających często dane wrażliwe, dane finansowe lub tajemnice przedsiębiorstwa wpisywane przez nieświadomych pracowników.
Wewnętrznych danych przetwarzanych przez model w ramach RAG (Retrieval-Augmented Generation).

Skala problemu: 300 000 otwartych furtek

Choć Ollama jest projektowana jako narzędzie lokalne, wygoda użytkowników często bierze górę nad bezpieczeństwem. Szacuje się, że na całym świecie nawet 300 tysięcy serwerów Ollama jest wystawionych bezpośrednio na publiczny internet bez żadnych zabezpieczeń. Każda z tych instalacji, jeśli nie została zaktualizowana, jest obecnie otwarta na atak „Bleeding Llama”.

Strategia obrony – jak nie stać się ofiarą?

Jeśli korzystasz z Ollamy w swojej firmie lub prywatnie, wykonaj natychmiast następujące kroki:

Podnieś wersję Ollama do v0.17.1 lub nowszej. To jedyny skuteczny sposób na załatanie samej luki.
Zgodnie z zasadą Zero Trust nigdy nie wystawiaj portu API Ollamy bezpośrednio na świat.
Używaj tuneli VPN lub bezpiecznych połączeń lokalnych.
Stosuj firewalle i reverse proxies (np. Nginx, Caddy) z wymuszonym uwierzytelnieniem (np. OAuth).
Monitoruj ruch i obserwuj nietypowe transfery wychodzące. Wyciek pamięciczęsto generuje charakterystyczne wzorce ruchu sieciowego.
Weryfikuj źródła i pobieraj modele GGUF wyłącznie z zaufanych repozytoriów i od sprawdzonych twórców, np. na Hugging Face.

Bezpieczeństwo infrastruktury AI jest dziś tak samo krytyczne, jak tradycyjne CyberSec. Nie
możemy pozwalać sobie na ignorancję, tłumacząc ją „lokalnym charakterem” narzędzi. Jeśli
budujesz rozwiązania oparte na LLM, o bezpieczeństwie musisz myśleć od pierwszego wiersza kodu i pierwszej konfiguracji serwera. „Bleeding Llama” to tylko wierzchołek góry lodowej – w miarę jak AI będzie coraz głębiej wnikać w nasze systemy, liczba i skomplikowanie ataków będą tylko rosnąć.
Stay safe and secure!

Niniejszy wpis ma charakter wyłącznie edukacyjny i służy budowaniu świadomości w zakresie cyberbezpieczeństwa. Wszystkie informacje pochodzą z publicznie dostępnych raportów bezpieczeństwa.

Źródła:

Opis GGUF na Hugging Face.
Użycie GGUF z llama.cpp.
NIST CVE-2026-7482 Detail.
Informacje z Github Advisory database: Ollama contains a heap out-of-bounds read vulnerability in the GGUF model loader.

Jeśli chcesz przeszkolić swój zespół z szeroko pojętych tematów związanych z bezpieczeństwem i ze sztuczną inteligencją, to zapraszamy na bezpłatne, 15-minutowe spotkanie przy wirtualnej kawie. To niezobowiązujący sposób, by omówić Twoje potrzeby szkoleniowe i sprawdzić, jak możemy pomóc.

Wystarczy kliknąć przycisk poniżej, aby wybrać dogodny termin. Jeśli wolisz wysłać maila – możesz przesłać wiadomość przez formularz kontaktowy.

umów spotkanie Wyślij wiadomość

Share this post:

Podobne wpisy

Czy AI nas zastąpi? Przykłady na to, że sami do tego się przyczyniamy
Beata Zalewa 22 stycznia 202629 stycznia 2026 AI,Chmura,GenAI,LLM

W dyskusjach o sztucznej inteligencji dominuje lęk przed „wrogim przejęciem/zabraniem” pracy. Boimy się algorytmów, jakby były obcą cywilizacją, która nagle wylądowała na Ziemi. Prawda jest jednak bardziej prozaiczna: AI nie włamuje się do naszych biur…

Dowiedz się więcej Czy AI nas zastąpi? Przykłady na to, że sami do tego się przyczyniamy
Pułapka „wystarczalności” w vibe codingu
Beata Zalewa 19 lutego 202619 lutego 2026 AI,Cloud Security,Cyberbezpieczeństwo,GenAI,LLM

W świecie zdominowanym przez kulturę hustle i szybkie zwycięstwa, na LinkedInie zapanowała nowa moda. Firmy prześcigają się w chwaleniu się tym, jak bardzo „uprościły” swoje życie. Schemat jest zawsze ten sam: rezygnacja z drogich rozwiązań…

Dowiedz się więcej Pułapka „wystarczalności” w vibe codingu
Sierpniowe kolonie na chmurze Azure
Beata Zalewa 25 lipca 20252 września 2025 Azure,Cloud Security,Cyberbezpieczeństwo

English version: click here. W czasie wakacji dzieci się nudzą: te mniejsze, te większe, a także wewnętrzne dzieci u dorosłych. I u mnie moje wewnętrzne dziecko zaczęło ziewać z nudów. Moi studenci na kierunku MBA…

Dowiedz się więcej Sierpniowe kolonie na chmurze Azure
Warsztaty do egzaminów AZ-900, AI-900 and SC-900
Beata Zalewa 2 września 20252 września 2025 AI,Azure,Azure OpenAI,Cyberbezpieczeństwo,Cybersecurity

Wielki finał Sierpniowych kolonii na chmurze Azure: Zdobądź certyfikat! English version: click here Nasze Sierpniowe kolonie na chmurze Azure powoli dobiegają końca. To był fantastyczny czas pełen nauki i wymiany wiedzy, a Wasze zaangażowanie przerosło…

Dowiedz się więcej Warsztaty do egzaminów AZ-900, AI-900 and SC-900
Dezinformacja
Beata Zalewa 21 września 202519 stycznia 2026 Bezpieczeństwo w sieci,Cyberbezpieczeństwo,Dezinformacja

Dezinformacja jako usługa, czyli żarty się skończyły To tytuł mojej prezentacji, z którą wystąpiłam dnia 11 września 2025 roku w Warszawie na 15-tej, jubileuszowej konferencji Security Case Study. W 2025 roku, katalog zagrożeń dla przedsiębiorstw…

Dowiedz się więcej Dezinformacja
Regulamin Security Bez Tabu a prawo działające wstecz
Beata Zalewa 5 lipca 20265 lipca 2026 Cyberbezpieczeństwo

Regulamin Security Bez Tabu, czyli jak dostałam bana z przyszłości Regulamin sklepu/ów Security Bez Tabu to dla mnie wciąż czarna magia. Wyobraź sobie sytuację: bierzesz udział w technologicznym projekcie edukacyjnym, nagle zostajesz z niego wyrzucony,…

Dowiedz się więcej Regulamin Security Bez Tabu a prawo działające wstecz

O ZALNET

Mam na imię Beata i od ponad 15 lat jestem właścicielką firmy ZALNET. Firma specjalizuje się tematyce cyberbezpieczeństwa i sztucznej inteligencji, zwłaszcza w ekosystemie Microsoftu. Jestem certyfikowaną programistką i ekspertką od platformy Azure. Aktywnie dzielę się swoją wiedzą jako wykładowca akademicki i trenerka (posiadam tytuł Microsoft Certified Trainer nieprzerwanie od 2010 roku), a także poprzez liczne publikacje i wystąpienia na konferencjach, gdzie omawiam tematy takie jak bezpieczeństwo i analiza zagrożeń. W wolnych chwilach wspieram rozwój społeczności Not The Hidden Wiki, piszę artykuły techniczne i prowadzę bloga.