Náš blog

SovereignAI: výkonné LLM, ktoré nikdy neopustia EÚ

Frontier modely od veľkých hráčov sú pre regulované firmy, štátnu správu a medicínu v praxi nedostupné, dáta odchádzajú mimo EÚ a pribúdajú povinnosti. SovereignAI je naša odpoveď: výkonné jazykové modely a inferenčná kapacita prevádzkované v EÚ, ktoré nasadíte bez kompromisov v bezpečnosti. Na čom to beží, aké modely a koľko to stojí oproti vlastnému on-prem.

Jozef Krivaček · 14. 6. 2026 · 6 min read

Problém, ktorý frontier AI nevyrieši

Veľké jazykové modely od amerických hráčov sú výborné. Problém je, kde bežia a kto sa k Vašim dátam vie dostať. Vo chvíli, keď do nich pošlete obsah zmluvy, zdravotnú dokumentáciu alebo interný spis, Vaše dáta opúšťajú EÚ a odovzdávate ich poskytovateľovi, na ktorého sa vzťahuje aj americká legislatíva.

Pre bežnú firmu je to nepríjemnosť. Pre regulovanú firmu, štátnu správu a zdravotníctvo je to dôvod, prečo AI do citlivých procesov nenasadia vôbec. Nie preto, že by nechceli, ale preto, že nesmú.

SovereignAI je naša odpoveď: výkonné jazykové modely a inferenčná kapacita prevádzkované v EÚ, ktoré nasadíte do vlastných procesov bez toho, aby dáta opustili jurisdikciu. V tomto článku sa pozrieme na to, na čom to beží, aké modely tam vedia fungovať, pre koho to dáva zmysel a koľko to stojí oproti tomu, keby ste si celú infraštruktúru stavali sami.

Pre koho to je a prečo

Spoločným menovateľom je citlivosť dát a regulácia. Tri typické skupiny:

Regulované B2B firmy (financie, právo, energetika, výroba s know-how). Riešia GDPR, ochranu obchodného tajomstva a často aj NIS2. Frontier API znamená posielať dáta tretej strane mimo EÚ, čo pri citlivých dátach jednoducho nie je priechodné.
Štátna správa a samosprávy. Digitálna suverenita nie je heslo, ale požiadavka: dáta občanov majú zostať pod kontrolou inštitúcie a v EÚ. K tomu pribúdajú povinnosti podľa EU AI Act pre nasadenie AI vo verejnom sektore.
Zdravotníctvo a medicína. Zdravotné dáta sú podľa GDPR osobitná kategória (čl. 9) s najprísnejším režimom. K tomu prichádza European Health Data Space. Posielať takéto dáta do amerického cloudu je v praxi neúnosné.

Dôvod, prečo nestačí „len si vybrať európsky región“ u veľkého poskytovateľa, je jednoduchý: ak je prevádzkovateľ cloudu americká firma, podlieha americkej legislatíve (CLOUD Act, FISA) bez ohľadu na to, kde fyzicky stoja servery. Suverenita nie je o tom, kde je dátové centrum, ale o tom, kto má nad dátami právnu a faktickú kontrolu.

Na čom to beží

SovereignAI nie je nadstavba nad cudzím API. Je to skutočná inferenčná kapacita, ktorú prevádzkujeme v EÚ:

GPU akcelerátory NVIDIA (H100 / H200) v dátovom centre v EÚ, na ktorých modely reálne bežia.
Inferenčná vrstva optimalizovaná na priepustnosť a latenciu (vLLM, TensorRT-LLM a podobné), aby ste z hardvéru dostali maximum.
Izolácia podľa citlivosti: od logicky oddeleného prostredia (single-tenant) až po dedikovanú kapacitu len pre Vás, prípadne nasadenie priamo on-premise na Vašom železe.
Dáta zostávajú v jurisdikcii. Žiadny tréning na Vašich vstupoch, žiadne odovzdávanie tretím stranám, auditovateľný prístup.

Inferenčná kapacita SovereignAI beží na GPU akcelerátoroch NVIDIA v dátovom centre v EÚ.

Aké modely tam vedia bežať

Sila suverénneho prístupu je v tom, že beží na open-weight modeloch, ktorých váhy si stiahnete a spustíte vo vlastnom prostredí. Dnešná open-weight scéna je výkonnostne veľmi blízko proprietárnym modelom:

Mistral / Mixtral (EÚ pôvod), Llama (Meta), Qwen (Alibaba), DeepSeek, prípadne otvorené modely od OpenAI (gpt-oss).
Modely vieme doladiť (fine-tuning) na Vašich dátach alebo postaviť nad ne RAG s prístupom k Vašim dokumentom.

Tu je dôležitá nuansa, na ktorú sa často pýtate. Keďže váhy modelu bežia lokálne a Vaše dáta nikdy neopúšťajú prostredie, aj modely ázijského pôvodu (Qwen, DeepSeek) sú z pohľadu úniku dát bezpečné na prevádzku, lebo bežia izolovane a nič neposielajú „domov“.

Pôvod modelu však ostáva relevantný z iného dôvodu, než sú dáta: do izolovaného prostredia si model prináša aj svoje správanie, teda zabudované obmedzenia, prípadnú zaujatosť či bezpečnostné riziká natrénované priamo do váh. Toto z prostredia neodíde ani vtedy, keď je úplne odpojené. Preto voľbu riadi to, kto ste a aká je citlivosť:

bežné B2B nasadenie si pokojne vyberie najvýkonnejší open-weight model bez ohľadu na pôvod,
pre najcitlivejšie prostredia (medicína, časť štátnej správy) kurujeme výber na modely s európskym pôvodom (Mistral, dnes plne open-weight a výkonnostne na špici), kde je najvyššia dôvera v správanie modelu aj v dodávateľský reťazec.

Model nevyberáme podľa marketingu, ale podľa úlohy, jazyka a Vašich požiadaviek na suverenitu.

Koľko to stojí oproti tomu, keby ste si to stavali sami

Najčastejšia otázka znie: „Prečo si to nepostavíme celé on-prem sami?“ Pre niektoré veľké organizácie to dáva zmysel. Pre väčšinu nie, a tu je prečo. Postaviť a prevádzkovať vlastnú LLM infraštruktúru znamená uniesť celý tento reťazec nákladov:

Capex na GPU. Akcelerátory triedy H100 / H200 sú drahé a na zmysluplný výkon ich potrebujete viac, nie jeden. Pred nákupom rátajte aj s dodacími lehotami.
Energia a chladenie. GPU uzly majú vysokú spotrebu a vyžadujú dimenzované napájanie a chladenie, čo je samostatná investícia do priestoru.
Prevádzkový tím. Niekto musí infraštruktúru postaviť, aktualizovať, monitorovať a ladiť (MLOps / SRE). To nie je úväzok na pol človeka, to je tím.
Odpisy a zastarávanie. Hardvér starne rýchlo, generácie GPU sa menia rádovo v rokoch. To, čo dnes kúpite, o pár rokov dobiehate.
Problém s vyťažením. Najdrahšia GPU je tá, ktorá stojí nevyužitá. Vlastný cluster platíte celý čas, aj keď ho využívate len niekoľko hodín denne.

SovereignAI tieto náklady rozkladá a presúva na nás. Vy platíte za kapacitu, ktorú reálne používate, prípadne za rezervovanú kapacitu s predvídateľným poplatkom, namiesto toho, aby ste viazali kapitál do hardvéru, ktorý sa zastará. Capex sa mení na predvídateľný opex a o prevádzku, aktualizácie aj vyťaženie sa staráme my.

Plný on-prem dáva zmysel tam, kde potrebujete maximálnu izoláciu, máte vysoké a stále vyťaženie a kapacitu na vlastný prevádzkový tím. Aj v tom prípade vieme pomôcť, postavíme a odservisujeme to u Vás. Pre všetkých ostatných je zdieľaná alebo dedikovaná suverénna kapacita lacnejšia a rýchlejšia.

Plný on-premise dáva zmysel tam, kde treba maximálnu izoláciu a máte stále vyťaženie.

Dva spôsoby, ako začať

Aby ste nemuseli voliť medzi „nič“ a „vlastné dátové centrum“, SovereignAI ponúkame v dvoch režimoch, ktoré sa dajú kombinovať:

Pay-as-you-go API. Suverénna alternatíva k veľkým poskytovateľom: rovnaký komfort ako bežné AI API, ale hostované v EÚ a v súlade s GDPR aj EU AI Act. Ideálne na rýchly štart a overenie hodnoty.
Rezervovaná dedikovaná kapacita. Vlastné GPU a modely len pre Vás, s prísnou izoláciou a predvídateľným mesačným poplatkom. Pre škálu a najcitlivejšie nasadenia, vrátane on-prem.

Začať sa dá po malom cez API a „dorásť“ do dedikovanej kapacity vo chvíli, keď to objem a citlivosť dát vyžadujú. Investícia do prvého kroku sa nestráca.

Kde sa o tom porozprávať

SovereignAI je súčasť našich produktov a prirodzene nadväzuje na AI riešenia, ktoré nasadzujeme do firiem. Ak zvažujete AI v prostredí, kde dáta nesmú opustiť EÚ, napíšte nám. Prejdeme s Vami konkrétny prípad, vhodný model aj to, či Vám viac sedí API alebo dedikovaná kapacita.

Jozef Krivaček

CEO, Omnius