소버린 AI란?
소버린 AI는 AI를 임대하는 대신 소유하는 것으로 전환함을 나타냅니다. 기술을 보유하고, 데이터를 로컬에 유지하고, AI 시스템이 기업의 가치와 법적 요구 사항을 반영하도록 하는 것이 핵심입니다.
소버린 AI는 외부 게이트키퍼에 대한 의존도를 제거하여 AI 기능을 분산하는 것을 목표로 하는 디지털 주권 구현 방식입니다. 오픈소스 모델과 로컬 인프라의 도움을 바탕으로, 소버린 AI는 AI를 로컬로 소유하고 운영하는 유틸리티로 보는 프레임워크입니다.
특히 소버린 AI는 독립적으로 소유되고 운영되는 물리 및 데이터 인프라를 의미합니다. 여기에는 그래픽 처리 장치(GPU)와 같은 AI 가속기, 대규모 언어 모델(LLM), 그리고 이를 로컬에서 호스팅하는 추론 서버가 포함됩니다. 이러한 설정은 학습에서 추론에 이르는 전체 AI 라이프사이클이 특정 관할권 내에 유지되도록 보장합니다.
소버린 AI 시스템을 구축해야 하는 이유
AI가 일상과 사회 시스템에 더욱 깊게 자리 잡게 되면서, AI의 작동 방식과 제어 주체에 관한 논의가 더욱 중요해지고 있습니다.
아마도 소버린 AI 시스템을 구축하려는 가장 큰 동기는 리스크를 제거하기 위함일 것입니다. 소버린 AI는 사용자만이 룰을 정하고 출력을 제어하는 법적 안전 지대 내에 중요한 데이터를 보관하는 데 필요한 아키텍처를 제공합니다. 그 밖의 이유는 다음과 같습니다.
개인 정보 보호: 다른 국가의 클라우드로 데이터를 전송하는 것은 현지 개인정보 보호법을 위반할 수 있고, 정보가 유출되거나 수집되는 결과를 초래할 수 있습니다. 이를 방지하기 위해 일부 정부는 AI가 자국 내에서 데이터를 처리하도록 요구합니다. 소버린 AI는 데이터를 로컬에 유지하여 개인정보를 보호하는 데 도움이 됩니다.
기술 독립성: 자체 소버린 AI 인프라를 보유하면 지정학적 변화나 서비스 약관의 변경이 발생하더라도 기술 운영을 지속할 수 있는 안전장치가 마련됩니다. 이는 국가가 소비자를 넘어 창조자, 나아가 수출국으로 거듭나는 데 도움이 될 수 있습니다.
경제 성장: 소버린 AI는 국가가 일자리와 수익을 현지에 유지할 수 있도록 지원합니다. 한 국가가 'AI 팩토리'(또는 데이터센터)와 모델을 소유하면 AI에 지출되는 비용이 지역 경제에 머물게 됩니다.
국가 안보: 군사 시스템에서 AI를 점점 더 많이 사용함에 따라 각국 정부는 국가 안보가 외국 기술에 의존하지 않기를 원합니다. 소버린 AI 시스템을 구축하는 국가는 국가 안보를 저해하지 않으면서 더욱 안전하고 비공개적으로 데이터에 액세스할 수 있습니다.
- 문화적 정체성: 현재 가장 널리 사용되는 AI 모델 중 일부를 미국 기업들이 개발하고 있습니다. 이는 미국 기반 모델이 서구권 콘텐츠와 가치관을 바탕으로 학습되어 다른 문화권에서는 편향과 오해를 일으킬 수 있음을 의미합니다. 소버린 AI는 각 국가가 현지 언어, 문화, 컨텍스트에 기반한 학습 데이터를 사용할 수 있도록 지원합니다.
AI 기술 구현의 4가지 핵심 고려 사항
소버린 AI 시스템의 구성 요소
소버린 AI를 구축하고 유지하는 것은 정적인 체크리스트를 따르는 것이 아니라 여러 요소가 유기적으로 움직이는 동적 시스템을 다루는 과정입니다. 이를 위해서는 실험에서 프로덕션에 이르기까지 관여하는 모든 요소를 제어하고 이해해야 합니다. 소버린 AI 시스템의 요소를 층층이 쌓인 케이크처럼 생각해 보세요. 층이 하나씩 추가될수록 시스템의 자립성 또는 주권이 강화됩니다. AI 스택이라고도 하는 이러한 계층은 스펙트럼에 존재하며 다음 요소를 검토합니다.
하드웨어: 칩과 데이터센터의 소유자는 누구인가요?
데이터: AI를 학습시키고 개선하는 데 사용되는 데이터를 누가 소유하고 제공하나요?
모델: AI가 사용하는 알고리즘의 소유자는 누구인가요?
애플리케이션: 사용자 인터페이스와 여기에서 수집되는 데이터는 누가 생성하고 액세스할 수 있나요?
에너지(보너스 계층): 국가나 조직이 자체 AI에 전력을 공급할 수 있나요?
소버린 AI 시스템을 구축한다는 것은 다음과 같은 질문을 던지는 것을 의미하기도 합니다.
- 모델을 구축하는 주체는 누구인가요?
- 모델은 무엇을 기반으로 학습되나요?
- 모델에는 어떤 가치 체계가 있나요?
- 어떤 언어와 방언을 사용하나요?
- 문제가 발생하면 누가 책임을 져야 하나요?
소버린 시스템을 구축하기로 결정했다면 먼저 인프라, 즉 AI 팩토리가 필요합니다. 이러한 데이터센터는 대량의 데이터를 매우 빠르게 처리, 분석, 생성할 수 있어야 합니다.
vLLM 및 llm-d와 같은 최적화 소프트웨어를 사용하면 사용자 쿼리와 실시간 데이터 스트림이 공개 애플리케이션 프로그래밍 인터페이스(API)를 거치지 않고 로컬에서 처리됩니다. 이러한 기술은 PagedAttention을 통해 GPU 메모리 사용을 최적화하고 대규모 파운데이션 모델을 여러 개의 소형 GPU에서 공유할 수 있도록 지원합니다. 분산 추론이라고 하는 이 프로세스를 통해 기업은 기존 자체 인프라에서 고성능 생성형 AI를 호스팅하는 것이 재정적, 기술적으로 가능해집니다. 이 방식을 이용하면 기업은 비용도 많이 들고 소버린 환경도 아닌 클라우드 API를 임대할 필요가 없습니다.
다음으로 인력이 필요합니다. 룰을 정하고 시스템을 구축하며 출력을 감사할 전담 팀이 필요합니다. 여기에는 엔지니어, 데이터 사이언티스트, 법률 고문, 연구원이 포함됩니다. 또한 정부 관계자와 협력하여 규제 프레임워크를 마련해야 합니다. 이는 설명 가능성(explainability), 투명성, 데이터 보호, 사이버 보안과 같은 문제에 초점을 맞춘 모범 사례와 함께 AI 개발 및 배포를 위한 가이드라인을 만드는 것을 의미합니다.
주권 확보가 최종 목표라 해도 처음에는 도움이 필요할 수 있습니다. 따라서 다른 국가의 기관과 협력하여 리소스와 전문 지식을 모으는 방안을 고려해야 합니다. 이러한 파트너십은 AI 사용에 대한 글로벌 표준을 수립하고 국가 간 데이터 흐름을 촉진하는 데에도 도움이 될 수 있습니다.
기밀 추론이란?
기밀 추론은 주권을 실질적으로 구현할 수 있게 해주는 기술입니다. 국가와 조직이 데이터가 안전하기를 기대하는 수준을 넘어 데이터가 안전하다는 확신을 가질 수 있도록 지원합니다.
기밀 추론은 AI가 데이터를 분석하는 동안 데이터를 암호화하는 데 사용되는 하드웨어 수준의 보안 기술입니다. 이를 통해 데이터를 비공개로 유지하고 클라우드 공급업체가 데이터를 볼 수 없도록 보장합니다. 이 과정에서 데이터는 네트워크를 통해 이동할 때와 서버에 도착했을 때 암호화된(읽을 수 없는) 상태로 유지됩니다.
데이터가 중앙 처리 장치(CPU) 또는 GPU에 도달하면 일시적으로 복호화됩니다. 그러나 데이터는 신뢰할 수 있는 실행 환경(Trusted Execution Environment, TEE)으로 알려진 하드웨어(CPU 또는 GPU)의 물리적 영역에 진입하기 때문에 비공개 상태로 유지됩니다. 칩 내부의 이 엔클레이브는 회로의 일부를 분리하여 컴퓨터의 나머지 부분에서 액세스할 수 없도록 합니다. 이는 본질적으로 물리적인 프라이버시 보호막 역할을 합니다.
데이터는 추론 단계에서 복호화되지만 여전히 보호됩니다. 이후 클라우드 서버를 통과하면서 다시 암호화되고 기기에 도달하면 다시 한번 복호화됩니다.
소버린 AI를 실현하는 방법
외국 인프라에 의존하는 단계를 넘어 주권 상태로 나아가려면 기업이 AI 스택의 4가지 주요 구성 요소를 제어해야 합니다.
데이터 주권: 데이터 주권은 데이터 규정을 준수하기 위해 데이터를 수집, 분류, 처리, 저장하는 방식을 지속적으로 제어하는 것을 말합니다. 민감한 데이터는 현지 법률의 적용만을 받도록 주권 경계 내에 물리적으로 위치한 스토리지에 보관되어야 합니다.
소버린 AI의 컨텍스트에서는 데이터 주권이 학습, 추론, 가중치에 영향을 미칩니다. 이는 AI를 학습하는 데 사용하는 데이터가 사용자의 소유임을 의미합니다. 사용자가 질문을 하면 해당 데이터는 외국 데이터센터로 이동하지 않고 로컬에서 처리됩니다. 마지막으로 소버린 AI 영역에서 데이터 주권은 AI가 '사고하는' 방식을 결정하는 사용 설명서를 사용자가 직접 소유하고 사용자 정의할 수 있도록 보장합니다.
기술 주권: 기술 주권은 AI 스택의 청사진을 소유하고 이를 검증할 수 있는 역량을 갖추는 것을 의미합니다. AI는 단일 소프트웨어가 아니라 다양한 '재료'로 구성된 레시피에 가깝습니다. AI 스택을 구축할 때는 여러 벤더의 재료를 사용하게 됩니다. 기술 주권을 확보하려면 AI 시스템을 구성하는 각 재료를 확인할 수 있는 투명한 관리 이력이 필요합니다. 이러한 이력 추적 개념은 SBOM(Software Bill of Materials) 또는 AIBOM(AI Bill of Materials)이라고도 합니다. 이는 사용 중인 기술의 전체 인벤토리 역할을 하며 시스템을 감사하여 건전성을 확인하는 데 도움이 됩니다.
이렇게 생각해 보세요. 귀하는 회계 업무를 아웃소싱하는 사업주입니다. 재무 기록을 제3자 기업에 인계하고 해당 기업의 업무를 신뢰합니다. 그러던 어느 해 감사를 받게 됩니다. 그 과정에서 회계 담당자가 영수증을 전혀 보관하지 않았고 수치도 맞지 않는다는 사실을 알게 됩니다.
기술 주권은 회계를 사내에서 직접 처리하기로 결정하는 것과 같습니다. 자체 컴퓨터에서 자체 소프트웨어를 사용하고 모든 입력 항목에 대해 디지털 영수증을 요구합니다. 감사가 시작되면 귀하는 영수증과 파일에 접근한 모든 사람의 기록이 담긴 타임스탬프 폴더를 당당히 제시할 수 있습니다.
운영 주권: 운영 주권은 시스템을 운영하는 주체에 관한 개념입니다. 운영 주권에는 완전한 관리 제어, 국내 인재를 통한 자급 역량, 그리고 '킬 스위치(kill-switch)' 방어 체계가 필요합니다. 외국 기업이 원격으로 AI 설정을 비활성화하거나 변경할 수 있다는 우려가 없어야 한다는 뜻입니다. 운영 주권이란 간단히 말해 기술을 독립적으로 운영하는 것입니다.
이렇게 생각해 보세요. 인도의 한 은행이 미국에 기반을 둔 AI 시스템을 사용합니다. 미국 기반 AI 시스템에서 소프트웨어 업데이트가 배포되면서 AI가 데이터를 처리하고 작동하는 방식에 드리프트가 발생합니다. 이로 인해 사용자에게 문제가 생기기 시작하고 갑자기 고객이 계정에 액세스할 수 없는 상황이 벌어집니다. 은행은 현지 엔지니어를 통해 문제를 해결하는 것이 아니라, 운영 지원을 받기 위해 고객 서비스에 연락해야만 합니다.
검증 주권: 검증 주권(assurance sovereignty)은 디지털 시스템과 프로세스의 무결성, 보안, 신뢰성을 독립적으로 검증하고 보장하는 것을 의미합니다. 다시 말해 AI가 스스로 주장하는 바를 실제로 수행하는지 확인하는 것입니다. 검증 주권은 제조업체나 공급업체가 제시한 측정 기준이 아니라 자체 측정 기준을 사용하여 지속적인 시스템 감사와 독립적인 검증을 수행하는 데 중점을 둡니다.
검증 주권이 없으면 할루시네이션을 일으키거나 의도와 다르게 작동하는 시스템을 소유하고 운영하게 될 수도 있습니다. 반면 검증 주권을 확보하면 시스템의 로직이 사용자의 표준과 기대치를 충족하는지 확인할 수 있습니다. 시스템이 잘못 작동할 경우 내부를 확인하여 문제를 진단할 수 있습니다.
또한 검증 주권을 통해 규제 목적상 중요한 AI 작동 방식의 '감사 가능' 증거를 생성할 수 있습니다. Feast와 같은 오픈소스 툴은 다양한 소스의 데이터를 하나의 체계적인 시스템으로 통합하고 증빙을 제공합니다. 즉, 규제 기관에서 AI가 대출을 거부한 이유를 묻는 경우 해당 결정을 내리는 데 사용된 데이터의 정확한 버전을 제시할 수 있습니다.
Feast에 대해 자세히 알아보기
소버린 AI와 오픈소스
오픈소스는 소버린 AI를 구축하는 데 필요한 청사진과 툴을 제공합니다. 오픈소스 모델이 없다면 소수의 부유한 기업만이 AI를 구축할 리소스를 보유하게 될 것이며, 다른 모든 기업은 자체 기술을 구축하는 대신 기술을 임대할 수밖에 없습니다.
결국 소버린 AI를 구축하는 데 있어 가장 큰 장애물 중 하나는 모델과 시스템을 처음부터 학습하는 데 드는 비용입니다. 기업이나 국가는 오픈소스 소프트웨어와 오픈 가중치 모델을 활용하여 파운데이션 모델을 가져온 후, 자체 데이터로 미세 조정하고 필요에 맞게 조정할 수 있습니다. 또한 오픈소스 코드 라이브러리(예: vLLM)를 사용하여 비용을 절감할 수 있습니다.
소버린 AI와 설명 가능한 AI
소버린 AI는 AI 시스템을 제어할 수 있는 권한을 보유하는 것을 의미합니다. 설명 가능한 AI는 그러한 권리를 행사할 수 있는 능력입니다. 작동 방식이나 출력을 생성하는 이유를 이해하지 못하면 머신에 대한 주권(또는 권한)을 가질 수 없습니다. 설명 가능성이 없다면 소버린 AI는 숨겨진 편향이 있을 수 있는 블랙박스에 불과합니다.
소버린 AI와 에이전틱 AI
AI가 질문에 답하는 툴에서 컨텍스트를 이해하는 시스템으로 발전하는 상황에서, 조직은 AI 에이전트가 전체 엔터프라이즈 데이터 자산을 안전하게 탐색할 수 있도록 지원하는 시맨틱 계층과 모델 컨텍스트 프로토콜(MCP) 게이트웨이를 구축해야 합니다.
AI가 컨텍스트를 파악할 수 있도록 방대한 정보에 액세스 권한을 부여한다면, 특히 민감한 정보인 경우 이를 철저히 보호하는 것이 합리적입니다.
소버린 AI 시스템 내에서 에이전틱(Agentic) AI를 운영하려면 에이전트, 지식 그래프 및 백엔드 시스템의 교육 및 자격증이 해당 에이전트의 관할권 내 물리적 공간에 머물러야 합니다. 그래야만 특정 활용 사례에 특화된 잠재적 비공개 지식을 기반으로 학습하고 이에 액세스할 수 있기 때문입니다. 이러한 근접성을 갖추면 대기 시간(지연)도 줄어듭니다.
독일 법률에 특화되어 정책 결정을 지원하는 AI 에이전트를 예로 들겠습니다. 소버린 AI 시스템이 없으면 다음과 같은 여러 문제가 발생할 수 있습니다.
- 글로벌 데이터 또는 미국 법률 시스템으로 학습된 데이터세트를 사용한다면 독일의 맥락에서 완전히 정확하지 않은 출력이나 편향이 생성될 위험이 있습니다.
- 이러한 에이전트가 소버린 클라우드가 아닌 외국 클라우드에 존재한다면 해당 공급업체가 데이터, 메모리, 로직을 확인하고 해당 연결에 개입할 가능성이 있습니다.
- 에이전트가 실수를 저지르면 현지 기관과 국제 기관은 적용해야 할 과실 책임법이 무엇인지에 대해 이견을 보일 수 있습니다.
- 국제 분쟁이 발생하면 외국 공급업체가 API 키를 취소하여 에이전트가 중단될 수 있습니다.
소버린 AI는 에이전트가 관할권의 제약과 범위 내에서 처리되도록 보장합니다. 이러한 소버린 시나리오에서 독일 법률을 다루는 독일 에이전트는 독일 서버에 저장된 아카이브 데이터에 액세스할 수 있습니다. 이 에이전트는 독일 문화의 미묘한 차이를 이해합니다. 독일 법학 학위에 요구되는 교육 및 자격증에 액세스할 수 있습니다. 독일에 물리적으로 저장된 독일 법원 판결의 지식 그래프를 사용합니다.
소버린 AI 관행이 없다면 독일 정책 입안자들은 독일에서 다른 국가로 데이터를 주고받는 AI를 사용하게 될지도 모릅니다. 전 세계의 법률 정보가 뒤섞인 지식 그래프를 사용할 수도 있습니다. 주장을 뒷받침하는 데 도움이 될 독일 법원의 판례에 액세스하지 못할 수도 있습니다. 에이전트의 학습 내용 역시 독일 입법자들이 자국 법률 시스템과 정책에 기대하는 문화적 기준과 다를 수 있습니다.
에이전틱 AI에 대해 자세히 알아보기
AgentOps와 소버린 AI
AgentOps는 소버린 AI 사례를 에이전틱 워크플로우에 구현하는 데 중요한 요소입니다. AgentOps는 의사 결정, 데이터 흐름, 툴 상호작용에 대한 검증 가능한 기록을 제공하여 시스템 작동 방식을 더 잘 이해할 수 있도록 지원합니다. AgentOps는 다음을 통해 투명성을 제공합니다.
- 하드웨어 리소스 사용량을 트래킹합니다.
- 환각 발생률을 모니터링합니다.
- 데이터가 암호화된 상태로 유지되도록 보장합니다.
- 에이전트가 수행한 작업에 대해 감사 가능한 로그를 제공합니다.
- 정책 위반이 발생하면 프로세스를 종료합니다.
소버린 AI의 장점
소버린 AI가 널리 사용되면 전문화되고 현지화된 AI 에코시스템 네트워크가 형성되어 다음과 같은 혜택을 누릴 수 있습니다.
- 보안 및 데이터 보호: 소버린 AI는 의료, 금융, 정부와 같이 규제가 엄격한 산업에서 특히 중요합니다. 소버린 AI는 사이버 보안을 강화하고 독점 데이터와 지적 재산을 보호합니다. 또한 감사 가능한 소프트웨어 공급망을 지원합니다. vLLM 및 llm-d와 같은 툴을 사용하면 민감한 데이터에 접근하기 전에 소프트웨어의 모든 구성 요소를 검증할 수 있습니다. 이를 통해 보안을 수동적 방어에서 능동적 검증으로 전환할 수 있습니다.
외국 AI 공급업체로부터의 독립: 자체 개발 AI 시스템을 구축하고 사용하면 정부와 조직이 파괴적인 외부 요인에 직면하더라도 제어 권한을 유지하고 운영을 지속할 수 있습니다. 여기에는 무역 전쟁, 규제 변화, 지정학적 문제 또는 외부 전력 공급 장애 등이 포함될 수 있습니다.
경쟁 우위: 조직은 AI 인프라와 모델을 제어함으로써 시스템을 미세 조정하고 출력을 사용자 정의하여 AI가 문화적 컨텍스트와 비즈니스 요구사항에 맞는 방식으로 작동하도록 할 수 있습니다.
사용자 신뢰 향상: 사용자와 고객은 자신의 데이터가 로컬에 유지된다는 사실을 알고 더욱 안심할 수 있습니다.
지속 가능성 및 리소스 제어: 조직은 워크로드의 실행 방식과 위치를 제어함으로써 해당 워크로드에 전력을 공급하는 방식을 결정할 수 있습니다. 어쩌면 이것은 현지 환경 관련 약속에 맞춰 운영을 조정하기 위해 재생 에너지원을 사용하는 것일 수 있습니다. 궁극적으로 소버린 AI는 조직이나 국가가 의존 상태에서 역량 강화와 독립의 상태로 나아가도록 지원합니다.
소버린 AI의 과제
소버린 AI는 장기적인 투자가 필요한 전략적 경로입니다. 맞춤형 소버린 스택을 운영한다는 것은 편의성을 책임감과 맞바꾸는 것을 의미하며, 이러한 전환에는 다음과 같은 몇 가지 과제가 따를 수 있습니다.
- 법적 모호성: 관할권마다 법률을 처리하는 방식이 다릅니다. 조직은 AI의 작동 방식에 대해 올바른 결정을 내릴 수 있도록, 상충하는 법적 프레임워크를 살펴봐야 합니다. 이 과정에서 법률 자문이 필요할 수 있습니다.
느린 변화 속도: 컴플라이언스 및 규제 기관은 업무 처리가 느린 것으로 잘 알려져 있습니다. 의사 결정이 신속하게 이루어지지 않을 가능성이 높으므로 프로젝트를 전략적으로 관리해야 합니다.
비용: 조직은 AI를 처리하는 데 필요한 컴퓨팅 성능과 인프라 비용을 지불하는 것 외에도 구축하려는 기술 솔루션을 구현할 우수한 전문가를 확보해야 합니다. 또한 사용자에게 혜택을 제공하고 사용자를 지원하는 서비스를 개발하기 위해 연구 개발에 투자해야 합니다.
- 기술적 복잡성: 소버린 AI 스택을 구축하려면 전반적인 IT 인프라스트럭쳐에 약간의 변경이 필요할 수 있습니다. 특히 새로운 코드를 생성하고 기존 데이터를 마이그레이션해야 할 수 있습니다. 이를 직접 관리하는 것은 Model-as-a-Service(MaaS)와 같은 플러그 앤 플레이 옵션을 사용하는 것보다 어렵습니다.
소버린 AI 목표의 예시
소버린 AI를 추진하는 전략은 사용 가능한 리소스에 따라 달라집니다. 다음은 다양한 국가들이 소버린 AI 영역에 어떻게 진출하고 있는지 보여주는 몇 가지 예시입니다.
설계에 의한 통합 주권: 중국은 현재 거의 완전한 소버린 AI를 구축한 가장 두드러진 사례입니다. 중국 정부는 엄격한 법률과 민간 부문 데이터에 대한 액세스를 통해 데이터를, 완전한 국내 에코시스템을 통해 애플리케이션을, 국내 연구소를 통해 모델을 제어합니다. 중국은 현지 칩 개발에 투자하고 있지만 하드웨어 측면에서는 아직 완전히 독립적이지 않습니다. 중국은 국영 인터넷 검열 시스템인 만리방화벽(The Great Firewall)을 통해 디지털 주권에 가장 근접한 국가로 부상했습니다.
민간 부문 주도: 미국에서는 민간 기업이 미국 정부의 직접적인 지원을 거의 받지 않고도 지배적인 AI 시스템을 구축했습니다. 따라서 Google, Microsoft, OpenAI, Anthropic이 글로벌 AI 개발을 주도하는 것 자체가 주권의 한 형태라고 볼 수 있습니다.
규제 주권: 유럽연합의 주권 접근 방식은 인프라보다 거버넌스에 집중합니다. EU AI 법(EU AI Act)은 AI를 위험도에 따라 분류하고 시스템이 EU 내에서 운영되기 위해 충족해야 하는 표준을 설정합니다. EU는 미국이나 중국과 같은 국가의 인프라 및 컴퓨팅 예산을 따라잡으려 하기보다 Mistral과 같은 현지 프로젝트에 투자하고 업계를 안내할 명확한 규정을 마련하는 데 주력합니다.
주권의 단순화: 소규모 국가들은 외국 파운데이션 모델에 대한 의존을 수용하되 현지 언어에 맞게 모델을 미세 조정하고, 국내 거버넌스 프레임워크를 구축하고, 국내 데이터를 로컬에 유지하는 데 시간과 투자를 집중합니다. 즉 현지 연구원에게 투자하되 OpenAI의 ChatGPT와 같은 자체 버전을 만들려 하지는 않습니다. 싱가포르의 SEA-LION 프로젝트는 현지 인재를 조직하여 동남아시아 커뮤니티에 중점을 둔 LLM을 구축하는 방법을 보여주는 사례입니다.
소버린 AI와 AI 주권 비교
이 용어들은 서로 바꿔서 사용되기도 하며 혼동하기 쉽습니다. 두 용어가 어떻게 다른지 살펴보겠습니다.
소버린 AI는 국가나 기업이 자체 조건에 따라 AI 시스템을 배포할 수 있도록 하는 제품, 기술 스택, 툴을 의미합니다. 이는 애초에 AI가 작동하는 방식을 결정할 수 있는 권한을 갖는 것에 관한 것입니다. 즉 역량, 기능, 수단에 관한 개념입니다.
AI 주권은 더욱 철학적인 개념으로, AI 정책을 결정할 권한을 누가 갖는지에 대해 질문합니다. 이는 다양한 시민과 커뮤니티가 AI가 자신의 삶과 미래에 미치는 영향에 대해 실질적인 목소리를 낼 수 있도록 보장하는 것입니다. AI 주권은 AI 사용의 범위를 넓혀 인권, 민주주의, 동의, 문화 보존, 가치에 관한 논의를 포함합니다.
이렇게 생각해 보세요. 어떤 국가는 자국 시민의 AI 주권을 훼손하는 방식으로 소버린 AI를 추진할 수 있습니다. 즉 다른 국가와 완전히 독립적으로 운영되는 정교한 AI 툴을 보유하더라도 시민에게 공정하지 않거나 공평하지 않은 방식으로 사용할 수 있습니다.
또한 소버린 AI와 AI 주권 사이에는 상당한 교집합이 존재합니다. 소버린 AI 시스템을 구축하려면 가치와 권력, 책임, 대표성에 관한 질문을 던져야 하며, 이러한 질문은 AI 주권의 여러 측면을 고려하도록 만듭니다.
독점 AI란?
독점화 또는 중앙화된 AI는 소수의 하이퍼스케일러만이 전 세계의 지능 공급, 즉 사회를 형성하는 인프라, 원시 데이터에 대한 액세스 권한, 기술을 제어하는 상황을 의미합니다. 이러한 상황에서 소유권을 갖지 못한 국가는 외세에 의존하게 될 수 있으며, 잠재적으로 지정학적 갈등을 촉발할 수 있습니다. 소버린 AI는 여러 측면에서 이러한 상황을 방지하기 위한 노력입니다.
소버린 AI와 MaaS 비교
Model-as-a-Service(MaaS)는 ChatGPT와 같은 모델에 대한 액세스 권한을 비용을 지불하고 사용하는 방식을 의미합니다. MaaS를 사용하면 공급업체가 모델을 변경하거나 사용자의 액세스를 차단해도 사용자가 할 수 있는 일은 없습니다. 소버린 AI는 다른 사람의 서비스에 의존하지 않고 자신의 서비스를 소유하는 것으로 전환하는 것입니다.
소버린 AI를 도입하려면 현재 상태와 다음 단계를 파악하기 위해 소버린티, 즉 주권의 스펙트럼을 이해하는 것이 중요합니다.
제로 주권: 대부분의 기업은 여기에서 MaaS를 사용하여 시작합니다. 이 시나리오에서 기업은 완전히 이해할 수 없는 모델을 사용하고 있으며 처리할 데이터를 국경을 넘어 전송하고 있습니다. 여기서 기업은 테넌트일 뿐입니다. 공급업체가 플러그를 뽑으면 AI가 사라집니다.
부분 주권: 이 시나리오는 기업이 오픈 가중 모델을 사용하고 지역 인프라에서 호스팅하는 중간 지점입니다. 기업은 모델의 지식을 형성하고 코드를 소유하는 방법을 이해합니다. 이 시나리오에서는 다른 국가에 위치한 NVIDIA 칩 또는 클라우드 공급업체를 사용하고 있을 가능성이 높습니다. 즉, 외부 하드웨어에는 여전히 의존하게 됩니다.
완전한 주권: 이 시나리오에서 AI는 기업이 소유한 국내 토지와 하드웨어를 기반으로 구축됩니다. 로컬 데이터를 기반으로 학습하고 국내 전력으로 실행됩니다.
소버린 AI의 미래 전망
소버린 AI라는 개념은 국가가 자국 사회를 점진적으로 형성해 나가는 AI를 스스로 설계할 수 있는지에 대한 의문을 제기합니다. 디지털 주권, 기술 주권처럼 더 넓은 범위의 주권을 포함하는 커다란 퍼즐의 중간 조각에 해당합니다.
디지털 주권은 디지털 공간에 대한 룰, 권리, 관할권을 말합니다.
기술 주권은 기반 인프라와 기술을 소유하고 제어하는 것을 말합니다.
소버린 AI는 이 두 가지를 결합하여 사용자의 룰에 따라 관리되고, 사용자의 인프라 위에 구축되며, 사용자의 데이터로 학습되고, 사용자의 가치에 부합하는 AI 시스템에 중점을 둡니다.
대부분의 국가는 디지털 주권이나 기술 주권 중 어느 한 영역에서 운영되고 있습니다. 소버린 AI를 구축하려는 열망은 있다 해도, 이를 실현하기 위해서는 기술 정책 분야에서 여전히 더 많은 발전이 필요합니다.
앞으로 몇 년 동안 특정 지역이나 국가에 기반을 둔 AI 시스템이 늘어날 가능성이 높습니다. 이는 유럽연합이 AI 법을 추진하고 Mistral과 같은 모델에 투자하는 데서도 확인할 수 있으며, 유럽이 현재 미국과 중국이 제공하는 것과는 다른 독자적인 AI 정체성을 원한다는 신호입니다.
Red Hat의 지원 방식
Red Hat® AI는 vLLM 기반 서버로 신속하고 유연하며 효율적인 추론 성능을 제공합니다. 모델과 데이터를 안정적으로 연결하여 하나의 플랫폼에서 전문 에이전트의 사용자 지정 및 개발을 통합합니다. 오픈소스 기반의 당사 제품으로 규모와 상관없이 AI 워크플로우의 모든 과정을 완전히 제어할 수 있습니다.
Red Hat은 조직이 보안, 데이터, 모델, 결과에 대한 제어를 유지하면서 에어 갭(격리된) AI 팩토리를 구축할 수 있도록 지원함으로써 소버린 AI의 기반을 제공합니다.
Red Hat 에코시스템의 힘은 개방성에 있습니다. 단일 벤더만으로는 소버린 AI의 과제를 해결할 수 없습니다. Red Hat은 다양한 하드웨어와 클라우드를 아우르는 통합자 역할을 함으로써 고객이 지역 규정을 준수하고 외국 벤더 종속성을 방지할 수 있도록 지원합니다.
투명성, 업스트림 기여, 오픈 표준에 중점을 둔 Red Hat의 접근 방식을 통해 전체 기술 스택을 독립적으로 검증할 수 있습니다.
Artificial Intelligence (AI)
See how our platforms free customers to run AI workloads and models anywhere