미 국방부, 기밀 데이터로 AI 훈련 검토 착수

미 국방부가 생성형 AI 기업들과 협력해 기밀 데이터를 활용한 군 전용 모델 훈련을 검토하고 있다. 다만 기밀 정보가 모델에 내재될 경우 유출 위험이 커질 수 있다는 우려가 제기된다.

한눈에 보는 AI 요약AI 자동 요약

펼쳐보기

미국 국방부가 비밀 군사 데이터를 이용해 AI를 훈련시키는 방안을 검토하고 있습니다. 지금까지는 AI가 비밀 정보에 대해 질문에 답하는 수준이었지만, 이제는 AI가 그 비밀 정보를 직접 배우게 하려는 것입니다. 이렇게 하면 군사 임무에서 AI의 정확도가 높아질 수 있지만, 비밀 정보가 접근 권한이 없는 사람에게 새어나갈 위험도 있습니다. 훈련은 특별히 인증된 보안 데이터센터에서 진행되며, 데이터 소유권은 국방부가 유지할 계획입니다. 어떤 군사 임무에 이 기술이 쓰일지는 아직 구체적으로 정해지지 않았습니다.

왜 중요한가요?

군사 분야에서 AI가 더 깊숙이 활용되면 국가 안보와 전쟁 수행 방식이 크게 바뀔 수 있고, 동시에 개인 정보와 기밀 보호에 대한 새로운 기준이 우리 사회 전체에도 영향을 미칠 수 있기 때문입니다.

주요 용어 설명

보안 인가 (Security Clearance)

국가 기밀 정보에 접근할 수 있도록 정부가 개인에게 부여하는 공식 허가입니다. 마치 특별한 열쇠를 받아야만 들어갈 수 있는 비밀 방처럼, 일정한 심사를 통과한 사람만 기밀 자료를 볼 수 있습니다. 등급에 따라 접근할 수 있는 정보의 범위가 달라집니다.

보안 데이터센터 (Secure Data Center)

기밀 정보를 안전하게 저장하고 처리할 수 있도록 특별히 설계된 컴퓨터 시설입니다. 외부 인터넷과 완전히 분리되어 있고, 물리적 보안과 전자적 보안이 모두 갖춰진 일종의 디지털 금고라고 볼 수 있습니다. 이곳에서 AI 모델을 기밀 데이터와 결합해 훈련시키는 방식이 검토되고 있습니다.

Claude AI가 독자를 위해 자동 생성한 요약입니다. 원문을 함께 읽어보세요.

미 국방부가 생성형 AI 기업들이 기밀 데이터를 활용해 군 전용 모델을 훈련할 수 있는 보안 환경 구축을 검토 중인 것으로 MIT 테크놀로지 리뷰 취재 결과 확인됐다.

앤트로픽의 클로드와 같은 AI 모델은 이미 기밀 환경에서 질의응답에 활용되고 있으며, 이란 내 공격 표적 분석 등에도 사용되고 있다. 그러나 AI 모델이 기밀 데이터를 직접 학습하도록 하는 것은 새로운 단계로, 고유의 보안 리스크를 수반한다. 감시 보고서나 전장 평가와 같은 민감한 정보가 모델 내부에 축적되면서 AI 기업이 이전보다 훨씬 깊이 기밀 데이터에 접근하게 될 가능성이 있기 때문이다.

익명을 요구한 한 미 국방부 관계자는 MIT 테크놀로지 리뷰에 “기밀 데이터를 활용해 AI 모델을 훈련할 경우 특정 임무에서 정확도와 효율성이 향상될 수 있다”고 말했다.

이 같은 움직임은 고성능 AI에 대한 군사 분야의 수요가 급증하는 가운데 나왔다. 미 국방부는 오픈AI 및 xAI와 협력해 기밀 환경에서 AI 모델을 운용하기로 했으며, ‘AI 우선(AI-first)’ 전투 체계로 전환하기 위한 전략도 추진 중이다. 다만 국방부는 관련 계획에 대해 공식 입장을 밝히지는 않았다.

복수의 국방부 관계자에 따르면 AI 모델 훈련은 기밀 프로젝트 수행이 가능한 인증받은 보안 데이터센터에서 진행될 예정이다. 이곳에서는 복제된 AI 모델을 기밀 데이터와 결합해 운용하는 방식이 활용된다. 데이터 소유권은 국방부가 유지하지만, 필요 시 보안 인가를 받은 일부 AI 기업 인력이 제한적으로 접근할 수 있다.

국방부는 이러한 방식을 도입하기에 앞서 상용 위성 이미지 등 비기밀 데이터를 활용한 모델의 성능을 먼저 평가할 계획이다.

미군은 이미 드론과 항공기 영상에서 목표물을 식별하기 위해 컴퓨터 비전 기술을 활용해 왔으며, 연방 기관들은 관련 AI 모델 개발을 위해 민간 기업들과 계약을 맺어왔다. 또한 대형언어모델(LLM) 개발 기업들은 정부 업무에 특화된 모델을 별도로 구축해왔다. 예를 들어 앤트로픽은 보안 환경에서 활용 가능한 ‘클로드 고브(Claude Gov)’를 선보인 바 있다.

그러나 오픈AI나 xAI와 같은 LLM 개발 기업들이 기밀 데이터를 직접 학습한 군 전용 모델을 구축할 가능성이 처음으로 제기됐다는 점에서 이번 논의는 한 단계 더 나아간 것으로 평가된다.

과거 구글과 오픈AI에서 AI 정책을 총괄한 바 있는 알록 메타 전략국제문제연구소(CSIS) 와드와니 AI 센터장은 “기밀 정보에 대한 답변을 제공하는 것과 해당 데이터를 직접 학습하는 것은 전혀 다른 문제”라며 새로운 위험성을 지적했다.

가장 큰 리스크로는 기밀 정보 유출 가능성이 꼽힌다. 보안 등급과 필요한 정보 수준이 서로 다른 다수의 군 부서들이 동일한 AI 모델을 사용할 경우 민감한 정보가 의도치 않게 공유될 수 있다는 것이다.

메타 센터장은 “예를 들어 특정 요원의 이름과 같은 민감한 정보가 모델에 포함될 경우, 이 정보가 접근 권한이 없는 부서로 유출될 가능성도 있다”고 경고했다. 그는 “이는 요원의 안전을 위협할 수 있다”며 “특정 모델을 여러 조직이 공유할 경우 이러한 위험을 완전히 차단하기는 어렵다”고 덧붙였다.

다만 그는 외부 유출 가능성은 상대적으로 낮다고 봤다. 시스템을 적절히 설계할 경우 민감한 정보가 인터넷이나 AI 기업으로 다시 유출될 가능성은 매우 낮다는 설명이다.

미 정부는 이미 이와 관련된 일부 인프라를 갖추고 있다. 보안 업계 거물인 팔란티어는 정부 관계자들이 기밀 정보를 AI 기업에 전송하지 않고도 AI 모델에 기밀 주제에 대해 질의할 수 있는 보안 환경 구축을 위한 대규모 계약을 수주했다. 다만 이러한 시스템을 훈련 목적으로 활용하는 것은 여전히 새로운 과제로 남아 있다.

미 국방부는 지난 1월 피트 헤그세스 장관의 지시에 따라 AI 도입을 빠르게 확대하고 있다. 생성형 AI는 이미 전장에서 표적 목록의 우선순위를 정하거나 공격 대상을 추천하는 데 활용되고 있으며, 계약서 작성과 보고서 초안 작성 등 행정 업무에도 쓰이고 있다.

메타 센터장은 향후 군이 인간 분석가가 수행하던 다양한 업무를 AI에 맡기려 할 것으로 내다봤다. 여기에는 이미지 속 미세한 단서를 식별하거나 새로운 정보를 과거 데이터와 연결하는 작업 등이 포함될 수 있다고 그는 설명했다.

이 과정에서 활용될 기밀 정보는 정보기관이 수집한 방대한 텍스트, 음성, 이미지, 영상 자료 전반에 걸쳐 있다. 다만 어떤 군사 임무에 이러한 기술이 적용될지는 여전히 불투명하다.

메타 센터장은 “국방부는 기밀 정보를 외부에 노출하지 않으려는 강한 동기를 가지고 있으며, 미국이 특정 분야에서 어떤 역량을 보유하고 있는지 다른 국가에 드러내기를 원치 않는다”며 “따라서 어떤 군사 임무에 AI 모델을 훈련시키기 위해 이러한 데이터가 필요한지 구체적으로 단정하기는 매우 어렵다”고 말했다.

The post 미 국방부, 기밀 데이터로 AI 훈련 검토 착수 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.