IT 리더들은 오랜 기간 동안 기업의 목표를 실현할 수 있는 AI 전략을 구축해야 한다는 압박을 받아왔습니다. 그러나 파일럿 단계에서 실제 운영 단계로 전환하는 과정은 예상보다 훨씬 더 어려운 것으로 드러났습니다.
돌이켜보면, 이러한 초기 실험들이 필요한 만큼 체계적으로 설계되지 않았기 때문입니다. AI 모델은 아직 이를 수용할 준비가 되지 않은 데이터 자산 위에 구축되었습니다. 실험 역시 서로 분리된 환경에서 진행되었습니다. 그 결과, 확장 과정에서 거버넌스와 보안을 전사적으로 사후 보완해야 했습니다. 한편, 몇몇 부서에서는 승인되지 않은 AI 실험을 진행하면서 섀도우 AI(shadow AI)가 생겨났고, 이제는 이를 정책, 감사 추적 가능성, 통제 체계 안으로 다시 편입해야 합니다.
AI 목표를 실제 성과로 연결하려면 점점 더 복잡해지고 있는 분산되고 단편화된 데이터 자산을 정리하는 작업이 선행되어야 합니다. 이를 위한 확장 가능한 접근 방식은 데이터가 있는 위치에서 AI를 적용하고, AI가 데이터에 액세스하는 방식을 재정의하는 것입니다. 데이터 구조의 가장 기초 단계까지 통합되고 거버넌스가 적용된 액세스 체계가 없다면, 책임성과 성과는 근본적으로 양립하기 어렵습니다.
그동안 가장 명확한 해법이자 널리 권장되어 온 방식은 데이터 자산을 중앙집중화하는 것이었습니다. 모든 데이터를 하나의 데이터 레이크, 데이터 웨어하우스, 또는 클라우드로 이동시켜 단일 정보원을 구축하자는 접근입니다. 물리적으로 데이터를 한곳에 모아 사일로를 줄이고 단편화를 해소하려는 전략이었습니다.
이러한 방식은 이론적으로 효율적으로 보일 수 있습니다. 그러나 실제로는, 다음과 같은 이유로 인해 특히 기업 환경에서 이러한 방식이 지속되기 어려운 것으로 밝혀졌습니다.
결국 이러한 통합 전략은 기업에 더 이상 감당하기 어려운 선택을 강요합니다. 특히 실시간 대응력과 컨텍스트가 가치 창출의 핵심이 되는 AI 시대에는 이러한 제약이 매우 치명적입니다. 데이터 이동을 기다리거나 여러 환경에 데이터를 복제하는 방식은 실시간 대응력과 컨텍스트를 모두 떨어뜨립니다.
더 나은 접근 방식은 데이터 페더레이션입니다. 이는 데이터를 물리적으로 이동시키지 않고도, 기업이 데이터를 하나로 통합된 것처럼 운영할 수 있도록 하는 방식입니다.
데이터 페더레이션은 흔히 쿼리 엔진, 커넥터, 분산 컴퓨팅과 같은 기술적 요소로 설명됩니다. 그러나 운영 리더에게 이 방식은 훨씬 더 큰 의미를 갖습니다.
간단히 말해, 데이터 페더레이션은 데이터를 물리적으로 중앙집중화하거나 복제하지 않고도 분산된 시스템 전반에 걸쳐 데이터를 통합적으로 액세스할 수 있도록 합니다. 하지만 더 중요한 것은 그 결과입니다. 팀은 데이터 페더레이션을 통해 데이터가 존재하는 위치에서 데이터를 그대로 활용할 수 있으며, 리더는 클라우드, 온프레미스, 엣지 환경 전반에 걸친 질문에 대해 최신 데이터에 근거한 정확한 답을 신속하게 얻을 수 있습니다.
예를 들어, 한 글로벌 유통 기업이 “제품 X의 재고는 어디에 있는가?”라는 질문을 했을 때, 창고 재고, 오프라인 매장 진열 상품, 운송 중인 물품, 전자상거래 물류 센터의 재고를 모두 반영한 하나의 종합된 답을 즉시 확인할 수 있습니다.
또는 한 공공기관이 “이 신청자가 프로그램 X의 지원 대상에 해당하는가?”라고 질문하는 경우를 생각해 볼 수 있습니다. 이 경우에도 납세 기록, 소득 검증 정보, 기존 복지 수혜 여부 등 데이터가 서로 다른 부서 시스템에 그대로 남아 있더라도, 이를 모두 반영한 하나의 통합된 답을 얻을 수 있습니다.
이러한 결과는 데이터 페더레이션을 통해 가능합니다. 사용자 인터페이스 이면에 단일한 거버넌스 정책, 즉 통합된 거버넌스 체계가 작동하기 때문입니다. 여기서는 규칙이 데이터가 우연히 저장된 시스템이 아니라 데이터 자체에 연결됩니다.
결과적으로 이 방식은 물리적인 통합이 아니라 논리적인 데이터 통합에 해당합니다. 이는 권한이 부여된 쿼리가 데이터 자산 전체를 아우를 수 있으며, 데이터가 위치한 곳에 가장 가까운 컴퓨팅 리소스를 활용하면서도 거버넌스가 일관되게 적용됨을 의미합니다. 또한 모든 액세스 지점은 동일한 기준으로 관리되고, 모든 결과는 추적 및 감사가 가능합니다.
이는 AI를 확장 가능하고 신뢰할 수 있게 만드는 기반이 됩니다.
데이터 페더레이션이 아키텍처의 변화라면, '한 번의 거버넌스로 어디서나 액세스(govern once, access everywhere)'는 운영 방식의 변화를 의미합니다. 이는 기업이 통제와 확장을 바라보는 방식을 바꿉니다.
앞서 간단히 언급했듯이, 페더레이션 전략에서는 거버넌스 정책이 데이터의 물리적 저장 위치가 아니라 데이터 자체를 따라갑니다. 이는 데이터가 어디에 있든 보안 규칙이 일관되게 적용된다는 의미입니다. 그 결과, 추적 가능성 *과 감사 가능성은 사후적으로 추가하는 기능이 아니라, 처음부터 기본적으로 내재된 핵심 기능이 됩니다.
이는 단순한 감사 기능을 넘어, 기존 거버넌스 통제 체계 안에서 상위 계층의 AI 앱과 에이전트가 더 폭넓은 컨텍스트에 실시간으로 액세스할 수 있도록 지원해 성능을 높입니다.
운영 리더에게 그 결과는 다음과 같이 구체적인 변화로 나타납니다.
이를 통해 팀은 여러 환경 사이의 데이터를 통일하거나 결과의 일관성을 감사하는 사소한 작업에 얽매이지 않고 실질적인 성과 창출에 집중할 수 있습니다.
최신 플랫폼은 저장 중심 설계를 넘어, 하이브리드 환경의 상시화, 강화되는 규제 요구, 그리고 AI 기반 자동화 기능을 지원하기 위한 지능형 데이터 액세스 계층으로 발전하고 있습니다.
이러한 변화는 플랫폼을 둘러싼 거시적인 추세를 반영합니다. 데이터를 인프라 제약에 맞추는 것이 아니라, 데이터가 어디에 있든 해당 위치에서 AI를 적용하는 방식으로 전환되고 있는 것입니다. AI가 공급망, 재무 예측, 이상 거래 탐지, 고객 소통 등 다양한 영역에 깊이 확산될수록, 분산된 데이터 액세스로 인한 비용은 더욱 커집니다.
업계 분석가들 역시 같은 판단을 내리고 있습니다. Forrester의 데이터 패브릭 공급업체 평가에서도 이러한 흐름을 확인할 수 있습니다. 이 평가에서는 하이브리드 환경 전반에서 통합되고 거버넌스가 적용된 데이터 액세스를 기업용 AI를 위한 핵심 아키텍처 역량으로 보고 있습니다. 이 평가에서 Cloudera는 2025년 4분기 리더로 선정되었습니다.
통합되고 거버넌스가 적용된 데이터 액세스는 신뢰할 수 있는 AI의 기반이며, 그 출발점은 바로 데이터 페더레이션입니다.
그러나 모든 데이터 페더레이션 전략이 동일한 것은 아닙니다.
다음 글에서는 다양한 페더레이션 모델을 비교하고, 기업이 진정한 하이브리드 데이터 액세스, 통합 거버넌스, 그리고 확장 가능한 AI를 지원하는 플랫폼을 선택할 때 고려해야 할 요소를 살펴봅니다.
This may have been caused by one of the following: