ClouderaNOW AI 에이전트, 클라우드 버스팅 및 AI용 데이터 패브릭 소개 | 4월 8일

지금 등록하기
  • Cloudera Cloudera
  • 클라우데라에 문의하기
    | 기술

    고성능 컴퓨팅(HPC)과 주권 기반 AI 간 격차 해소 - 제2부(총 3부)

    Gabriele Folchi headshot
    Lama Itani headshot
    현대 건축물 사이의 다리를 건너는 사람들

    고성능 컴퓨팅(HPC)의 기본 개념을 다룬 1부를 아직 읽지 않았다면 지금 확인해 보시기 바랍니다.
     

    주권 기반 데이터 레이크하우스의 핵심 원칙

    개방형 데이터 레이크하우스: 엔지니어를 위한 단순한 PaaS

    기존 엔지니어링 시뮬레이션 소프트웨어는 기계 엔지니어가 시뮬레이션 작업을 준비하고 실행하며 결과를 분석하도록 지원하는 데에는 뛰어나지만, 최신 머신러닝(ML) 워크플로와 데이터 파이프라인을 관리하는 데에는 한계가 있습니다. 개방형 데이터 레이크하우스 *는 이러한 간극을 해소하며, IT 조직이 이미 익숙한 플랫폼 위에서 R&D 엔지니어가 강력하고 현대적인 데이터 및 AI 기능을 활용할 수 있도록 지원합니다.

    개방형 데이터 레이크하우스의 주요 활용 사례와 이점은 다음과 같습니다.

    • 비용 효율적이고 거버넌스가 적용된 데이터 아카이빙: 시뮬레이션 스냅샷(솔버 실행 과정에서 생성되는 데이터 세트)를 수년간 저장할 수 있는 사실상 무제한의 저비용 스토리지를 제공합니다. 이 스토리지는 모든 엔지니어링 및 IT 조직 전반에 걸쳐 일관된 방식으로 관리되고 거버넌스가 적용됩니다. 또한 각 데이터 세트의 메타데이터와 데이터 계보 *가 보존되므로, 데이터의 출처와 맥락을 알기 어려운 파일도 신뢰할 수 있는 자산으로 전환되어 최초 생성자가 아닌 사용자도 쉽게 재사용할 수 있습니다.

    • 컴퓨팅 리소스에 대한 액세스 간소화: 엔지니어는 공유 노트북과 Apache Spark 또는 Python Ray 클러스터를 쉽고 빠르게 배포할 수 있습니다. 이러한 환경은 메인 HPC 클러스터에서 사용하는 전용 GPU 리소스를 함께 활용하는 경우가 많습니다.

    • 개방형 표준 기반 보호: 개방형 데이터 레이크하우스는 독점적인 엔지니어링 포맷보다 Apache Iceberg, Parquet, Python과 같은 개방형 표준을 우선적으로 사용합니다. 이는 기업의 지식재산(IP)을 보호하는 데 매우 중요합니다. 기업의 IT 인프라나 공급자 전략이 변화하더라도, 현재 또는 미래에 어떤 도구로든 시뮬레이션 데이터에 지속적으로 액세스하고 활용할 수 있도록 보장하기 때문입니다.

    • 클라우드와 유사한 PaaS 경험: 데이터 레이크하우스는 사용하기 쉬운 셀프서비스형 PaaS 구조로 제공되어 복잡한 데이터 엔지니어링 및 MLOps 도구 사용을 단순화합니다. 이를 통해 서로 다른 기술 배경을 가진 사용자 간 지식 격차를 효과적으로 해소하고, 각자의 전문성을 생산적으로 공유할 수 있도록 지원합니다.

    R&D 지식재산(IP) 보호에서 퍼블릭 클라우드가 갖는 한계

    데이터 레이크하우스는 다양한 이점을 제공하지만, 그 자체만으로는 항공우주, 방위, 에너지, 자동차와 같이 규제가 엄격하고 데이터 주권이 필수 요건인 산업에서 완전한 해결책이 될 수 없습니다. 문제는 모든 데이터 레이크하우스를 이러한 요구 사항을 충족하도록 배포 및 운영할 수 있는 것은 아니라는 점입니다. 특히 퍼블릭 클라우드에 의존할 경우, 기업의 독점 지식재산(IP)에 대한 통제력을 완벽하게 유지하기 어려운 위험이 발생합니다.

    예를 들어, 새로운 엔진 설계와 같은 전산유체역학(CFD) 작업의 경우에는 단 한 번의 스냅샷만으로도 성능과 산업 설계 전반을 그대로 재현할 수 있습니다. 이러한 데이터 세트는 기업의 핵심 자산이라 할 수 있습니다. 따라서 이러한 전략적 자산을 안전하게 저장하려면 데이터 레이크하우스가 운영 주권을 법적으로 확실히 보장할 수 있는 핵심 비기능적 역량을 갖추고 있는지 확인해야 합니다. 이는 곧 데이터 레지던시와 데이터 주권을 둘러싼 핵심 논의로 이어집니다.

    데이터 레지던시 vs. 데이터 주권

    기업의 본국에서 운영된다는 전통적인 의미의 주권 개념은 클라우드 이전 시대의 유산으로, 지금은 더 이상 유효하지 않습니다. 과거에는 데이터 센터 인프라를 주로 현지 인력이 운영했기 때문에, 자연스럽게 기업이 위치한 국가의 관할권과 규제가 적용되었습니다. 그러나 상용 클라우드 서비스가 확산되고 서비스 제공업체가 24시간 365일 높은 수준의 서비스 목표를 보장해야 하는 환경이 되면서, 전 세계에 분산된 인력이 각 시간대에 맞춰 원격으로 클라우드를 운영하는 방식이 자리 잡게 되었습니다. 이러한 변화로 인해, 특히 일반적인 상용 클라우드 리전에서는 운영 인력의 물리적 위치를 보장하기가 사실상 불가능해졌으며, 결과적으로 ‘데이터 레지던시’와 ‘실질적인 데이터 주권’ 간의 연결고리가 약화되었습니다.

    따라서 이러한 상황에서 핵심 엔지니어링 데이터를 처리하고 관리하기 위한 가장 신뢰할 수 있는 아키텍처는 주권 기반 데이터 레이크하우스입니다. 이는 기본적으로 하이브리드 환경을 지원하고 특정 클라우드에 종속되지 않는 개방형 데이터 레이크하우스를 의미합니다. 

    이 접근 방식은 클라우드와 유사한 PaaS 환경의 속도와 편의성을 제공하는 동시에, 설계 단계부터 규정 준수를 반영합니다. 이를 통해 기업은 주권이 보장되고 프라이빗하며 통제된 환경과 인력 내에서만 운영하도록 요구하는 국가 또는 기타 관할권의 정책을 충족할 수 있습니다.

     

    용어

    설명

    비즈니스 영향

    데이터 레지던시

    데이터가 특정 국가의 지정학적 경계 내에 위치한 하드웨어에 물리적으로 저장되는 것을 의미합니다.

    데이터 자체와 이를 활용하는 IT 시스템 사이의 지연 시간 등 기본적인 현지 규정 준수 요구 사항을 충족하는 데에는 도움이 되지만, 보안과는 직접적인 관련이 없습니다.

    운영 주권

    클라우드 인프라를 관리하는 인력(Cloud Ops)과 서비스 제공업체에 적용되는 법적 체계가 모두 해당 국가에 속해 있고, 적절한 주권 거버넌스를 통해 통제되도록 보장하는 것을 의미합니다.

    비즈니스 영향: 법적으로 정보 제공을 강제하는 외국 정부의 액세스 요청으로 인해 서비스 제공업체가 기업의 동의 없이 민감한 IP를 제공하는 상황을 원천적으로 차단할 수 있습니다.


    AI 경제학: AI 모델의 비용 예측 가능성 증대

    보안과 법적 규정 준수 외에도, 주권 기반 데이터 레이크하우스 아키텍처는 중요한 또 하나의 장점을 제공합니다. 바로 AI 워크플로를 구현하는 데 필요한 비용을 예측 가능하게 관리할 수 있다는 점입니다.

    퍼블릭 클라우드에서 AI 서비스를 운영하는 재무 모델은 본질적으로 변동성이 크고 사용량 기반으로 구성되어 있으며, 비용이 GPU 사용 시간, 처리된 토큰 수, 운영 규모, 데이터 스캔량과 같은 사용 지표에 직접적으로 연동됩니다. 클라우드 인프라를 활용하는 팀, 프로젝트, 애플리케이션이 늘수록 비용은 기하급수적으로 증가합니다. 이러한 비용 구조는 복잡한 생성형 AI(GenAI) 모델 학습이나 대규모 오토인코더처럼 많은 연산 자원이 필요한 작업에 특히 불리합니다. 이러한 작업은 GPU를 특정 목적에 장시간 대규모로 계속 사용해야 하며, 다른 작업과 나누어 쓰기도 어렵기 때문입니다.

    프라이빗 데이터 센터 또는 고정 비용 기반 코로케이션 데이터 센터에 구축된 주권 기반 데이터 레이크하우스로 전환할 경우, 조직은 다음과 같은 방식으로 비용을 예측 가능한 구조로 전환할 수 있습니다.

    • 고정 자산 투자 구조 확립: 조직은 공유 가능한 고정 인프라에 투자합니다. 이러한 구조를 통해 여러 팀과 프로젝트에서 동일한 리소스를 함께 활용할 수 있으며, 그 결과 새로운 R&D 실험을 시작하는 데 드는 한계 비용을 사실상 0에 가깝게 낮출 수 있습니다.

    • '예상치 못한 비용 급증' 제거: 이 아키텍처는 대량 추론 처리, 반복적인 R&D 학습 사이클, 퍼블릭 클라우드 리전에서 발생하는 높은 데이터 전송 비용 등으로 인해 발생할 수 있는 예기치 않은 막대한 비용에 따른 재무적 리스크를 근본적으로 제거합니다.


    자세한 내용은 제3부에서 확인하실 수 있습니다.

    시작할 준비가 되셨나요?

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.