개요
단일 플랫폼에서의 데이터 레이크 유연성과 Data Warehouse 성능
Open Data Lakehouse는 조직이 정형 및 비정형의 모든 데이터에 대해 빠른 분석을 대규모로 진행할 수 있도록 지원합니다. 또한 데이터 사일로를 제거하여 데이터 팀이 어떤 퍼블릭 클라우드 및 프라이빗 클라우드에서도 선택한 도구를 사용하여 동일한 데이터에 대해 협업을 진행할 수 있도록 지원합니다.
이러한 최신 데이터 아키텍처는 손쉬운 데이터 관리로 데이터 신뢰성을 제공합니다. 데이터를 이동하거나 잠그지 않고도 동일한 데이터에 대한 BI, AI, ML 및 스트리밍 분석을 실행합니다.
CDP(Cloudera Data Platform)는 세계 유일의 개방형 데이터 레이크하우스를 지원하며 다음과 같은 이점을 제공합니다.
개방형 아키텍처
Apache Iceberg가 지원하는 Cloudera의 데이터 레이크하우스는 오픈 소스 및 개방형 표준에 기반하여 완전히 개방되어 있어 여러 커뮤니티가 널리 도입하고 있습니다. 여러 데이터 형식을 저장할 수 있으며 다양한 엔진이 동일한 데이터에서 작동할 수 있도록 지원합니다.
도입 용이성
Cloudera는 Iceberg를 SDX(Shared Data Experience)에 바로 통합하여 레이크하우스를 배포하는 가장 쉬운 경로를 제공합니다. 스키마 진화, 숨은 파티션 등과 같은 추가 기능은 대규모 데이터세트의 데이터 관리를 더욱 단순화합니다.
멀티 클라우드
퍼블릭 클라우드 또는 자체 데이터 센터의 어느 곳에서나 레이크하우스를 구축할 수 있습니다. 한 번 구축하면 고민 없이 어디서나 실행 가능합니다. Cloudera는 모든 클라우드에서 완전한 이식성을 갖춘 데이터 서비스를 동일하게 제공합니다.
보안 및 관리 보장
CDP의 Iceberg 테이블은 SDX 내에서 통합되어 여러 클라우드에서 통합 보안, 세분화된 정책, 거버넌스, 계보, 메타데이터 관리 등이 가능하도록 지원하기 때문에 Cloudera가 모든 것을 처리하는 동안 사용자는 데이터 분석에 집중할 수 있습니다.
주요 구성 요소
개방형 레이크하우스를 통한 데이터의 강화