개요
단일 플랫폼에서의 데이터 레이크 유연성과 Data Warehouse 성능
개방형 데이터 레이크하우스는 조직이 대규모의 정형 및 비정형 데이터를 비롯한 모든 데이터에 대해 신속하게 분석을 진행할 수 있도록 지원합니다. 또한 데이터 사일로를 제거하여 데이터 팀이 모든 퍼블릭 클라우드 및 프라이빗 클라우드에서 선택한 도구를 사용하여 동일한 데이터로 협업을 진행할 수 있도록 지원합니다.
이러한 최신 데이터 아키텍처는 손쉬운 데이터 관리로 데이터 안정성을 제공합니다. 데이터를 이동하거나 잠그지 않고도 동일한 데이터에 대한 BI, AI, ML 및 스트리밍 분석을 실행합니다.

Cloudera는 세계 유일의 개방형 데이터 레이크하우스를 지원하며 다음과 같은 혜택을 제공합니다.
개방형 아키텍처
Apache Iceberg 로 구동되는 Cloudera 데이터 레이크하우스는 오픈 소스 및 개방형 표준에 기반하며 폭넓은 커뮤니티를 채택하여 완전히 개방되어 있습니다. 여러 데이터 형식을 저장할 수 있으며 다양한 엔진이 동일한 데이터에서 작동할 수 있도록 지원합니다.
도입 용이성
Cloudera는 Iceberg를 Shared Data Experience(SDX)에 바로 통합하여 레이크하우스를 배포하는 가장 쉬운 경로를 제공합니다. 스키마 진화, 숨겨진 파티션 등과 같은 추가 기능은 대규모 데이터세트의 데이터 관리를 더욱 단순화합니다.
멀티 클라우드
퍼블릭 클라우드, 자체 데이터 센터 등 어디서나 데이터 레이크하우스를 구축할 수 있습니다. 한 번 구축하면 어디서나 문제없이 실행 가능합니다. Cloudera는 모든 클라우드에서 완전한 이식성을 갖춘 데이터 서비스를 동일하게 제공합니다.
보안 및 관리 보장
Cloudera의 Iceberg 테이블은 SDX 내에서 통합되어 여러 클라우드에서 통합 보안, 세분화된 정책, 거버넌스, 계보, 메타데이터 관리 등이 가능하도록 지원하기 때문에 Cloudera가 모든 것을 처리하는 동안 사용자는 데이터 분석에 집중할 수 있습니다.
Cloudera Open Data Lakehouse를 이제 프라이빗 클라우드에서도 사용할 수 있습니다. 세부 정보 보기
엔드 투 엔드 데이터 레이크하우스를 통한 AI의 사용으로 데이터 라이프사이클 효율성 향상
주요 구성 요소
개방형 레이크하우스를 통한 데이터의 강화
다기능 분석
Cloudera는 데이터 레이크하우스에서 AI, ML, BI, 스트리밍 분석, 데이터 엔지니어링을 실행할 수 있도록 모든 범위의 데이터 서비스를 제공합니다. 강력하고 확장 가능한 데이터 서비스는 수집과 스트리밍에서 처리 및 지속성, 조정, 검색, 액세스에 이르기까지 주요 분석 기능을 제공합니다. 원하는 도구도 가져올 수 있습니다.
개방형 테이블 형식, Apache Iceberg
Apache Iceberg는 개방형 레이크하우스의 핵심 빌딩 블록입니다. 대규모 분석 테이블을 위한 고성능 개방형 테이블 형식으로, SQL 테이블의 신뢰성을 Big Data에 제공하며 여러 컴퓨팅 엔진이 동시에 작동할 수 있도록 지원합니다. 타임 트래블, 스냅샷 격리, 스키마 진화, 숨은 파티셔닝 등과 같은 풍부한 기능을 제공합니다.
SDX(Shared Data Experience)
SDX는 Cloudera의 기본 요소로서 메타데이터를 기반으로 구축된 통합 보안 및 거버넌스 기술을 제공합니다. 또한 어디서나 모든 인프라의 데이터와 분석에서 완전한 데이터 관리를 제공하여 위험과 운영 비용을 감소시킵니다. IT 부서는 보안과 거버넌스를 완벽하게 갖춘 데이터 레이크하우스를 보다 빠르게 배포하여 더 많은 사용자가 보다 많은 데이터에 손상 없이 액세스할 수 있도록 지원합니다.
강력한 Data Catalog
Cloudera Data Catalog를 통해 모든 인프라에서 장소에 관계없이 데이터의 검색, 정리 및 태그 지정을 수행하고 이에 대한 통찰력을 창출합니다.
- 데이터와 데이터 사용에 대한 이해, 문서화 및 모니터링
- 관련 데이터에 대한 규정 및 표준 준수
- 조직 및 기술 데이터 보호 조치 이행
- 완벽한 인사이트로 데이터를 책임감 있게 공유하고 협업