개요

단일 플랫폼에서의 데이터 레이크 유연성과 Data Warehouse 성능

Open Data Lakehouse는 조직이 정형 및 비정형의 모든 데이터에 대해 빠른 분석을 대규모로 진행할 수 있도록 지원합니다. 또한 데이터 사일로를 제거하여 데이터 팀이 어떤 퍼블릭 클라우드 및 프라이빗 클라우드에서도 선택한 도구를 사용하여 동일한 데이터에 대해 협업을 진행할 수 있도록 지원합니다.

이러한 최신 데이터 아키텍처는 손쉬운 데이터 관리로 데이터 신뢰성을 제공합니다.  데이터를 이동하거나 잠그지 않고도 동일한 데이터에 대한 BI, AI, ML 및 스트리밍  분석을 실행합니다.

CDP(Cloudera Data Platform)는 세계 유일의 개방형 데이터 레이크하우스를 지원하며 다음과 같은 이점을 제공합니다.

개방형 아키텍처

Apache Iceberg가 지원하는 Cloudera의 데이터 레이크하우스는 오픈 소스 및 개방형 표준에 기반하여 완전히 개방되어 있어 여러 커뮤니티가 널리 도입하고 있습니다. 여러 데이터 형식을 저장할 수 있으며 다양한 엔진이 동일한 데이터에서 작동할 수 있도록 지원합니다.

도입 용이성

Cloudera는 Iceberg를 SDX(Shared Data Experience)에 바로 통합하여 레이크하우스를 배포하는 가장 쉬운 경로를 제공합니다. 스키마 진화, 숨은 파티션 등과 같은 추가 기능은 대규모 데이터세트의 데이터 관리를 더욱 단순화합니다.

멀티 클라우드

퍼블릭 클라우드 또는 자체 데이터 센터의 어느 곳에서나 레이크하우스를 구축할 수 있습니다. 한 번 구축하면 고민 없이 어디서나 실행 가능합니다. Cloudera는 모든 클라우드에서 완전한 이식성을 갖춘 데이터 서비스를 동일하게 제공합니다.

보안 및 관리 보장

CDP의 Iceberg 테이블은 SDX 내에서 통합되어 여러 클라우드에서 통합 보안, 세분화된 정책, 거버넌스, 계보, 메타데이터 관리 등이 가능하도록 지원하기 때문에 Cloudera가 모든 것을 처리하는 동안 사용자는 데이터 분석에 집중할 수 있습니다.

주요 구성 요소
 

개방형 레이크하우스를 통한 데이터의 강화


다기능 분석

Cloudera Data Platform은 데이터 레이크하우스에서 AI, ML, BI, 스트리밍 분석, 데이터 엔지니어링을 실행할 수 있도록 모든 범위의 데이터 서비스를 제공합니다. 수집과 스트리밍에서 처리와 지속성, 조정, 검색, 액세스에 이르기까지 강력하고 확장 가능한 데이터 서비스는 주요 분석 기능을 제공합니다. 원하는 도구도 가져올 수 있습니다.


다기능 분석

Cloudera Data Platform은 데이터 레이크하우스에서 AI, ML, BI, 스트리밍 분석, 데이터 엔지니어링을 실행할 수 있도록 모든 범위의 데이터 서비스를 제공합니다. 수집과 스트리밍에서 처리와 지속성, 조정, 검색, 액세스에 이르기까지 강력하고 확장 가능한 데이터 서비스는 주요 분석 기능을 제공합니다. 원하는 도구도 가져올 수 있습니다.

 

 


개방형 테이블 형식, Apache Iceberg

Apache Iceberg는 개방형 레이크하우스의 핵심 빌딩 블록입니다. 대규모 분석 테이블을 위한 고성능 개방형 테이블 형식으로, SQL 테이블의 신뢰성을 Big Data에 제공하며 여러 컴퓨팅 엔진이 동시에 작동할 수 있도록 지원합니다. 타임 트래블, 스냅샷 격리, 스키마 진화, 숨은 파티셔닝 등과 같은 풍부한 기능을 제공합니다.


개방형 테이블 형식, Apache Iceberg

Apache Iceberg는 개방형 레이크하우스의 핵심 빌딩 블록입니다. 대규모 분석 테이블을 위한 고성능 개방형 테이블 형식으로, SQL 테이블의 신뢰성을 Big Data에 제공하며 여러 컴퓨팅 엔진이 동시에 작동할 수 있도록 지원합니다. 타임 트래블, 스냅샷 격리, 스키마 진화, 숨은 파티셔닝 등과 같은 풍부한 기능을 제공합니다.

 

 


SDX(Shared Data Experience)

SDX는 CDP의 기본 요소로서 메타데이터를 기반으로 구축된 통합 보안 및 거버넌스 기술을 제공합니다. 또한 장소에 관계없이 모든 인프라의 데이터 및 분석에서 완전한 데이터 관리를 제공하여 리스크와 운영 비용을 감소시킵니다. IT는 보안과 거버넌스를 완벽하게 갖춘 데이터 레이크하우스를 보다 빠르게 배포하여 더 많은 사용자가 보다 많은 데이터에 손상 없이 액세스할 수 있도록 지원합니다.


SDX(Shared Data Experience)

SDX는 CDP의 기본 요소로서 메타데이터를 기반으로 구축된 통합 보안 및 거버넌스 기술을 제공합니다. 또한 장소에 관계없이 모든 인프라의 데이터 및 분석에서 완전한 데이터 관리를 제공하여 리스크와 운영 비용을 감소시킵니다. IT는 보안과 거버넌스를 완벽하게 갖춘 데이터 레이크하우스를 보다 빠르게 배포하여 더 많은 사용자가 보다 많은 데이터에 손상 없이 액세스할 수 있도록 지원합니다.

 

 


강력한 Data Catalog

Cloudera Data Catalog를 통해 모든 인프라에서 장소에 관계없이 데이터의 검색, 정리 및 태그 지정을 수행하고 이에 대한 통찰력을 창출합니다. 

  • 모든 데이터의 검색, 보기 및 액세스가 한 곳에서 가능 

  • 데이터와 데이터 사용에 대한 이해, 문서화 및 모니터링

  • 완벽한 인사이트로 데이터를 책임감 있게 공유하고 협업


강력한 Data Catalog

Cloudera Data Catalog를 통해 모든 인프라에서 장소에 관계없이 데이터의 검색, 정리 및 태그 지정을 수행하고 이에 대한 통찰력을 창출합니다. 

  • 모든 데이터의 검색, 보기 및 액세스가 한 곳에서 가능 

  • 데이터와 데이터 사용에 대한 이해, 문서화 및 모니터링

  • 완벽한 인사이트로 데이터를 책임감 있게 공유하고 협업

 

 

 

 

Hello Fresh 로고

NEW YORKER: 패션 트렌트 파악과 재고 부족 감소를 위해 데이터 통찰력을 활용합니다. 데이터 레이크하우스는 글로벌 소매기업 NEW YORKER가 보다 발전된 매장 내 경험을 위해 고객의 요구 사항을 예측할 수 있도록 지원합니다.

 

"Cloudera Data Platform의 평판, 신뢰성, 확장성, 속도, 우수한 고객 지원 등이 선택에 큰 영향을 미쳤습니다."

—Steffen Minz, NEW YORKER 데이터 과학 책임자

Hello Fresh 로고

NEW YORKER: 패션 트렌트 파악과 재고 부족 감소를 위해 데이터 통찰력을 활용합니다. 데이터 레이크하우스는 글로벌 소매기업 NEW YORKER가 보다 발전된 매장 내 경험을 위해 고객의 요구 사항을 예측할 수 있도록 지원합니다.

 

"Cloudera Data Platform의 평판, 신뢰성, 확장성, 속도, 우수한 고객 지원 등이 선택에 큰 영향을 미쳤습니다."

—Steffen Minz, NEW YORKER 데이터 과학 책임자

자원
 

장소에 관계없이 데이터 관리에 대한 통찰력 창출

Webinar

여러분의 데이터 레이크하우스는 정말로 개방되어 있습니까?

Whitepaper

데이터 아키텍처 시리즈: 개방형 데이터 레이크하우스

세계적인 수준의 교육, 지원 및 서비스

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.