새로운 Cloudera 연구: 엔터프라이즈 AI 및 최신 데이터 아키텍처의 현황

보고서 보기
개요

모든 데이터를 어디서나 의미 있는 비즈니스 통찰력으로 손쉽게 변환

IT는 CDP Data Warehouse를 통해 클라우드 네이티브 셀프서비스 분석 경험을 BI 분석 전문가에게 전달할 수 있으며 이를 통해 몇 분 만에 0에서 쿼리로 전환됩니다. CDP Data Warehouse는 정형과 비정형을 비롯한 모든 크기 및 유형의 데이터에서 다른 Data Warehouse보다 뛰어난 성능을 자랑하면서도 페타바이트 이상으로 비용 효율적으로 확장합니다. 

CDP(Cloudera Data Platform)에서 실행되는 Data Warehouse는 스트리밍, 데이터 엔지니어링머신 러닝 분석과 완전한 통합을 이룹니다. 또한 프라이빗, 멀티 퍼블릭 및 하이브리드 클라우드에 있는 모든 데이터와 메타데이터에 대한 거버넌스를 보호하고 제공하는 일관된 프레임워크를 가지고 있습니다.

사용사례

  • 클라우드 데이터 Report 및 대시보드
  • 데이터에 대한 즉각적인 액세스
  • Data Warehouse 최적화
  • 운영 및 이벤트 분석
  • 연구 및 검색 분석

클라우드 데이터 Report 및 대시보드 


짧은 시간 안에 클라우드 Data Warehouse를 구축하세요.

Data Warehouse를 손쉽게 스핀업하여 이미 클라우드에 있는 데이터를 신속하게 사용하고 AWS 및 Azure 객체 스토리지에 연결하여 쿼리를 시작합니다. 클라우드로 버스트라는 고유 기능을 통해 데이터와 컨텍스트(보안, 계보, 거버넌스)를 데이터 센터에서 즉시 쿼리할 수 있는 선택된 퍼블릭 클라우드 버킷으로 이동시킵니다.

 

IQVIA: 예측 정확도 4배 상승을 통한 검색 속도의 가속화

1백만 초 미만의 쿼리가 2PB 데이터 세트에서 실행됩니다.

사례 연구 읽어보기

데이터에 대한 즉각적인 액세스


어디에서나 모든 데이터에 대한 셀프서비스 액세스

사용자는 프라이빗 또는 퍼블릭 클라우드에서 Data Warehouse를 프로비저닝하고 데이터 세트를 식별하며 중앙 IT로부터 독립된 시각화를 생성할 수 있습니다. Cloudera Data Warehouse는 필요에 따라 자동적으로 확장 또는 축소되어 검증된 가격 대비 성능의 혜택을 제공하기 때문에 예산을 초과하지 않을 수 있습니다.

IQVIA: 예측 정확도 4배 상승을 통한 검색 속도의 가속화

1백만 초 미만의 쿼리가 2PB 데이터 세트에서 실행됩니다.

사례 연구 읽어보기

Data Warehouse 최적화


최신 데이터 웨어하우징을 통한 통찰력 향상

까다로운 워크로드 전체 또는 일부를 기존 데이터 웨어하우스에서 Cloudera Data Warehouse로 마이그레이션합니다. 효율적이면서 경제적인 방식으로 새로운 데이터 유형에서 구축된 사용 사례를 배포하고 신규 사용자의 유입을 수용합니다. Impala, HIVE LLAP, Hive on Tez와 같이 엄격한 테스트를 거친 오픈 소스 엔진과 Hue, Observability 등의 도구는 정형 및 비정형 데이터에 대한 유연하고 빠른 분석을 동시에 대규모로 제공합니다.

IQVIA: 예측 정확도 4배 상승을 통한 검색 속도의 가속화

1백만 초 미만의 쿼리가 2PB 데이터 세트에서 실행됩니다.

사례 연구 읽어보기

운영 및 이벤트 분석


대량의 이벤트와 시계열 데이터 분석

기존 Data Warehouse에서는 엣지의 기기 로그, 센서 및 기타 장치 등에서 비롯되는 대량 이벤트와 시계열 데이터를 분석하는 것이 거의 불가능합니다. Apache Kudu와 Druid에 구축된 CDP Data Warehouse는 Cloudera DataFlow와 결합되어 성능, 확장성, 사용 용이성에서 혁신을 제공하여 빠르게 변화하는 데이터의 새로운 현실에 대한 문제를 셀프서비스 분석을 통해 해결합니다.

데이터시트 보기

IQVIA: 예측 정확도 4배 상승을 통한 검색 속도의 가속화

1백만 초 미만의 쿼리가 2PB 데이터 세트에서 실행됩니다.

사례 연구 읽어보기

연구 및 검색 분석


많은 양의 비정형 데이터와 관계형 데이터의 상관관계

고품질 예측을 위해서는 대량의 비정형, 반정형, 텍스트, 관계형 데이터에서 새로운 상관관계, 패턴, 통찰력 등을 발견할 수 있어야 합니다. 전체 텍스트 검색을 위한 Solr와 함께 CDP Data Warehouse와 CDP Machine Learning 은 보다 정확한 예측을 위해 모든  데이터 소스에서 통찰력을 확보합니다.

IQVIA: 예측 정확도 4배 상승을 통한 검색 속도의 가속화

1백만 초 미만의 쿼리가 2PB 데이터 세트에서 실행됩니다.

사례 연구 읽어보기

CDP Data Warehouse 주요 기능

Data Warehouse를 빠르게 실행하여 직관적인 데이터 카탈로그에서 쉽게 발견되는 데이터세트에 대한 분석을 시작할 수 있습니다. 템플릿 기반 배포를 통해 Data Warehouse를 손쉽게 프로비저닝하며 자동 확장 및 자동 일시 중지를 통한 자동 관리로 이를 관리할 수 있습니다. 

쿼리 응답 시간을 1초 미만으로 단축시켜주는 Impala , Hive LLAP 등 고성능 SQL 엔진을 사용하여 방대한 양의 데이터로부터 즉각적인 통찰력을 얻을 수 있으며, 이러한 데이터는 150PB 및 그 이상의 데이터세트로 프로덕션에서 입증되었습니다. 워크로드 격리와 최적화를 통해 수백 명의 사용자와 수천 건의 사용 사례를 개방하여 모든 사용자가 동일 데이터에서 다른 사용자를 방해하지 않고도 작업을 수행할 수 있습니다. 

기기 로그, 이벤트 스트림, IoT 센서, 미디어, 감정 데이터 등 반정형 및 비정형 데이터 유형으로 기존 데이터세트를 확장할 수 있습니다. 모든 데이터를 단일 데이터 카탈로그로 즉시 사용할 수 있으며 대시보드 및 Report뿐만 아니라 애드혹 및 탐색적 분석에 액세스할 수 있습니다. 

Data Visualization, Hue, Observability 등 도구 모음으로 데이터세트를 손쉽게 탐색, 시각화, 쿼리할 수 있을 뿐만 아니라 최대 효율성을 위해 워크로드 상태를 최적화할 수 있습니다. 

Large Language Models와 자연어의 강력한 기능을 활용하여 쿼리 및 분석을 강화하세요. 이를 통해 코드 검토에서 코드 완성과 코드 설명에 이르는 모든 작업을 수행할 수 있습니다.

Cloudera Data Visualization의 AI Assistant를 통해 Large Language Models와 자연어를 활용하여 인터랙티브 대시보드를 쉽고 빠르게 구축하고 비즈니스 전반에 통찰력을 즉시 공유합니다.

조금 더 자세히 살펴볼까요?


Cloudera Data Platform에서 Data Warehouse를 직접 경험해 보세요

Forrester 보고서 썸네일

엔드 투 엔드 데이터 레이크하우스를 통한 AI의 사용으로 데이터 라이프사이클 효율성 향상

Ebook

최신 Data Warehouse가 직면한 세 가지 주요 문제점

Video

지능형 셀프서비스 보고의 기본적인 지원

Whitepaper

9sight Consulting | Data Warehouse의 수명

Datasheet

SmartOffload: Data Warehouse를 Cloudera로 마이그레이션

세계적인 수준의 교육, 지원 및 서비스

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.