Cloudera는 오픈 소스를 통해 전 세계에 Big Data의 가치를 알렸고 오픈 소스, 개방형 표준, 개방형 시장의 가치에 대한 강한 신념으로 차세대 혁신의 물결을 주도하고 있습니다.
오픈 소스 혁신
어떤 벤더는 오픈 소스 커뮤니티 활동을 소비하지만 또 어떤 벤더는 이를 주도합니다. Cloudera는 보안, 규모, 가용성을 충족하는 새로운 기능을 생성하고 촉진하며 지원함으로써 데이터, 분석, AI 플랫폼의 발전에 앞장서고 있습니다.
개방형 표준 큐레이션
Cloudera는 개방형 표준(Apache Iceberg, Apache Nifi, Apache Ozone 등)을 식별하고 발전시켜 지원해왔으며, 이를 기반으로 새로운 고객의 사용 사례에 바탕이 되는 장기적인 주류 아키텍처를 제공합니다.
까다로운 엔터프라이즈 요구 사항
Cloudera는 최상의 고객 경험을 제공하기 위해 출시 전 실제 워크로드에 대한 다차원 테스트에 상당한 자원을 투자하고, 업계 모범 사례와 규제 요건을 반영한 보안 정책을 구현 및 유지하며, 오픈 소스 커뮤니티에 광범위하게 참여하여 플랫폼을 지원합니다.
Apache Nifi 기반의
Cloudera Data Flow
Cloudera DataFlow는 Apache NiFi 기반의 클라우드 네이티브 데이터 서비스로, 데이터 이동에 대한 엔드 투 엔드 프로세스를 간소화하여 범용 데이터 배포를 지원합니다.
Apache Ozone 기반의
Cloudera Object Store
Cloudera Object Store는 데이터 센터에서 클라우드 네이티브 고밀도 객체 스토리지를 제공하며 Apache Ozone를 통해 대규모 데이터를 효율적으로 저장할 수 있도록 지원합니다.
Apache Iceberg 기반의
Cloudera Open Data Lakehouse
Cloudera Data Lakehouse는 업계 표준 개방형 테이블 형식인 Apache Iceberg를 기반으로 구축되어 어떤 규모에서도 높은 성능을 제공하고 가장 광범위한 컴퓨팅 엔진 에코시스템과 통합됩니다.
Cloudera는 오픈 소스 프로젝트와 오픈 소스 커뮤니티의 성공을 위해 오픈 소스 정신을 추구합니다.
200+
Apache 커미터 수
50+
PMC 위원직
>55
프로젝트 참여
오픈 소스 에코시스템
Cloudera 플랫폼은 오픈 소스 프로젝트 및 기술로 구성된 대규모 에코시스템을 활용하여 데이터, 분석, AI를 위한 진정한 하이브리드 플랫폼을 구현합니다. Cloudera는 엔터프라이즈 도입을 위해 오픈 소스 혁신을 창출하고 주도하며 지원해온 폭넓고 검증된 경험을 보유하고 있습니다.
Apache Accumulo
셀(cell) 기반 액세스 제어를 사용하는 정렬된 분산 키 값 저장소입니다.
Apache Airflow
데이터 엔지니어링 파이프라인을 위한 워크플로 관리 플랫폼입니다.
Apache Arrow
열 기반 데이터 처리 분석을 개발하기 위한 소프트웨어 프레임워크입니다.
Apache Atlas
메타데이터를 통해 민첩한 엔터프라이즈 규정 준수를 실현합니다.
Apache Avro
행 기반 원격 프로시저 호출 및 데이터 직렬화 프레임워크입니다.
Apache Calcite
데이터베이스 및 데이터 관리 시스템을 구축하기 위한 프레임워크입니다.
Apache Flink
Big Data 분석 및 애플리케이션을 위한 실시간 스트림 처리 프레임워크입니다.
ApacheHadoop
대규모 데이터 처리 작업을 위한 분산 저장 및 처리 프레임워크입니다.
Apache HBase
HDFS에서 실행되는 비관계형(NoSQL) 데이터베이스입니다.
Apache Hive
Hadoop의 SQL 쿼리에 대한 사실상의 표준입니다.
Apache Iceberg
대규모 분석을 위한 개방형 테이블 형식으로 SQL 테이블의 안정성과 단순성을 제공합니다.
Apache Impala
Apache Hadoop용 오픈소스 분석 MPP 데이터베이스로서 인사이트 확보 시간을 최소화합니다.
Apache Kafka
빠르고 확장 가능한 내결함성 메시징 시스템
Apache Knox Gateway
Hadoop 클러스터를 위한 안전한 진입점입니다.
Apache Kudu
빠르게 변화하는 데이터의 신속한 분석이 요구되는 사용 사례를 위한 저장소입니다.
Apache Livy
Spark 클러스터를 위한 REST 인터페이스입니다.
Apache Nifi
실시간 통합 데이터 물류 및 간단한 이벤트 처리 플랫폼입니다.
Apache Oozie
원본 데이터 저장소 및 데이터 처리 계층을 포함한 Enterprise Hadoop의 청사진입니다.
Apache Orc
읽기 작업에 최적화된 열 기반 데이터 스토리지입니다.
Apache Ozone
확장성이 뛰어난 분산형 객체 저장소로 S3 호환 API를 제공합니다.
Apache Parquet
WORM 작업에 최적화된 열 기반 데이터 스토리지입니다.
Apache Phoenix
Apache HBase를 사용하여 Hadoop용 OLTP를 지원하는 대규모 병렬 관계형 데이터베이스 엔진입니다.
Apache Ranger
Enterprise Hadoop을 위한 종합적인 보안을 제공합니다.
Apache Solr
Hadoop에서 신속한 인덱싱 및 검색을 구현합니다.
Apache Spark
Spark가 ETL, AI, 데이터 과학 워크로드를 위한 인메모리 컴퓨팅 기능을 Hadoop에 추가합니다.
Apache Sqoop
Apache Hadoop과 정형 데이터 저장소 사이에서 대량의 데이터를 효율적으로 전송합니다.
Apache Tez
Hadoop의 YARN 기반 데이터 처리 애플리케이션용 프레임워크입니다.
Apache YARN
Enterprise Hadoop의 아키텍처 센터입니다.
Apache Zeppelin
인터랙티브 데이터 분석을 지원하는 완전한 개방형 웹 기반 노트북입니다.
Apache ZooKeeper
분산 처리를 안정적으로 조정하는 오픈 소스 서버입니다.
Docker
OS 수준 가상화를 활용한 컨테이너화 기술입니다.
Hue
Data Warehouse를 위한 오픈 소스 SQL Workbench입니다.
TensorFlow
머신러닝 및 AI를 위한 소프트웨어 라이브러리입니다.
