데이터 이동 문제 해결을 통한 데이터 운영 가속화
Cloudera DataFlow는 Apache NiFi 기반의 클라우드 네이티브 데이터 서비스로, 데이터 이동에 대한 엔드 투 엔드 프로세스를 간소화하여 범용 데이터 배포를 지원합니다.
450개 이상의 애그노스틱 커넥터를 통해 하이브리드 환경 전반에서 모든 구조의 데이터를 모든 소스에서 모든 대상으로 원활하게 이동합니다.
간소화된 아키텍처로 효율성을 극대화하여 데이터 종속을 방지하고 도구 확산 및 중복 데이터 이동을 감소시킵니다.
데이터 파이프라인 라이프사이클의 모든 단계에서 노 코드 개발자 셀프서비스를 지원하여 한 단계 높은 민첩성을 제공합니다.
퍼블릭 클라우드 탄력성의 활용을 통한 확장 가능형 데이터 파이프라인의 신속한 구축과 배포
Cloudera DataFlow는 자동 확장 기능을 갖춘 클라우드 네이티브 데이터 서비스로서 제공되어 비용을 최소화하는 동시에 성능을 향상시킵니다.
사용 사례
최적의 효율성을 바탕으로 비즈니스 크리티컬 데이터를 실시간 전송합니다.
-
개방형 데이터 레이크하우스를 위한 스트리밍 수집
스트리밍 소스에서 데이터를 수집하여 효율적인 저장소와 엔터프라이즈 액세스를 제공합니다.
-
생성형 AI 파이프라인
멀티모달 데이터를 활성화하고 실시간 컨텍스트를 추가하여 생성형 AI 결과물을 구체적이고 안정적으로 만들 수 있습니다.
-
실시간 가시성
운영 시 상황 인식과 반응 시간을 개선합니다.
-
개방형 데이터 레이크하우스를 위한 스트리밍 수집
스트리밍 소스에서 데이터를 수집하여 효율적인 저장소와 엔터프라이즈 액세스를 제공합니다.
-
생성형 AI 파이프라인
멀티모달 데이터를 활성화하고 실시간 컨텍스트를 추가하여 생성형 AI 결과물을 구체적이고 안정적으로 만들 수 있습니다.
-
실시간 가시성
운영 시 상황 인식과 반응 시간을 개선합니다.
유연한 배포 옵션으로 어디서나 모든 데이터를 사용
Cloudera Public Cloud
퍼블릭 클라우드에서 Cloudera의 일부분으로서 DataFlow를 배포하여 간소화된 관리와 탄력성의 혜택을 누립니다.
Cloudera Private Cloud
프라이빗 클라우드에서 Cloudera의 일부분으로서 DataFlow를 배포하여 대기 시간을 최소화하고 데이터 및 자원에 대한 제어를 극대화합니다.
Kubernetes Operator
DataFlow-Kubernetes Operator는 Kubernetes 클러스터에 독립적으로 배포되어 가치 실현 시간을 단축시킵니다.
기능과 장점
Cloudera DataFlow는 데이터 파이프라인 개발 및 배포에 대한 엔드 투 엔드 프로세스를 간소화합니다.
운영 가시성을 개선하고 중요한 이벤트에 선세적으로 대응합니다.
- 모든 시스템 또는 장치에서의 데이터 수집
- 분석을 위해 데이터에 액세스할 수 있도록 모든 파일 유형 처리
- 모든 사용자 또는 대상 시스템에 실시간 제공
ReadyFlows를 통한 빠른 시작과 DataFlow Catalog로의 신속한 게시
- ReadyFlows의 일반 사용 사례에 대한 최소한의 구성을 통해 사전 정의된 데이터 플로를 신속하게 배포
- 한 번의 작성으로 어디서나 배포할 수 있는 기능을 통해 비즈니스 성과를 빠르게 달성
- 비즈니스 및 데이터 요구 사항의 변화에 따른 손쉬운 버전 관리
DataFlow Functions를 비롯한 클라우드 최적화 배포 옵션
- 서버리스, 효율성, 비용 최적화 및 확장성. 모든 이벤트 기반 사용 사례에 대한 NiFi 플로 실행
- AWS Lambda, Azure Functions, Google Cloud Functions를 사용하여 실시간에 가까운 파일 처리
- HTTPS 요청으로 트리거되는 마이크로서비스 구축을 위한 손쉬운 노 코드 UI
중앙 제어 창에서의 편리한 KPI 모니터링
- 실행 위치에 관계없이 단일 대시보드로 모든 NiFI 플로 배포를 모니터링
- 플로 배포에 대한 KPI 경고 정의를 통해 중요한 플로 성능 메트릭을 추적
- 동적 확장으로 성능 유지 및 최적의 효율성으로 SLA 충족
범용 연결성
데이터 스트림, 데이터베이스, 데이터 레이크, 엔터프라이즈 애플리케이션 등 전용 커넥터를 통해 온프레미스 또는 클라우드의 모든 시스템에 범용적으로 연결하고 HTTP, Syslog, UDP, TCP 등 업계 표준 프로토콜을 활용합니다.
주요 커넥터
Apache Iceberg
데이터 레이크 및 데이터 웨어하우스
Apache Kafka
데이터 스트림
Delta Lake
데이터 레이크 및 데이터 웨어하우스
Google BigQuery
데이터 레이크 및 데이터 웨어하우스
MongoDB
데이터베이스
Salesforce
엔터프라이즈 애플리케이션
Snowflake
데이터 레이크 및 데이터 웨어하우스
Milvus
생성형 AI
고객
DataFlow는 산업 전반에서 실질적인 가치를 창출합니다.
블로그
Empower Your Cyber Defenders with Real-Time Analytics
What Makes Data-in-Motion Architectures a Must-Have for the Modern Enterprise
Resilience in Action: How Cloudera’s Platform, and Data in Motion Solutions, Stayed Strong Amid the CrowdStrike Outage
시작할 준비가 되셨나요?