Cloudera, Octopai의 데이터 계보 및 카탈로그 플랫폼 인수 공지 읽기
전체 데이터 자산에 대한 신뢰 구축 및 완전한 제어
Cloudera Octopai Data Lineage는 유일한 SaaS 기반 솔루션으로서 클라우드, 온프레미스, 하이브리드 데이터 환경의 가장 복잡한 구조를 즉시 자동으로 탐색합니다.
모든 데이터 소스, ETL 프로세스, 스크립트, BI 보고서를 수동 태깅 없이 자동으로 수집하여 완전한 최신 계보 그래프를 제공합니다.
기술 데이터 팀과 비즈니스 사용자가 단 몇 초 만에 문제의 원인을 역추적하거나 예정된 변경 사항의 영향을 평가할 수 있도록 지원합니다.
IT 및 비즈니스 사용자에게 인터랙티브 계보 다이어그램, 감사 추적 기록, 데이터 품질 지표를 제공하여 거버넌스 및 규정 준수 감사를 위한 증거를 제공합니다.
메타데이터, 스크립트, 코드, 종속성을 수동 작업 없이 신속하게 수집하여 전체 데이터 스택의 효율성을 개선하고 위험을 줄입니다.
변환, 종속성, 관계를 분석하여 시스템 전반의 데이터 흐름을 매핑하며, 이 모든 작업을 자동으로 수행합니다.
사용자가 직관적인 검색, 풍부한 메타데이터, 맥락 기반 통찰력을 활용하여 데이터를 보다 빠르게 찾고 신뢰할 수 있도록 지원합니다.
시각화 내에서 다양한 소스의 데이터 유형을 결합하여 복합적인 시맨틱 계층을 생성하고, 비즈니스 로직 또는 필터를 통합하거나, 다른 시각화 애플리케이션의 데이터를 통합할 수 있습니다.
온프레미스, 클라우드, 하이브리드 시스템을 지원하며 시스템 간, 시스템 내, 그리고 세분화된 계보까지 완벽하게 제공합니다.
추론된 관계로 공백을 메우고 컨텍스트 메타데이터로 계보를 강화하여 탁월한 가시성을 확보합니다.
모든 데이터 플로에 대한 전례 없는 가시성 확보
Cloudera Octopai Data Lineage는 60개 이상의 네이티브 통합과 범용 커넥터를 통한 비네이티브 시스템 지원을 기반으로, 자동화된 데이터 계보 솔루션 중 가장 폭넓은 범위를 제공합니다.
데이터 팀이 Cloudera Octopai Data Lineage를 통해 성과를 내는 방법
시간을 절약하고 데이터 팀 전반에 신뢰를 구축하세요.
50%
데이터 플로 추적에 매주 5시간 이상을 소비합니다.
75%
는 보고서 오류의 원인을 찾는 데 최대 몇 주가 소요됩니다.
90%
의 수동 작업이 영향 분석 수행 시 절감되었습니다.
출처: Dataversity and Octopai Survey, 2023
기술 사용자의 경우
데이터베이스, ETL 작업, BI 결과물 전반의 종속성을 자동으로 수집하고 시각화하여, 데이터 이동의 엔드 투 엔드 뷰를 제공합니다. 이를 통해 엔지니어는 다음을 수행할 수 있습니다.
- 단 몇 초 만에 오류나 병목 현상 추적
- 중복 프로세스 및 데이터 사본 제거
- 파이프라인 전반에 일관된 품질 규칙 적용
- 신규 데이터 제품의 제공 가속화
- 규정 준수를 위한 전체 감사 추적 보존
비즈니스 사용자의 경우
계보 기반 대시보드를 통해 비기술적 이해관계자도 다음을 수행할 수 있도록 지원하며, 이를 바탕으로 기업 전반에서 보다 빠르고 정확한 의사결정을 내릴 수 있습니다.
- 가시성을 제공하여 수치를 신뢰할 수 있도록 지원
- '블랙박스' 우려 해소
- 주요 지표를 근본 데이터 소스까지 추적
- KPI 변동에 기여하는 상위 요인 조사
