개요
어디에서나 일관된 정책으로 CDP를 안전하게 설계하는 SDX
Cloudera Data Platform 아키텍처의 핵심 요소인 SDX는 보안 및 거버넌스를 추가적 요소로 접근하는 다른 벤더들과는 차별화되어 있습니다. 컴퓨팅 및 스토리지 계층과 독립되어 있는 SDX는 메타데이터를 기반으로 구축되어 있는 통합된 보안 및 거버넌스 기술 세트를 제공하고, 퍼블릭 및 프라이빗 클라우드뿐만 아니라 모든 분석의 전반에 걸쳐 지속적인 컨텍스트를 지원합니다. 일관된 데이터 컨텍스트는 한번 정의되면 모든 곳에서 원활하게 적용되는 멀티 테넌트 데이터 액세스 모델을 통해 데이터 및 분석을 손쉽게 전달합니다.
SDX는 배포 전반에 일관된 데이터 컨텍스트를 제공하여 위험과 운영 비용을 낮추고 있습니다. IT는 보안과 거버넌스를 완벽하게 갖춘 데이터 레이크를 보다 빠르게 배포하여 더 많은 사용자가 보다 많은 데이터에 손상 없이 액세스할 수 있도록 지원합니다.
SDX가 가진 차별점, 메타데이터와 컨텍스트
SDX는 기존의 구조적 메타데이터를 넘어 운영적, 사회적, 비즈니스적 특성까지도 파악합니다. 컨텍스트는 데이터 액세스뿐만 아니라 그 사용에 대해 언제나 승인, 추적, 감사 등을 보장합니다.
사용사례
새로운 데이터의 신속한 온보딩
멀티 테넌트 데이터 정책 구성
데이터 액세스의 안전한 확장
규정의 준수
새로운 데이터의 신속한 온보딩
새로운 데이터를 자동으로 분류하고 특성화하여 기업 표준 및 규정 준수를 보장합니다.
정보를 이해하고 적합한 정책을 식별하는 데 시간이 소요되기 때문에 최종 사용자가 새로운 데이터를 최대한 빨리 사용할 수 있도록 지원하는 일은 쉽지 않습니다. Data Catalog는 데이터가 도착하면 이를 구분하고 분류하며, 이를 통해 Apache Ranger에서의 적합한 정책을 트리거하고 Apache Atlas에서 계보를 추적하여 규정 준수를 입증합니다.
SDX의 Data Catalog는 모든 데이터 자산을 관리 및 검색할 수 있도록 단일 창 보기를 제공합니다. 데이터는 운영적, 사회적, 비즈니스적 컨텍스트를 포함한 풍부한 메타데이터를 기반으로 프로파일링되고 강화되며 이를 통해 신뢰할 수 있고 재사용 가능한 데이터 자산을 생성하고 이를 검색할 수 있습니다.
세분화되고 동적이며 역할 및 속성에 기반한 보안 규칙을 표준화하고 원활하게 시행하여 멀티 테넌트 데이터 액세스를 손쉽게 생성, 관리 및 유지할 수 있습니다. 이러한 기능은 여러 그룹이 다양한 분석을 적용할 때 민감한 데이터에 대한 무단 액세스를 방지하여 비즈니스 위험과 보안 위험을 제거하고 규정 준수를 보장합니다.
데이터 분류, 계보, 모델링, 감사 등 통합된 플랫폼 전반의 운영을 기반으로 민감한 데이터를 식별 및 관리하고 규제 요구 사항을 효율적으로 해결할 수 있습니다. 모든 분석과 배포 전반에서 데이터 관리를 바탕으로 전체 데이터 라이프사이클 동안 그리고 수집에서 보관/제거에 이르기까지 규정 준수를 입증할 수 있습니다.
자원은 데이터가 네트워크를 통과할 때 이를 암호화하는 자동 TLS를 통해 Kerberos를 사용하도록 배포되고 자동으로 구성됩니다. 온프레미스와 클라우드 양쪽에 있는 저장 데이터는 엔터프라이즈급 암호화를 통해 보호되며 모범 사례라는 검증된 구성을 지원합니다.
SDX는 데이터뿐만 아니라 워크로드까지 지능적으로 이동시키는 기능을 통해 그리고 온프레미스 데이터 센터와 여러 퍼블릭 클라우드 간의 컨텍스트를 통해 인프라 독립성을 지원합니다. 워크로드 성능처럼 주요 메트릭으로부터 얻은 통찰력은 최적의 자원 활용을 위한 스마트 권장 사항을 제공하여 성능, 비용, 복원력 등을 균형 있게 유지합니다.
계획에 따른 보안
CDP에 표준으로 통합되는, 독보적인 SDX 보안 프레임워크
보안을 사후 사항이나 추가 사항으로 생각하는 다른 벤더들의 접근 방식과 달리 SDX 데이터 컨텍스트 아키텍처는 CDP의 보안을 보장합니다. 그렇기 때문에 조직은 새로운 데이터를 손상 없이 신속하게 사용할 수 있습니다. SDX는 데이터 레이크가 배포되고 데이터가 사용되는 즉시 포괄적인 보안을 제공합니다.
- ID: 멀티 테넌트 클러스터에 엔터프라이즈 사용자와 그룹 추가를 관리하여 관리 부담 경감
- 네트워크: 웹 인터페이스를 위해 Kerberos 기반 인증, TLS 연결 암호화, DNS 및 프록시 등을 설정하여 지속적으로 안전한 배포 보장
- 스토리지 암호화: 플랫폼 전반에 저장 데이터를 암호화하여 보안 향상과 위험 감소를 실현
- SSO: 서비스의 웹 UI에 대한 LDAP 기반 인증 및 권한을 통해 원활한 사용자 경험 제공
- 권한: 태그 기반 정책을 바탕으로 멀티 테넌트 클러스터에서 데이터 액세스를 관리하여 이를 안전하게 확대
- 계보 및 감사: 모든 배포(임시 또는 영구, 단일 또는 다중 사용자) 전반에서 지속적인 통합 감사 및 계보에 액세스하여 데이터 라이프사이클 전반에서 규정 준수
- 데이터 관리: 비즈니스 컨텍스트를 기반으로 데이터 세트를 검색, 프로파일링, 큐레이팅 및 태그 지정하여 신뢰할 수 있고 재사용 가능한 데이터 세트 구축