Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

개요

모든 정형화 및 비정형화 미사용 데이터를 안전하게 저장, 처리 및 분석 

Hortonworks Data Platform(HDP)은 분산 스토리지 및 대규모 멀티 소스 데이터세트 처리를 위한 오픈소스 프레임워크입니다. HDP는고객의 IT 인프라를 현대화하고 클라우드 또는 온프레미스에서 데이터 보안을 유지하는 한편, 새로운 매출 흐름을 주도하고 고객 경험을 개선하며 비용을 제어할 수 있도록 지원합니다. 

HDP는 민첩한 애플리케이션 배포, 머신러닝 및 딥러닝 워크로드, 실시간 데이터 웨어하우징, 보안, 거버넌스를 지원합니다. 이는 미사용 데이터를 한 현대적 데이터 아키텍처의 핵심 구성요소입니다.

 

왜 HDP인가?

최신 버전의 HDP는 엔터프라이즈에서 민첩한 애플리케이션 배포, 새로운 머신러닝 및 딥러닝 워크로드, 실시간 데이터 웨어하우징 및 보안과 거버넌스가 가능할 수 있도록 새로운 기능을 선보입니다. 이는 현대적 데이터 아키텍처의 핵심 구성요소입니다.

HDP Diagram

주요 장점 및 기능

컨테이너 기반 서비스 덕분에 단 몇 분 안에 애플리케이션을 구축하고 배포할 수 있게 되었습니다. 컨테이너화를 통해 애플리케이션을 다양한 버전으로 실행할 수 있으며, 이로써 이전 버전에 지장을 주지 않고도 신속하게 새로운 기능을 생성하고 새로운 버전의 서비스를 개발 및 시험할 수 있습니다. HDP는 또한 도커 컨테이너 및 네이티브 YARN 컨테이너의 제3자 애플리케이션을 지원합니다. 이레이저코딩은 스토리지의 효율성을 50% 향상시킴으로써 효율적인 데이터 복제를 가능하게 하여 총 TCO가 감소됩니다.

HDP는 Apache Hadoop 클러스터에서 GPU를 지원할 수 있는 기반을 제공함으로써, 데이터 과학과 AI 사용사례에 필요한 연산 성능을 향상합니다. GPU 풀링이 경제성을 높이기 위해 더 많은 워크로드와 GPU 리소스를 공유할 수 있도록 지원합니다. 또한 GPU 분리를 지원한다는 것도 큰 이점입니다. 즉, GPU를 특정 애플리케이션 전용으로 지정하면 다른 애플리케이션이 해당 GPU에 접근할 수 없습니다.

HDP에는 딥러닝 모델을 쉽게 설계, 구축, 훈련하기 위하여 GPU 풀링과 결합된 컨테이너화된 TensorFlow 기술 미리보기가 포함되어 있습니다.

HDP를 사용하여 특정한 클라우드 아키텍처에 벤더 종속성 없이 빅데이터 워크로드를 하이브리드, 멀티 클라우드 환경에서 자유롭게 배치할 수 있습니다. 고객은 어떠한 클라우드 설정에서도 빅데이터 클러스터를 원활하게 생성하고 관리할 수 있습니다. HDP는 클라우드 종류에 관계없이 사용 가능하며, 빅데이터 배포를 단순화하기 위해 프로비저닝을 자동화하면서 클라우드 리소스의 사용을 최적화합니다.

클라우드 스토리지는 Microsoft ADLS, WASB, AWS S3, Google Cloud Storage를 포함한 방대한 양의 데이터를 네이티브 형식으로 저장할 수 있도록 지원합니다. Cloudbreak는 귀사가 선택한 클라우드 제공업체에 HDP를 배치하여 클라우드 내 클러스터를 손쉽게 프로비저닝할 수 도록 합니다

HDP는 빠른 쿼리에 집중할 수 있도록 쿼리 성능을 개선하였습니다. 가장 빠른 Apache Hive 엔진인 Hive LLAP는 리소스 경쟁을 유발하지 않으면서 멀티 테넌트 환경에서 실행됩니다. 이러한 통합 덕분에 조인(join) 쿼리 및 집계(aggregation) 쿼리 등 비즈니스 인텔리전스 시나리오에 흔히 사용되는 쿼리의 속도가 대폭 향상되었습니다. 쿼리 최적화 달성과 더불어 Hive를 통해 리소스 풀을 형성하여 세밀한 리소스 할당이 가능합니다.

HDP는 기본값으로 ACID 트랜잭션을 활성화함으로써, Hive 테이블에서 더욱 쉽게 업데이트하고 GDPR 요구사항을 지원할 수 있도록 합니다. 실시간 데이터베이스인 Hive는 낮은 지연과 높은 워크로드 처리량 사이의 성능 차이를 없애므로 데이터를 더 빠른 속도로 처리합니다

HDP는 포괄적인 보안 및 거버넌스를 꾸준히 제공합니다. HDP의 보안은 여러 계층에 통합되어 있으며 인증, 승인, 책임, 데이터 보호 기능을 포함하고 있습니다. 보안과 거버넌스의 통합으로 보안 전문가는 분류 기반 보안 정책을 수립할 수 있습니다. 또한, 데이터 거버넌스 툴은 데이터 분류를 에코시스템 전반에 일관되게 적용할 수 있는 능력을 조직에 부여합니다.

추가 기능을 통해 더욱 정밀하고 상세하게 이벤트를 감사할 수 있으므로, 감사관의 업무가 한결 수월해집니다. 감사관과 사용자는 데이터가 에코시스템을 통과해서 이동할 때 데이터가 안전하게 보호되는 것을 확인할 수 있습니다. 태그 전파를 통해 감사관과 사용자는 엔터프라이즈 전반에서 데이터가 어디로 향하는지 확인하고 민감한 데이터의 컨텍스트를 보유할 수 있습니다. 시간 기반 정책을 통해 특정 사용자에게 일시 접근권을 제공할 수 있습니다.

Data Hub는 모든 환경에서 단일 창으로 모든 서비스를 손쉽게 관리, 모니터링 및 오케스트레이션할 수 있도록 해줍니다.

데이터 중심 엔터프라이즈의 성장 동력

데이터시트

Hortonworks Data Platform

분석 보고서

The Forrester WaveTM: Cloud Hadoop/Spark Platforms, 2019년 1분기 보고서

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.