Apache Zeppelin

대화형 데이터 분석을 지원하는 완전한 개방형 웹 기반 노트북

새롭게 선보이는 다목적 웹 기반 노트북 Apache Zeppelin은 Hadoop과 Spark에 데이터 수집, 데이터 탐색, 시각화, 공유 및 협업 기능을 제공합니다.

Zeppelin가 수행하는 작업

대화형 브라우저 기반 노트북을 통해 데이터 엔지니어, 데이터 분석가 및 데이터 과학자는 명령줄 참조나 클러스터 세부 정보 없이도 데이터 코드를 개발, 구성, 실행 및 공유하고 결과를 시각화함으로써 생산성을 높일 수 있습니다. 이 사용자들은 노트북을 사용하여 긴 워크플로를 실행할 뿐만 아니라 대화식으로 작업할 수 있습니다.  Spark를 사용할 수 있는 노트북은 많습니다. iPython의 경우 데이터 과학용 노트북 중에서도 성숙하고 성능이 우수한 제품입니다.   Hortonworks Gallery 는 고객이 Hadoop 클러스터에서 신속하게 iPython을 설정 할 수 있도록 Ambari 스택 정의를 제공합니다.  

Apache Zeppelin은  Spark에 데이터 탐색, 시각화, 공유 및 협업 기능을 제공하는 새로 출시될 웹 기반 노트북입니다.   Python만이 아니라 Scala, Hive, SparkSQL, Shell, Markdown과 같이 나날이 증가하는 프로그래밍 언어도 지원합니다.

zeppelin_medical

 Zeppelin 언어 인터프리터 덕분에 다양한 언어 지원이 가능합니다.  

데이터 검색, 탐색, 보고 및 시각화는 데이터 과학 워크플로의 핵심 구성요소입니다.  Zeppelin은 기본적으로 Spark와 Hive를 지원하는 "첨단 데이터 과학 스튜디오"를 제공하며,  계속 증가하는 데이터 소스 에코시스템을 지원하는 여러 언어 백엔드를 지원하고 있기도 합니다.  Zeppelin은 데이터 과학자가 원하는 데이터를 작은 단위로 나누어 이해를 높이는 대화형 환경을 제공합니다. Hortonworks Gallery에서  Zeppelin 노트북 컬렉션을 만나보세요.


또한 노트북에서 작업을 마치고 공유할 인사이트를 찾아 손쉽게 보고서를 곧바로 작성하고 인쇄나 전송을 실행할 수 있습니다.

zeppelinReport

Cloudera는 Spark와 Hadoop이 완벽한 조합이라고 믿습니다.   더불어 Zeppelin가 데이터 과학 솔루션을 가속화하는 핵심 구성요소라고 생각합니다.

 

웹 기반 노트북의 최신 개선 사항

노트북에서도 데이터 랭글링 프로세스는 여전히 까다로운 작업입니다. 데이터 과학자는 흔히 기능 엔지니어링, 알고리즘 선택, 조정, 다른 사용자와의 작업 공유, 작업의 프로덕션 배포에 어려움을 겪습니다.

Cloudera는 커뮤니티를 통해 Zeppelin 노트북을 개선하기 위해 노력하고 있습니다. Zeppelin에 Hive Interpreter를 추가했고, 편집기가 보다 안정적으로 작동할 수 있도록 개선 작업을 진행하고 있습니다.  저희 Cloudera는 보안, 요약 통계, 상황에 맞는 도움말 등의 기능을 제공하여 데이터 개발 환경의 질을 높이기 위해 Zppelin 커뮤니티 참여를 더욱 심화하고 있습니다.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.