주요 리소스
새 소식
2017년 1월 6일 - Cloudera Director, Microsoft Active Directory(AD DS, AD CS, AD DNS), SAMBA 및 SSSD를 사용하여 퍼블릭 클라우드에서 워크로드를 위한 EDH 클러스터 배포 방법을 알아봅니다.
HDFS DataNode Scanners 및 Disk Checker 설명
2016년 12월 20일 - 많은 사람들이 알고 있듯이 HDFS의 데이터는 DataNodes에 저장되며, HDFS는 다수의 DataNodes에 같은 데이터를 복제하여 DataNode 장애를 견뎌냅니다. 하지만 일부 DataNodes 디스크에 장애가 발생한다면 정확히 어떤 일이 발생할까요?
방법: Cloudera Director로 Sparklyr 환경 자동화
2016년 12월 15일 - Sparklyr에는 Spark로 연결되는 dplyr 인터페이스가 있어서 사용자는 Spark MLlib과 H2O Sparkling Water의 중요한 머신 러닝 알고리즘을 활용할 수 있습니다. 그 덕분에 R 사용자는 큰 무리 없이 빅데이터용 도구로 Spark를 사용할 수 있고, R 워크로드를 Hadoop으로 마이그레이션하는 데 유용하게 활용합니다.
- RStudio 컨퍼런스
2017년 1월 11-14일 | 플로리다주 키시미 - Spark Summit East
2017년 2월 7-9일 | 매사추세츠주 보스턴 - Open Data Science Conference
2017년 3월 1-2일 | 캘리포니아주 샌프란시스코 - Strata + Hadoop World
2017년 3월 13-16일 | 캘리포니아주 산호세 - Apache: 빅데이터
2017년 5월 16-18일 | 플로리다주 마이애미 - Strata + Hadoop World London
2017년 5월 23-25일 | 영국 런던 - Spark Summit East
2017년 6월 5-8일 | 캘리포니아주 샌프란시스코