서브스크립션 없이도 이용 가능한 Fast Forward Labs 연구

앞으로 모든 신규 Report는 공개적으로 이용 가능하며 무료로 다운로드할 수 있습니다. 또한 기존 Report가 업데이트될 경우 신규 버전에 대한 액세스도 제공할 예정이니 무료로 이용 가능한 연구에 대해 자주 확인해 주세요.

무료로 제공되는 연구 Report

누구나 무료로 이용할 수 있는 최신 연구 Report와 프로토타입을 확인하세요. 

텍스트 스타일 변환

텍스트 스타일 변환(TST)의 NLP 작업 목표는 콘텐츠를 유지하면서 텍스트 조각의 스타일 속성을 자동으로 제어하는 것입니다. 이는 보다 사용자 중심적인 NLP를 만들기 위해 중요하게 고려해야 할 사항입니다. 본 Report에서는 적용된 사용 사례를 통한 텍스트 스타일의 변환, 즉 자유 텍스트에서의 주관성 편향 상쇄를 자세히 살펴봅니다. 그 과정에서 HuggingFace Transformers를 활용하는 시퀀스 투 시퀀스 모델링 접근 방식을 설명하고 모델 성능의 정량화를 위해 일련의 맞춤형이자 참조 없는 평가 메트릭을 제시합니다. 또한 프로토타입 Exploring Intelligent Writing Assistance를 중심으로 한 윤리를 논의하며 마무리합니다.

보고서 읽어보기
코드 살펴보기

텍스트 스타일 변환

레이블이 있는 데이터를 사용하지 않고 개념 중심을 연기하는 중

대상 도메인의 통계 특성이 시간에 따라 변경되어 모델 성능이 저하될 때 개념적 드리프트가 발생합니다. 구동 검출은 일반적으로, 관심의 성능 메트릭을 모니터링하고, 그 메트릭이 일부 지정된 임계값 아래로 떨어질 때 재교육 파이프라인을 트리거함으로써 달성된다. 그러나, 이러한 접근법은 충분한 라벨링된 데이터가 예측 시간에 이용가능하다고 가정한다 - 많은 생산 시스템들에 대한 비현실적인 제약조건. 이 보고서에서는 레이블이 있는 데이터에 쉽게 액세스할 수 없는 경우 개념 드리프트를 처리하기 위한 다양한 방법을 탐색합니다.

보고서 읽어보기
코드 살펴보기

 레이블이 있는 데이터를 사용하지 않고 개념 중심을 연기하는 중

다중 객체 하이퍼파라미터 최적화의 탐색

Cloudera는 예측 정확도, 회수, 정밀성 등 '일반적인 의심' 메트릭에 대한 머신 러닝 모델을 개발합니다. 그러나 이러한 메트릭이 엄밀하게 관심의 전부는 아닙니다. 프로덕션 모델은 대기시간이나 메모리 공간 또는 공정성 제약과 같은 물리적 요구 사항도 충족해야 합니다. 하이퍼파라미터 최적화는 최적화할 메트릭이 여러 개일 때 훨씬 더 어려워집니다. 본 최신 연구에서는 이러한 '다중 객체' 하이퍼파라미터 최적화 시나리오를 자세히 다루고 있습니다.

보고서 읽어보기
코드 살펴보기

다중 객체 하이퍼파라미터 최적화의 탐색

오프라인 서명 자동 검증을 위한 딥 러닝

수기 서명 검증은 진짜 서명과 위조 서명을 자동으로 구별하는 것이 목표이며 법률, 금융, 행정 등에서 신원 확인의 한 형태로서 수기 서명이 흔히 사용되기 때문에 이에 대한 검증은 특히 중요한 문제로 다뤄집니다. 본 연구 사이클에서는 기존 기법을 개선하기 위해 새로운 특징 추출 방법과 결합된 딥 메트릭 러닝 접근 방법(특히 샴 네트워크)의 사용을 다루고 있습니다.

보고서 읽어보기
코드 살펴보기

퓨샷 텍스트 분류

세션 기반 추천 시스템

추천 시스템은 온라인 소매, 음악 및 영상 스트리밍, 심지어 콘텐츠 발행 등에 대한 분야 전반에서 현대 생활의 초석이 되었습니다. 이러한 시스템을 통해 인터넷에서 방대한 양의 콘텐츠를 탐색할 수 있으며 그 과정에서 흥미롭거나 중요한 것을 발견할 수 있습니다. 지난 몇 년간 주요 트렌드로 자리 잡은 세션 기반 추천 알고리즘은 진행 중인 세션에서 사용자의 상호 작용만을 기반으로 추천을 제공하며 그 과정에서 사용자 프로필이나 전체적인 과거 선호도는 필요하지 않습니다.

보고서 읽어보기
코드 살펴보기

퓨샷 텍스트 분류

퓨샷 텍스트 분류

텍스트 분류는 감정 분석, 주제 지정, 문서 식별, 기사 추천 등에 사용할 수 있습니다. 현재 이와 같은 기본 작업 수행에 수십 가지 기술이 존재하지만 이 중 다수는 대량의 라벨링 된 데이터가 있어야만 사용할 수 있습니다. 사용 사례에 대한 주석 수집은 일반적으로 머신 러닝 애플리케이션에서 가장 많은 비용이 드는 부분 중 하나입니다. 본 Report에서는 잠재적 텍스트 임베딩이 학습 예제가 거의 없거나 아예 없는 상태에서 어떻게 사용될 수 있는지 그리고 이러한 방법을 구현하기 위해 모범 사례에 대한 통찰력을 어떻게 제공할 수 있는지 알아봅니다.

보고서 읽어보기
코드 살펴보기

퓨샷 텍스트 분류

구조적인 시계열

시계열 데이터는 어디에나 존재합니다. 본 Report는 일반화된 추가 모델을 검토하며, 이를 통해 시계열을 구조적인 구성 요소로 분해하여 모델링하는 간단하고 유연하며 해석 가능한 수단을 제공합니다. 시계열에 대한 곡선 맞춤 접근 방식이 가진 이점과 장단점을 살펴보고 수요 예측 문제에 대해 Facebook Prophet 라이브러리를 통해 사용 방법을 보여줍니다.

보고서 읽어보기
코드 살펴보기

메타 학습

인간의 학습 방식과 달리 딥 러닝 알고리즘은 방대한 양의 데이터와 컴퓨팅이 필요하지만 이를 일반화하는 데는 아직 어려움을 겪을 수도 있습니다. 인간은 새로운 문제에 직면했을 때 이전 경험에서 얻은 지식을 활용하기 때문에 빠른 적응력을 보여줍니다. 본 Report에서는 메타 학습이 데이터에서 습득한 이전 지식을 활용하여 테스트 시간 동안 새로운 문제를 신속하고 효율적으로 해결하는 방법을 설명합니다.

보고서 읽어보기
코드 살펴보기

자동 질문 응답

자동 질문 응답은 자연어를 사용하여 데이터에서 정보를 추출하는 사용자 친화적인 방법입니다. 최근 자연어 처리가 발전하면서 비정형 텍스트 데이터로부터의 질문 응답 기능이 빠르게 발전하였습니다. 본 블로그 시리즈에서는 엔드 투 엔드 질문 응답 시스템 구축의 기술적이고 실용적인 측면을 자세히 설명합니다.

인터랙티브 블로그 시리즈 읽어보기

머신 러닝의 인과 관계

인과 추론과 머신 러닝이 만나는 지점에 대한 연구가 활발히 진행되고 있으며 이를 통해 보다 강력하고 신뢰성 있으며 공정한 머신 러닝 시스템 구축이 가능해지고 있습니다. 본 Report에서는 인과 그래프, 불변 예측 등 인과 추론을 소개하고 다양한 사용 사례에 적용된 고전적인 머신 러닝 기술을 바탕으로 인과 추론 도구 적용 방법을 안내합니다.

보고서 읽어보기
프로토타입 살펴보기

Interpretability: 2020년 판

시스템이 결정을 내리는 이유와 방법을 설명하는 능력인 해석력을 통해 모델을 개선하고 규정을 지키며 더 나은 제품을 구축할 수 있습니다. 딥 러닝과 같은 블랙박스 기술은 해석력을 희생하여 혁신적인 기능을 제공해 왔습니다. SHAP와 같은 기술이 최근 추가된 이번 Report를 통해 기능이나 정확성을 그대로 유지하면서도 모델을 어떻게 해석하는지 그 방법을 확인할 수 있습니다.

보고서 보기

이상 감지를 위한 딥 러닝

무수히 많은 애플리케이션이 사기 행위 감지에서부터 이미지 데이터 이상 플래깅에 이르기까지 비정상 데이터를 자동으로 식별합니다. 이러한 식별 프로세스는 복잡한 대규모 데이터로 작업할 때 특히 까다로울 수 있습니다. 본 Report를 통해 이상 감지, 성능 벤치마크, 제품 가능성 등에 대한 딥 러닝 접근법(시퀀스 모델, VAE, GAN)을 확인할 수 있습니다.

보고서 읽어보기
프로토타입 살펴보기

Fast Forward Labs 이미지 분석을 위한 딥 러닝 - 2019년 판 Report 미리 보기

자연어 처리를 위한 변환 학습

딥 러닝을 사용하는 자연어 처리(NLP) 기술은 언어를 번역하고 질문에 답을 제공하며 인간이 작성한 것과 같은 텍스트를 생성할 수 있습니다. 그러나 이러한 딥 러닝 기술을 사용하려면 거대하고 값비싼 라벨링 된 데이터세트, 높은 비용의 인프라, 쉽지 않은 전문 지식 등이 필요합니다. 변환 학습은 언어에 대한 모델의 이해를 재사용하고 조정하여 이러한 제약을 극복합니다. 또한 모든 NLP 애플리케이션에 적합하게 맞습니다. 본 Report에서는 최소한의 자원으로 고성능 NLP 시스템을 구축하기 위한 변환 학습 사용 방법을 알려드립니다.

보고서 보기

Fast Forward Labs NLP 변환 학습 Report

제한적 레이블 데이터를 통한 학습

 제한적으로 라벨링 된 데이터를 통한 학습은 감독된 머신 러닝을 위해 라벨링 된 데이터의 엄격한 요구사항을 완화시킵니다. 본 Report에서는 스마트한 라벨링을 위해 기계와 인간의 협력에 의지하는 기법인 능동 학습을 중점적으로 다룹니다. 능동 학습을 통해 모델 훈련에 필요한 라벨링 된 예제의 수를 줄여서 시간과 비용을 절약하는 동시에 매우 많은 데이터로 훈련된 모델과 비슷한 성능을 얻을 수 있습니다. 엔터프라이즈는 능동 학습을 바탕으로 라벨링 되지 않은 대규모 데이터 풀을 활용하여 새로운 제품 가능성을 발견할 수 있습니다.

보고서 읽어보기
프로토타입 살펴보기

제한된 레이블 데이터를 사용한 빠른 포워드 랩 학습

통합 학습

통합 학습을 사용하면 학습 데이터에 직접 액세스하지 않고도 머신 러닝 시스템을 구축할 수 있습니다. 데이터는 원래 위치에 남아있기 때문에 개인 정보를 보호하고 통신 비용을 절감할 수 있습니다. 통합 학습은 스마트폰 및 엣지 하드웨어, 의료 서비스 및 기타 개인 정보에 민감한 사용 사례, 예측 유지보수와 같은 산업 애플리케이션 등에 적합합니다.

보고서 읽어보기
프로토타입 살펴보기

Fast Forward Labs 이미지 분석을 위한 딥 러닝 - 2019년 판 Report 미리 보기

시맨틱 추천

인터넷은 우리가 무엇을 읽고, 보고, 살 것인지에 대해 방대한 선택권을 제공하고 있습니다. 그렇기 때문에 특정 개인이 관심 있어 할 만한 항목을 찾아주는 추천 알고리즘이 그 어느 때보다도 중요합니다. 본 Report에서는 항목과 사용자의 시맨틱 콘텐츠를 사용하여 여러 산업에서 추천을 보다 풍부하게 제공하는 추천 시스템을 자세히 살펴봅니다.

보고서 보기

시맨틱 추천

요약

본 Report는 문서를 자동으로 요약하는 기능인 추출 요약 기법을 분석합니다. 이 기법은 수천 개의 제품 리뷰를 정제하는 기능, 긴 뉴스 기사 속에서 주요 내용을 추출하는 기능, 고객 약력을 페르소나로 자동 클러스터링하는 기능 등 다양한 애플리케이션을 보유하고 있습니다.

보고서 보기

Fast Forward Labs 이미지 분석을 위한 딥 러닝 - 2019년 판 Report 미리 보기

이미지 분석을 위한 딥 러닝 - 2019년 판

이미지에서 유의적인 특징과 개념을 학습하는 데 우수한 성능을 발휘한다는 점에서 컨볼루션 신경망(CNN 또는 ConvNets)은 의료 영상 처리부터 제조에 이르기까지 다양한 영역에서 문제를 해결하는 데 매우 중요합니다. 이번 보고서에서는 이미지 분석 작업에 적합한 딥 러닝 모델과 딥 러닝 모델의 디버깅 기법을 선택하는 방법에 대해서 알아보겠습니다.

보고서 읽어보기
프로토타입 살펴보기

Fast Forward Labs 이미지 분석을 위한 딥 러닝 - 2019년 판 Report 미리 보기

딥 러닝: 이미지 분석

딥 러닝의 역사와 현재 위치를 살펴보고 딥 러닝을 구현하는 방법에 대한 설명과 함께 미래 발전 방향을 예측해 봅니다.

보고서 보기

실시간 스트림에 대한 확률론적 방법

캠과 기어 기반의 아날로그 컴퓨터 시대 때부터 우리는 수행해야만 하는 중요한 계산과 데이터 플로를 중심으로 시스템을 엔지니어링 해왔습니다. 설계 철학이 일관성 있게 유지되는 동안 엔지니어링에 대한 제약은 지속적으로 진화하고 있습니다. 지난 5년간 'Big Data'의 출현 또는 범용 인프라의 사용 능력으로 매우 큰 데이터세트를 일괄적으로 분석할 수 있게 되었습니다. 현재는 실시간 데이터 스트림 작업에 사용할 수 있는 도구, 방법 그리고 기술에서 중요한 진전을 이루고 있습니다.

보고서 보기

서브스크립션 전용 Report

기존 Report의 업데이트 버전이 추후 무료로 제공될 예정이니 자주 확인해 주세요.

멀티태스크 러닝 Report 및 프로토타입 이미지

멀티태스크 러닝

이번 보고서에서는 멀티태스크 러닝을 주제로 알고리즘을 활용해 다수의 작업을 동시에 완수하도록 하는 새로운 머신 러닝 접근법에 대한 내용을 다루었습니다.

확률론적 프로그래밍

확률론적 프로그래밍과 베이지안 추론을 활용해 보다 효과적인 의사결정을 가능케 하는 예측 툴을 손쉽게 개발하는 방법을 알려 드립니다.

자연 언어 생성

머신 시스템을 활용해 고도로 구조화된 데이터를 인간 언어 내러티브로 변환하는 방법에 대해 알아봅니다.

Fast Forward Labs 블로그 포스트 읽기

 

미래를 향한 변화에 발을 맞추세요

Cloudera의 월간 뉴스레터를 구독하고 최신 AI 활용 사례 뿐만 아니라 당사의 새로운 소식과 이벤트 정보를 받아보세요.

 

연구 구독 관련 연락처

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.