IQVIA logo
1백만 개의 쿼리 실행

주요 사항

Category

  • 생명 과학
  • 의료

본사

본사: Durham, North Carolina, USA

주요 솔루션

  • 최신 데이터 플랫폼: Cloudera Enterprise
  • 워크로드: Data Warehouse, Data Science, Data Engineering
  • 핵심 구성 요소: Apache Kudu, Apache Impala, Apache Spark, Cloudera Data Science Workbench, Cloudera Director, Cloudera Navigator
  • BI 및 분석 도구: Tableau, MicroStrategy

적용 분야

  • BI
  • 머신 러닝
  • 예측 분석

데이터 소스

  • 처방 데이터
  • 전자 의료 기록
  • 청구 기록
  • 판매 데이터
  • 소셜 데이터
  • 유전자 데이터

임팩트

  • 며칠에서 몇 초로 단축된 쿼리 응답 시간
  • 임상 시험 참가자의 신속한 식별을 통한 개발 비용 절감 및 혁신 가속화
  • 증상 발현 전 환자의 임상 시험 적격 여부를 예측하는 능력 4배 향상
  • 비용 절감, 진료 접근성 제고, 정밀 의학 제공 등을 위한 의료 산업 혁신 계획

빅데이터 규모

  • 2PB

IQVIA는 생명 과학 산업에 고급 분석, 기술 솔루션, 계약 연구 서비스 등을 제공하는 글로벌 기업입니다. IMS Health와 Quintiles의 합병으로 탄생한 IQVIA는 신약의 임상 개발 및 상업화를 촉진시키고 혁신을 가속화하며 보다 효과적인 치료 결과로 이어지는 연구를 신속하게 진행할 수 있도록 기업을 지원합니다.

문제점 

의료 비용 절감, 진료 접근성 제고, 신약 공급 등을 위한 많은 작업이 전 세계적으로 진행되고 있습니다. 그러나 이러한 진행이 신속하게 이루어지지 못하기도 합니다.

IQVIA 경영진은 데이터와 분석을 통해 현재 상황을 개선하고 있습니다.

IQVIA의 글로벌 Data Warehouse 이사인 Navdeep Alam은 "우리 사회는 의료 혁신을 위해 지난 수십 년 동안 노력해 왔지만 그 노력이 성과로 이어지지 못하고 있음을 TV에서 쉽게 볼 수 있습니다. 그래서 데이터 기반 접근 방법을 사용해 의료에 대한 생각을 달리해보면 어떨까 자문하기 시작하였습니다."라고 말합니다.

혁신을 추진하기 위해 IQVIA 직원들은 데이터를 훨씬 더 빠르게 탐색하고 반복해야 했습니다. 그러나 데이터가 Oracle, Netezza, Teradata를 비롯한 250여 개의 데이터 웨어하우스에 분산되어 있어 다양한 장애물에 직면하였습니다. 분석을 위해 사일로에서 단일 시스템으로 데이터를 복사하는 데 며칠이 소요되었습니다. 성능과 확장성의 제약으로 인해 원하는 유형의 분석을 수행하지 못하는 경우도 많았습니다.

"기존 접근 방식은 더 큰일을 완수하는 데 제약이 많았습니다. IQVIA는 모든 데이터의 통합과 데이터에 대한 분석 제공이라는 두 가지 목표에만 집중하였습니다."라고 Navdeep Alam은 덧붙였습니다.

솔루션 

IQVIA는 Cloudera 기반의 최신 데이터 플랫폼을 구축하여 BI 전문가, 데이터 과학자, 통계학자 등이 비용 절감, 신속한 신약 공급, 환자 결과 개선 등을 위해 새롭고 창의적인 솔루션을 도출할 수 있도록 지원합니다. 사용자는 고성능 셀프서비스 분석을 수행하고 훨씬 큰 데이터 세트를 사용하는 예측 알고리즘을 개발하며 보다 깊이 있고 정확한 통찰력을 위해 포괄적인 익명 환자 통찰력을 활용할 수 있습니다.

"IQVIA에서는 총 1,500~2,000명가량으로 이루어진 70개 팀이 이 플랫폼을 사용하여 차세대 임상 개발 전략 수립에서 알츠하이머 연구를 위한 새로운 알고리즘 구축에 이르기까지 데이터로 매우 특별한 일들을 하고 있습니다."라고 Navdeep Alam은 말합니다.

이 플랫폼은 IQVIA의 전 세계 250개 데이터 웨어하우스로부터 2페타바이트 이상의 데이터를 수집하며 직원들은 플랫폼에서 소셜 미디어 데이터와 같이 새로운 데이터 유형을 통합할 수 있습니다.

또한 IQVIA는 빠른 쿼리 성능을 위해 데이터에 밀접한 분석을 수행합니다. 사용자는 이미 익숙한 BI 도구를 사용하여 플랫폼에서 수백만 건의 쿼리를 실행하고 있습니다. 데이터 과학자는 Cloudera Data Science Workbench에서 R, Python, Scala를 사용하여 새로운 머신 러닝 알고리즘의 개발에 협력하고 이를 가속화할 수 있습니다.

실행 

작업 과정에서 동일한 데이터를 필요로 하는 경우가 빈번했기 때문에 IQVIA는 암호화, 거버넌스, 역할 기반 액세스 등을 위해 공유 데이터 경험을 사용하여 글로벌 멀티 테넌트 데이터 레이크를 생성하고자 하였습니다.

"Cloudera의 기술 덕분에 IQVIA는 미국 데이터 레이크, 스페인 데이터 레이크, 프랑스 데이터 레이크, 일본 데이터 레이크라는 4개의 데이터 테넌트를 구축하였습니다. 하나의 시스템에서 이 모든 것을 수행하고 이를 전 세계적으로 중앙에서 관리하여 효율성을 크게 증가시켰습니다."라고 Navdeep Alam은 말합니다.

IQVIA는 고객에게 직접적으로 분석 서비스를 안전하게 제공하기 위해 궁극적으로 하이브리드 클라우드 환경을 구축할 예정입니다. “Cloudera Director를 통해 퍼블릭 클라우드에서 자매 테넌트를 구축하여 필요할 때 IQVIA 데이터와 고객의 데이터가 만날 수 있는 장소를 제공할 것입니다."라고 덧붙였습니다.

결과

IQVIA는 수십억 명의 삶을 변화시키는 시작점에 서 있다고 생각합니다.

-Navdeep Alam, IQVIA 글로벌 Data Warehouse 이사

오늘날 IQVIA는 며칠, 몇 주, 몇 달이 아닌 단 몇 초 만에 데이터로부터 고객을 위한 통찰력을 이끌어낼 수 있습니다. 생활 과학 기업은 이처럼 큰 성능 향상을 통해 발 빠른 혁신으로 생명을 구할 수 있습니다.

신약 개발 라이프사이클에 미치는 영향을 고려합니다.

"이전까지 제약 회사가 예산 부족 문제로 두 가지 신약 중 하나만을 선택해 연구해야 하는 상황에 직면했을 때 시장에서의 잠재적 필요성을 평가하는 데 질문의 복잡성에 따라 며칠, 몇 주 심지어는 몇 달까지도 소요되었습니다. 그러나 이제는 100만 명에게 이익이 되는 약과 10,000명 정도만 혜택을 보는 약을 단 몇 초 만에 구분해 낼 수 있습니다."라고 Navdeep Alam은 말합니다.

신약 개발이 일단 진행되면 기업은 IQVIA 분석을 통해 임상 시험에 적합한 환자를 몇 주나 몇 달이 아닌, 몇 초나 몇 분 만에 식별할 수 있습니다. 또한 증상이 발현하기 전에 환자가 임상 시험에 적격한지 여부를 예측할 수 있는 능력도 4배 향상시켜 환자가 보다 빠르게 임상 시험에 접근할 수 있습니다. 

"기업은 적합한 대상자를 미리 신속하게 식별하여 신약 비용과 시장 출시 시간을 줄여 주요 의약품을 시장에 보다 빠르게 그리고 훨씬 저렴하게 공급할 수 있습니다."라고 덧붙였습니다.