ClouderaNOW AI 에이전트, 클라우드 버스팅 및 AI용 데이터 패브릭 소개 | 4월 8일

지금 등록하기
  • Cloudera Cloudera
  • 클라우데라에 문의하기
    | 비즈니스

    데이터 계보 자동화로 투명성을 확보하고 신뢰를 구축하는 방법

    Zinette Ezra headshot

    오늘날 데이터 중심의 환경에서 데이터는 조직의 가장 귀중한 자산입니다. 하지만 많은 기업들이 복잡하고 끊임없이 변화하는 환경 속에서 신뢰할 수 있는 데이터를 유지하는 데 어려움을 겪고 있습니다. 특히 데이터 전략과 운영을 책임지는 경영진에게 이 문제는 매우 중요합니다. 

    이 글에서는 “HealthCo”라는 건강 서비스 기업의 사례를 통해 자동화된 데이터 계보가 어떻게 이러한 어려움을 기회로 바꿀 수 있는지 살펴보겠습니다.

    데이터 전략

    여느 미래 지향적인 기업들처럼 HealthCo의 경영진은 데이터가 단순한 귀중한 자산을 넘어 전략적 필수 요건이라는 사실을 일찍이 인식했습니다. 경영진은 데이터를 비즈니스의 최우선 과제로 삼아 의사결정 과정, 제품 및 서비스 전반에 통합했습니다. 이를 통해 혁신을 촉진하고 운영을 최적화하며 환자 치료의 질을 향상시키고자 했습니다. 

    HealthCo는 데이터 인프라에 적극 투자하고 유능한 데이터 과학자와 분석가를 고용해 팀을 구성했습니다. 그들의 목표는 환자의 요구 사항을 예측하는 예측 분석 모델, 환자 치료 최적화 도구, 운영 효율성 대시보드와 같은 정교한 데이터 제품을 개발하는 것이었습니다. 이러한 데이터 제품은 환자 치료 결과를 개선하고 병원 운영을 효율화하며 의사결정을 위한 실행 가능한 인사이트를 제공하기 위해 활용되었습니다. 

    이와 같은 전략적 선택은 데이터 팀, 인프라, 관리, 과학 분야에 대한 투자를 늘리는 근거가 되었습니다. HealthCo의 팀은 데이터 제품에서 더 많은 가치를 창출할수록 데이터 역량에 더 많이 투자하여 이를 더욱 강화할 수 있는 선순환 구조를 기대했습니다.

    문제: 분산되고 일관성 없는 데이터

    HealthCo는 전략적 비전에도 불구하고 비즈니스 확장 과정에서 심각한 문제에 직면하게 되었습니다. 그 중 가장 큰 장애물은 데이터 에코시스템의 복잡성이었습니다. HealthCo의 데이터 팀은 SQL Server, Oracle 데이터베이스, Informatica 등 다양한 소스를 관리하고 있었습니다. 또한 사용 중인 BI 도구도 Power BI, Tableau, MicroStrategy, Qlik 등 매우 다양했습니다. 이처럼 복잡하게 얽힌 플랫폼들은 통합과 관리에 큰 부담을 안겼습니다.

    HealthCo의 하이브리드 데이터 환경은 유연성과 고급 도구에 대한 액세스를 제공했지만, 동시에 심각한 통합 문제를 초래했습니다. 각 시스템마다 프로토콜과 데이터 처리 방식이 달라 단일한 데이터 뷰를 구성하기가 어려웠습니다. 예를 들어, Oracle 데이터베이스의 환자 데이터를 Power BI의 운영 지표와 통합하려 했지만 명확한 데이터 계보가 없어 많은 시행착오를 겪었습니다. 부서마다 데이터를 개별적으로 관리하면서 사일로가 생기고, 이로 인해 데이터 간 불일치가 발생했습니다. 그 결과 환자 치료 데이터가 재무 기록과 일치하지 않는 등의 문제가 생겼고, 상충되는 인사이트는 정확한 의사결정을 방해하는 요인이 되었습니다.

    데이터 간 불일치가 심화되면서 데이터의 정확성에 대한 불신도 커졌습니다. 의사결정자들은 데이터 기반 인사이트에 의존하는 것을 주저했고, 잠재적 오류로 인한 피해를 우려했습니다. 정확성에 대한 우려와 환자 치료에 미칠 수 있는 부정적 영향 때문에 환자 재입원 예측 모델 등 새로운 데이터 제품의 배포가 지연되었습니다. 보건 의료 규제를 준수하는 일도 쉽지 않은 과제가 되었습니다. 데이터 계보를 명확히 추적할 수 없어 감사 과정에서 규제 준수를 입증하기가 어려웠기 때문입니다. 이로 인해 법적 리스크가 커졌고, 조직의 평판 또한 위협받게 되었습니다. 

    데이터에 대한 불신은 조직의 실행력을 떨어뜨렸습니다. 데이터 기반 프로젝트가 가져올 뛰어난 이점에도 불구하고 HealthCo는 의료진이나 환자에게 데이터를 기반으로 한 제품을 직접 제공하는 것을 주저했습니다. 데이터 오류로 인한 리스크가 크다고 판단했기 때문입니다. 이러한 불확신으로 인해 HealthCo는 데이터에 대한 투자를 충분히 활용하지 못했고, 결과적으로 환자 치료 수준을 향상시킬 수 있는 기회도 놓치게 되었습니다.

    해결책: 자동화된 데이터 계보

    자동화된 데이터 계보는 이러한 문제들을 해결했고 시스템 전반에서 데이터 흐름에 대한 포괄적인 엔드투엔드 가시성을 제공했습니다. HealthCo의 이해관계자들은 데이터가 소스에서 출발해 다양한 변환 과정을 거쳐 최종 목적지에 이르는 과정을 직접 확인할 수 있게 되었습니다. 이러한 가시성은 데이터 품질 문제를 신속하게 식별하고 수정할 수 있게 해주며, 일관되고 신뢰할 수 있는 인사이트를 확보하는 데 필수적이었습니다. HealthCo는 데이터 계보를 체계적으로 구축함으로써 데이터 사일로를 해소하고, 데이터 관리에 대한 통합적인 접근 방식을 마련했습니다. 그 결과, 조직 전반의 통합성과 일관성이 강화되었습니다. 예를 들어, 운영 효율성 지표를 환자 치료 결과와 직접 연계할 수 있게 되어, 이전에는 얻기 어려웠던 종합적인 관점을 확보할 수 있었습니다.

    정확한 데이터 계보는 의사결정자들 간의 신뢰를 회복시켰습니다. HealthCo의 경영진은 데이터의 이동 경로가 체계적으로 기록되고 신뢰할 수 있음을 알고, 데이터 기반 인사이트를 자신 있게 활용할 수 있었습니다. 이러한 신뢰는 경영진이 부정확성에 대한 우려 없이 새로운 데이터 제품을 배포할 수 있도록 하여, 혁신과 운영 효율의 향상을 이끌었습니다. 

    또한 자동화된 데이터 계보 덕분에 데이터 프로세스를 더 쉽게 추적하고 의료 규정 준수를 입증할 수 있게 되었습니다. HealthCo는 감사 과정에서 데이터가 어떻게 처리되고 가공되었는지를 명확하게 제시할 수 있었으며, 이를 통해 규정 위반으로 인한 처벌 위험을 줄일 수 있었습니다. 이는 법적으로 조직을 보호했을 뿐 아니라, 높은 수준의 데이터 거버넌스를 유지하겠다는 의지를 강화하는 계기가 되었습니다.

    HealthCo는 자동화되고 다차원적인 데이터 계보를 도입함으로써 하이브리드 시스템 전반에서 일관되고 신뢰할 수 있는 데이터 환경을 유지할 수 있었습니다. 데이터 계보 문제가 해결되자 데이터 무결성과 신뢰성이 확보되어 데이터 제품을 보다 안정적으로 지원할 수 있었습니다. 신뢰할 수 있는 데이터 흐름을 기반으로 구축된 예측 분석 모델의 정확성이 향상되었고, 환자 치료 최적화 도구는 여러 소스로부터 일관되고 통합된 데이터를 불러와 보다 효과적인 치료 계획을 수립할 수 있었습니다. 또한 운영 효율성 대시보드는 병원 운영에 대한 정확한 인사이트를 실시간으로 제공하여, 의사결정의 질을 높였습니다.

    Cloudera Octopai Data Lineage로 가장 신뢰할 수 있는  데이터 자산 구축

    Cloudera Octopai Data Lineage 는 바로 이런 상황에서 탁월한 성능을 발휘합니다. Cloudera의 메타데이터 관리 솔루션은 복잡한 하이브리드 데이터 환경과 원활히 통합되는 자동화된 다차원 매핑 기능을 통해 데이터 계보를 손쉽게 관리할 수 있도록 지원합니다. Cloudera Octopai Data Lineage는 dbt, Informatica, Talend, SSIS, 맞춤형 SQL 스크립트 같은 전용 도구에서 수행되는 변환 프로세스에 대한 심층 가시성을 제공하며, 이러한 외부 변환 워크플로를 자동으로 매핑하고 분석하여 이해 가능하고, 추적 가능하며, 관리 가능한 형태로 제공합니다. 

    Cloudera Octopai Data Lineage 작업 공간은 조직이 온프레미스부터 멀티 클라우드 환경까지 전체 데이터 자산에서 데이터를 검색하고 이해하며, 관리하고 신뢰할 수 있도록 단일 창을 제공합니다. 이 솔루션은 데이터 전문가, 비즈니스 사용자, 데이터 스튜어드가 데이터를 분석과 AI에 자신 있게 활용할 수 있도록 설계되었으며, 조직이 데이터 정확성을 유지하고 신뢰를 회복하며 혁신을 추진할 수 있도록 지원합니다. 또한 데이터 전략과 운영 현실 사이의 격차를 해소하여 데이터를 신뢰할 수 있는 전략적 자산으로 전환함으로써 조직의 성공을 견인합니다.

    데이터 전략과 운영을 책임지는 경영진에게 복잡한 데이터 에코시스템 속에서 데이터 신뢰성과 규정 준수를 확보하는 것은 중대한 과제입니다. 자동화된 데이터 계보는 이러한 과제를 해결하는 데 필수적이며, Cloudera의 솔루션은 이를 실현 가능하고 효율적으로 관리할 수 있도록 지원합니다. 조직은 자동화된 데이터 계보를 통해 데이터의 잠재력을 최대한 활용하여 성공을 견인하는 강력한 자산으로 변환할 수 있습니다.

    Cloudera Octopai Data Lineage가 기업 데이터의 완전한 추적성을 구현하고 신뢰를 구축하는 과정을 직접 확인하고 싶다면, 데모를 예약하세요!

    시작할 준비가 되셨나요?

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.