의료 AI: 환자 인사이트를 도출하는 신뢰할 수 있는 데이터 파이프라인 구축

7 분 읽기 • 작성자: Rameez Chatni

AI 의료 및 생명 과학

어느 산업에서든 데이터가 부족하다고 말하는 IT 리더를 찾기는 어렵습니다. 데이터는 거의 모든 기업이 충분히 보유하고 있는 자산입니다. 오늘날의 경쟁 환경에서 병목이 발생하는 이유는 데이터의 양이 부족해서가 아니라 신뢰할 수 있고 실제로 활용 가능한 데이터가 부족하기 때문입니다. 이로 인해 많은 기업은 AI 성공이라는 목표에 도달하기도 전에 추진 과정에서 차질을 겪고 있습니다.

의료 분야에서 AI 논의는 흔히 AI를 통해 환자 인사이트를 어떻게 얻을 것인가에 집중됩니다. 그러나 현실은 훨씬 더 복잡합니다. AI가 이미 강력한 환자 인사이트를 도출할 수 있음을 보여주고 있지만, 신뢰할 수 없는 데이터 파이프라인은 이러한 인사이트를 위험하게 만들거나 활용할 수 없게 만듭니다. 핵심 데이터는 전자의무기록(EHR), 검사실, 영상 촬영, 보험 청구 시스템 전반에 흩어져 있습니다. 이러한 시스템은 여전히 분절되어 있고 서로 연동되지 않아 환자 정보를 종합적으로 파악하기 어렵습니다. 이 때문에 임상의와 분석가는 환자에 대한 완전한 이해 없이 의사결정을 내려야 하는 경우가 많으며 이는 진료 품질과 AI의 효과를 모두 떨어뜨립니다.

규제 압력 역시 규정 준수 비용을 높이고 있습니다. 또한 부실한 데이터 거버넌스로 인해 임상의가 신뢰하기 어려운 결과가 생성되면서 많은 의료 AI 모델이 여전히 파일럿 단계에 머물러 있습니다. 신뢰할 수 있고 거버넌스가 적용된 데이터 파이프라인이 임상 현장에서 실제로 활용 가능한 의료 AI의 기반이 되는 이유가 여기에 있습니다. 궁극적으로 이러한 파이프라인은 조직이 임상의가 AI를 통해 실제로 활용할 수 있는 환자 인사이트를 얼마나 성공적으로 확보할 수 있는지를 좌우합니다.

데이터 혼돈에서 신뢰할 수 있는 데이터 파이프라인으로

의료 데이터는 한곳에 모여 있지 않으며, 엄격한 규제 요건을 고려하면 앞으로도 하나의 위치로 통합되기는 어려울 것입니다. 실제로 많은 조직은 하이브리드 방식을 채택해 중앙화할 수 있는 데이터는 중앙화하면서 EHR과 영상 플랫폼처럼 가치가 높은 시스템은 기존 위치에 그대로 유지합니다. 이러한 시스템은 대량의 쿼리를 처리하도록 설계되어 있지 않으며 대부분 자유롭게 액세스하기도 어렵기 때문에 모든 데이터를 완전히 통합하는 방식은 현실적인 선택지가 되기 어렵습니다.

엔드투엔드 데이터 파이프라인은 의료 데이터를 한곳에 머물러 있거나 뒤늦게 활용되는 데이터가 아니라, 지속적으로 흐르고 실제로 활용 가능한 데이터로 바꿔줍니다. 하지만 파이프라인의 각 단계가 실제 병목을 해결하지 못한다면 이러한 변화도 실질적인 가치로 이어지기 어렵습니다. 최신 파이프라인은 주기적인 배치 업로드에 의존하지 않고, EHR 트랜잭션, 검사 결과, 보험 청구 피드, 커넥티드 의료기기에서 데이터가 생성되는 즉시 이를 수집합니다. 이를 통해 환자 상태 변화와 같은 이벤트가 발생한 시점부터 다운스트림 시스템에서 이를 확인할 수 있게 되는 시점까지의 지연을 줄일 수 있습니다. 임상 환경에서는 이러한 지연이 개입 시점과 환자 결과에 직접적인 영향을 미칩니다.

의료 분야에서 데이터 불일치가 발생하는 가장 큰 원인 중 하나는 병렬적인 데이터 준비입니다. 즉 여러 팀이 같은 데이터를 서로 다른 목적에 맞게 각각 재구성하기 때문입니다. 엔드투엔드 파이프라인은 데이터가 모델에 도달하기 전 단계에서 공통된 표준과 품질 검사를 적용합니다. 이를 통해 의료 AI 모델에 사용되는 데이터의 기준을 맞추고, 조직이 신뢰하는 동일한 데이터에 기반해 모델을 학습시킬 수 있습니다.

또한 엔드투엔드 데이터 파이프라인은 인사이트를 운영 및 임상 워크플로에 거의 실시간으로 직접 제공합니다. 인사이트는 의사결정이 이루어지는 현장에 제공될 때 비로소 가치를 창출합니다. 생성형 AI와 에이전트 기반 AI의 도입이 확대될수록 이러한 역량은 더욱 중요해집니다. 두 유형의 AI 모두 필요한 순간에 적절한 임상 컨텍스트를 제공할 수 있어야 성능을 제대로 발휘할 수 있기 때문입니다. 하지만 데이터가 분절된 실제 의료 환경에서는 효과적으로 통제된 데모 환경에 비해 이를 구현하는 작업이 훨씬 더 복잡합니다. 성숙한 파이프라인은 결과를 별도의 분석 도구로 보내는 대신 기존 시스템에 통합하므로 임상의가 필요한 정보를 따로 찾아볼 필요가 없습니다. 해당 정보는 진료가 이루어지는 바로 그 순간에 맥락에 맞게 제시되어 의사결정에 영향을 줄 수 있습니다.

신뢰할 수 있는 의료 AI를 뒷받침하는 거버넌스

의료 분야에서 거버넌스는 그동안 혁신을 가로막는 요소로 여겨지는 경우가 많았지만 실제로는 그 반대임이 입증되고 있습니다. 명확한 데이터 계보가 없다면 의료 AI의 결과물은 임상의와 규제기관 모두의 신뢰를 얻기 어렵습니다. 특히 감사 가능성과 HIPAA 규정 준수가 중요한 경우에는 더욱 그렇습니다.

미래를 내다보는 조직들은 거버넌스를 데이터 파이프라인에 직접 내재화하고 있습니다. 이를 통해 데이터가 어떻게 변환되고 모델에서 어떻게 사용되는지 추적하면서도 워크플로 속도를 늦추지 않고 규정 준수를 보장할 수 있습니다. 그 결과 의료진은 자신이 사용하는 데이터와 해당 데이터를 바탕으로 내리는 의사결정을 더욱 신뢰할 수 있습니다.

의료기관이 환자 건강 정보, 규정 준수, 보안 태세를 보호하면서 AI를 운영 단계로 전환하기 위해 어떻게 신뢰할 수 있는 데이터 기반을 구축하고 있는지 확인해 보시겠습니까?

자세히 알아보기

인프라가 AI 확장 성패를 좌우하는 이유

많은 의료기관이 의료 AI 모델의 파일럿 운영에는 성공했지만 이를 대규모 실제 운영 환경에 적용한 곳은 훨씬 적습니다. 동시에 의료 분야에서는 진료 대화 자동 문서화 도구부터 영상의학 모델, 자동화된 보험 청구 처리에 이르기까지 고부가가치 전문 AI 솔루션이 빠르게 확산되고 있습니다. 각 솔루션은 개별적인 가치를 제공하지만 서로 분리된 상태로 운영되는 경우가 많아 AI 인사이트와 역량이 조직 안에서 고립되는 문제가 생깁니다. 이러한 결과물을 환자의 장기 진료 기록과 연결해주는 통합 계층이 없다면 개별 솔루션에서 나온 성과를 서로 연계해 의료 시스템 전반의 효과로 확장하기 어렵습니다. 이러한 문제를 해결하려면 통합 데이터 및 AI 플랫폼이 필요합니다. 거버넌스, 데이터 상주 요건, 통제권을 유지하면서 서로 다른 시스템을 연결해주기 때문입니다.

많은 조직에서 모델은 운영 환경을 제대로 반영하지 못하는 고립된 환경에서 개발됩니다. 하나의 배포 환경에서 다른 환경으로 옮기는 과정에서는 재작업이 필요한 경우가 많고 이로 인해 지연과 위험이 발생합니다. 확장 가능한 의료 AI를 구현하려면 온프레미스와 클라우드 환경 전반에서 모델이 일관되게 실행될 수 있도록 하는 표준화된 배포 프레임워크가 필요합니다. 이를 통해 실험 단계에서 운영 단계로 전환할 때 발생하는 마찰을 최소화할 수 있습니다.

기존 파이프라인은 대부분 ICU 알림과 같은 실시간 인사이트나 인구집단 건강 추세와 같은 배치 기반 인사이트 중 하나에 맞춰 구축되어 있으며 두 가지를 모두 지원하는 경우는 드뭅니다. 의료 현장의 의사결정은 상황마다 필요한 시점과 속도가 다릅니다. 따라서 실시간 역량이 부족하면 인사이트가 너무 늦게 전달돼 진료 의사결정에 제때 반영되지 못하고, 그 결과 예방할 수 있었던 개입 기회를 놓치게 됩니다. AI를 확장하려면 AI 결과물이 워크플로에 내재화되어 실시간 의사결정을 지원해야 합니다. 이러한 역량이 없다면 AI는 가능성만 보여줄 뿐 지속적인 가치를 창출하지 못하는 개별 개념 증명 단계에 머물게 됩니다.

환자 집단은 변화하고 임상 관행은 발전하며 데이터 분포도 달라집니다. 지속적인 모니터링이 없다면 조직은 오래되었거나 설명하기 어려운 결과물에 의존하게 될 위험이 있습니다. 규제가 적용되는 환경에서는 이는 심각한 책임 부담으로 이어질 수 있습니다. 앞서 나가는 조직은 다른 핵심 의료 시스템과 마찬가지로 AI에도 엄격한 관리 기준과 거버넌스를 적용합니다.

신뢰가 만드는 차별화

AI로 의미 있는 성과를 내고 있는 의료기관은 다른 기관보다 더 견고한 데이터 파이프라인을 갖추고 있습니다. 이들의 성공은 데이터를 임상 수준의 의사결정을 뒷받침하는 거버넌스 기반 전략 자산으로 관리하는 데서 비롯됩니다.

Cloudera와 같은 플랫폼은 이러한 전환을 지원하며 조직이 분절된 데이터 환경을 임상 및 운영 인텔리전스를 위한 신뢰할 수 있는 기반으로 바꿀 수 있도록 돕습니다.

AI 도입이 가속화될수록 거버넌스가 적용된 확장 가능한 데이터 기반을 보유한 조직은 혁신과 환자 치료 성과 모두에서 앞서 나갈 것입니다. Cloudera가 분산된 데이터를 신뢰할 수 있고 실행 가능한 환자 인사이트로 전환하는 방법 *을 자세히 알아보세요.

Rameez Chatni

Global Director of AI Solutions - Pharmaceutical and Life Sciences

이 작성자의 다른 콘텐츠 ›

Your form submission has failed.

This may have been caused by one of the following:

Your request timed out
A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.