朝阳区医疗健康大数据平台
申报单位:北京市朝阳区卫生健康委员会 医渡云(北京)技术有限公司
浏览量: 发布时间:2024-07-12
案例背景

根据“十四五”规划规划纲要要求,2021-2025 年期间需要“建立健全国家公共数据资源体系, 确保公共数据安全,推进数据跨部门、跨层级、跨地区汇聚融合和深度利用”。朝阳区卫 健委现有业务应用系统的复杂结构和数据应用系统的分散结构造成数据资源管理的极大困 难:一是系统之间数据冗余严重,数据存储格式不一致,存在大量数据冗余,浪费存储资 源,冗余数据的一致性和有效性无法验证。二是区域平台与数据中心的数据质量不透明, 平台没有提供数据质控工具,数据可信度和数据价值堪忧。三是, 数据资产缺乏管理工具, 缺乏对数据情况进行统一可视化管理的平台,对于数据的详细目录、存储位置、提取方法、 数据质量、数据使用等情况无法做到及时了解。四是,现有系统技术架构陈旧,传统架构 对于后续扩展的成本和复杂性都较大,造成数据割裂,数据有效性和一致性不能得到保障。

解决方案

面对医疗服务业务的多样性和复杂性,区卫健委通过规范区平台、统一规划数据采集、 统一的技术方案,集中实施、标化数据范围等措施。对所属 6 家医院及医疗卫生中心站点 的全量诊疗数据进行汇聚,共接入医院信息化数据系统 52 个,涉及 36.2 亿数据量,时间 跨度 2000 年至今。卫生信息化系统覆盖: His、Ris、病理、Lis、病案、手麻、电子病历等系统,涉及融合近 20 个厂商的信息化系统数据的标准化,实现每天增量自动化调度。 对同业务多厂商多元异构的数据进行标准化。解决方案主要包含: 1. 数据治理方案:朝阳区卫生业务系统的数据进行接入采集,对数据进行归档和质控, 完成数据清洗和转化,对原生数据的质量做初步评价。在此基础上进行可视化的资产管理, 包括:资产盘点、数据治理前后差异、数据溯源、形成数据治理质量报告。 2. EMIP 数据方案:在数据治理的基础上形成朝阳区医疗卫生大数据平台,对原始诊 疗业务数据进行汇聚, 形成 EMPI(Enterprise Master Patient Inde×) 居民主索引, 通 过唯一的居民标识将多个医疗信息系统有效地关联在一起,形成居民主索引数据库、居民 健康数据数据库、居民健康数据 / 文档接口,以实现各个系统之间的互联互通。 通过以上的数据服务,解决了朝阳区卫健委现有业务应用系统的复杂结构和数据应用 系统的分散结构造成数据资源管理的困难,提供了数据资产管理工具和区域医疗数据查询 工具,并在此基础上支撑了各类应用场景。

创新点

技术创新方面,基于大数据和云平台技术框架进行开发,主要涉及的关键技术包括: 以 K8s 和 Docker 为核心的虚拟化部署技术, 以 Hadoop、Druid、HBASE 为基础的数据 存储技术和以 Sqoop、Flink、Kafka 等组件为核心的数据集成技术。 模式创新方面,一是促进“跨院复诊”医疗模式在全区的推广,提供朝阳区居民健康 档案浏览查询工具,经过患者授权,医生在诊断过程中可查看患者在区属医疗机构的历史 医疗档案。二是建立健全医疗数据质量保障机制,基于数据治理平台,建立了朝阳区医疗 数据质量保障机制,提升医疗服务能力和质量、优化资源分配。三是统一的运维管理模式, 以数据治理平台为依托,对业务系统运维展开统一运维管理,兼顾业务系统应用价值和数 据价值,提升管理效率。 应用创新方面,提供针对全区医疗数据情况进行统一可视化管理的平台,包括数据的 详细目录、存储位置、提取方法、数据质量、数据使用等,进而顺利开展朝阳卫生数据的保护、 利用、开放交换工作。

应用成效

经济效益方面,一是提高数据资源可用性,针对数量较多且涉及多厂家的独立运行维 护系统的数据资源,进行统一归档和治理,对数据治理情况进行查询和差异分析,提高数 据质量,为应用分析服务提供数据基础。二是实现政务数据共享,打通各个系统的数据对接, 对数据进行集中抽取和汇聚,并形成自动化数据采集机制,不仅可以省去二次接口开发费 用,还可以提高数据时效性、全面性、不间断性。三是提升管理效率,通过建立统一的数 据质量保障机制和统一的运维管理模式,辅助公共决策,优化资源配置。 社会效益方面,一是形成医疗健康数据库后,通过可视化系统进行浏览和查询,满足管理人员多维度、不同颗粒层次的查询和分析使用。二是在北京市 2022 年度,全市 16 区 县的医疗数据质量评价中,获得质量第 一。三是实现北京市检查检验结果 114 查询服务 , 为医联体远程会诊提供数据共享的基础、为互联互通医院与平台间的数据考核提供数据支 持。四是辅助 4 家区属医院完成 2023 年度北京市电子病历评级质量评价工作。五是通过 开放的标准化接口,完成市属驻区医院数据共享,具备支持医联体的数据共享调阅的能力。