微信扫一扫 分享朋友圈

已有 1100 人浏览分享

开启左侧

基于人工智能的医疗大数据中心设计与构建

[复制链接]
1100 0
基于人工智能的医疗大数据中心设计与构建[url=]王能才[/url][url=]王玉珍[/url][url=]张海英[/url][url=]马德宜[/url][url=]冯宝义[/url][url=]解放军联勤保障部队第九四〇医院信息科[/url][url=]

医院信息化系统建设包括医院信息系统(hospital information system,HIS)、检验信息系统(laboratory information system,LIS)、放射信息系统(radiology information system,RIS)、影像存储和传输系统(picture archiving and communication system,PACS)等业务系统,这些各类信息系统中,有的采用客户机与服务器(client/server,C/S)架构,有的采用浏览器与服务器(browser/server,B/S)架构;而各业务系统数据库异构性问题突出,且各系统建设时均以需求为导向,并无统一的规划和基础,从而使医院在信息化建设过程中产生大量的“信息孤岛”,医疗活动产生的数据未被合理整合,导致医院科研工作无数据支撑,部分指标数据无从得到,数据不标准、不一致,缺乏全院级的管理知识库支撑等问题[1,2,3,4,5,6,7,8]。本研究结合联勤保障部队第九四〇医院信息化建设现状,为医院构建基于人工智能的医疗数据中心,旨在实现数据融合、治理及挖掘应用,使医院数据归一化,借助人工智能技术,全面治理医疗数据,从而提高数据的可利用性,建立高质量的数据资源库。


1 医院数据中心总体设计1.1 总体功能架构设计

医院数据中心通过对院内各业务系统分散的数据进行采集、清洗、后结构化等步骤,标准化集中存储形成全院的全量、实时大数据中心,为医院运营管理、临床诊疗及科研提供数据支撑。医院数据中心整体架构见图1。


[url=][/url]

图1 医院数据中心整体架构设计 [url=]下载原图[/url]


注:图中HIS为医院信息系统;LIS为检验信息系统;EMR为电子病历;PACS为影像存储和传输系统;HRP为医院资源规划;CDR为临床数据中心;ODR为运营数据中心;RDR为科研数据中心。


(1)业务系统层。包括医院已建设的HIS、LIS和电子病历(electronic medical record,EMR)等业务系统,这些业务系统中积累了大量的分散数据。


(2)数据层。构建全院大数据集成平台,包括业务复制库、临床数据中心(clinical data repository,CDR)、运营数据中心(operational data repository,ODR)、科研数据中心(research data repository,RDR)、行业标准库、多维数据集及知识库[9,10,11,12]。数据层是整个平台的核心,通过结构化数据复制(Ogg Vorbis,OGG)软件非接口方式将数据抽取到复制库,然后通过数据抽取-转换-加载(extract transform load,ETL)技术对数据进行治理后保存到CDR、ODR和RDR三大数据中心。


(3)数据治理层。构建医院大数据平台的核心服务组件,主要是OGG、ETL过程中应用的服务,包括数据采集、元数据、数据治理和数据安全。


(4)应用服务层。在医院大数据平台基础上,通过搜索分析、智能挖掘及知识转化等技术,对数据进行挖掘、分析及展示。


(5)数据应用层。在医院大数据平台基础上,通过应用服务层,建设面向管理、临床及科研的各种数据应用软件。


(6)门户层。为医院大数据平台建立个人和机构的门户入口,依托互联网技术,打破平台的物理位置约束。包括管理者门户、医生门户、患者门户、研究者门户及公共门户等。


1.2 总体技术路线

(1)数据中心支持最新Hadoop分布式架构和MPP(大规模并行处理)架构的Green Plum分布式关系型数据库。


(2)支持基于日志的OGG软件、基于日志的变化数据捕获(change data capture,CDC)等方式,对业务数据库不产生任何影响的情况下,数据实时同步到数据中心。


(3)数据抽取转换过程,支持自动化数据抽取-转换-加载(extract transform load,ETL)软件、提取-运输-转化-装载环境(KDE extraction,transportation,transformation and loading environment,KETTLE)开源软件;自动化ETL软件数据抽取时支持数据源和目标源的动态适配和添加。


(4)支持任务自动迁移、重试和预测执行,不受计算节点故障影响,可确保数据中心安全性。


(5)对大容量数据预聚合支持麒麟多维联机数据集(Kylin OLAP Cube)分析,可提高数据查询速度。


2 医院数据中心基础模块建设

医院数据中心基础模块建设包括患者主索引指数(enterprise master patient index,EMPI)管理设计、主数据管理(master data management,MDM)、智能化ETL系统和元数据管理系统模块的设计。


2.1 EMPI管理设计

各大医院系统来自不同的提供商,每个系统的架构、数据格式及编码标准可能不同,致使不同系统的患者信息和临床信息不能实现共享。同时,住院患者是以住院号为轴,贯穿整个住院流程并集成患者诊疗信息[13,14,15,16,17,18,19,20]。而门诊患者是以当次就诊的就诊号为轴,贯穿整个门诊流程并集成单次门诊的诊疗信息。由于患者每次门诊的就诊号不同,致使患者的门诊就诊记录变为“死档”。此外,由于同一患者的住院号和门诊号不同,致使患者的住院和门诊信息难以整合和共享。EMPI主要实现:(1)通过患者唯一性识别规则,将重复的患者记录进行合并,生成最佳记录;(2)为每个最佳记录生成一个唯一的ID,用作标识;(3)通过一个独立的系统对患者主索引进行管理;(4)支持对患者、员工多种类型的索引信息进行管理;(5)提供多种标准化的接口方式同外部系统进行交互;(6)提供批量数据载入功能,对原始患者数据进行读取、分析、标准化及注册,形成主索引原始库。通过EMPI的建设,建立患者唯一的ID标识,将重复的患者记录进行合并,生成最佳记录;实现医院门急诊、住院、体检等系统的患者信息共享,使系统间患者数据交互更标准和规范,为患者360°视图软件建设奠定基础。


2.2 主数据管理设计

主数据管理(master data management,MDM)指医院内部系统间的共享数据,由数据实体(如患者、疾病、药品、供应商、人员和科室等数据)和数据字典(性别、学历等)两部分构成。现阶段由于医院各系统间能够保证一致的主数据只包括少量数据实体,同时各系统无统一的数据字典,得不到全局性的统计数据。通过主数据管理平台定义数据的值域和制定标准,建立院内标准体系为实现互操作提供必要的语义保证,同时对患者、医护人员、科室、医嘱等基础数据及相关主索引实行统一管理。实现院内字典和术语,卫生部医疗标准和(或)国际医疗标准的统一访问和应用[21,22,23,24,25,26]。标准化的主数据是不同应用系统间数据能够互相识别、整合,进行有效交互、共享和分析的基础,以达成各系统间数据交换时语义级别的标准化。通过主数据管理系统的建设,可以对医院医疗服务人员、科室,以及国家标准和行业标准及临床数据进行标准化的梳理和管理,构建统一的、唯一的数据标准,保证数据的正确性、统一性。数据统一标准化后,集中存储维护,可极大提高维护效率,降低各相关部门工作量,并且可以有效防止一物多码、一物多名、物名错乱和开发接口复杂等现象的发生,有效防止重复率,降低差错率。


2.3 智能化ETL系统设计

通过智能化ETL系统完成对数据抽取、转换、加载等过程。针对不同数据库类型开发管理对应的数据库引擎,如Hbase引擎、Hive引擎、SQLServer引擎等。针对不同的数据抽取逻辑实现数据抽取组件的开发和配置,如输入输出组件、SQL执行器组件、合并组件等,以满足异构间的不同业务数据的智能化ETL。通过该系统的建设,可以使数据治理的过程更加高效。通过作业管理可以根据优先级有选择性的设置任务完成时间,保证系统的最大性能;通过可视化界面完成任务的配置,使ETL过程更加直观;通过日志管理,保证ETL过程数据的质量及数据跟踪。


2.4 元数据管理系统设计

元数据是关于数据库中的数据信息在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组与数据组,该信息组与数据组中的一切数据、信息,均描述和反映了某个数据的某方面特征,则该信息组与数据组可称为一个元数据。通过元数据管理系统,可以分析数据的属性,做到数出有源、数出有据,保证数据的标准化、完整性和准确性。


3 医院数据中心集成平台设计3.1 CDR设计

在标准与规范基础上,将临床活动产生的所有数据通过CDC和ETL等技术进行抽取、转换、清洗并转存到标准化的CDR数据模型中,形成按领域组织的、方便利用的临床数据集。实施数据领域包括患者信息、医嘱、检查、检验、病理、手术、病案、病历、临床路径等,涉及数千个数据字段的采集、清洗、转码及载入工作,涵盖HIS、LIS、RIS、PACS和EMR等各类业务系统,异构数据库涵盖Sql server、Oracle,数据时间范围包括信息化以来的历年数据及实时数据等。临床数据中心建成之后,为医疗质量指标监控、患者360°视图软件、临床决策支持系统提供更加全面、更加标准、更加准确地数据支撑。通过该系统可对各种质控类指标做到“事中提醒”“事后分析”,可以分析指标背后的问题,从根源解决,进一步提高医疗质量,降低医疗风险。


3.2 ODR设计

在标准与规范基础上,将医院管理活动产生的所有数据通过CDC、ETL等技术进行抽取、转换、清洗并转存到标准化的ODR数据模型中,形成按领域组织的、方便利用的管理数据集。实施数据领域包括人事、物资、费用及药房等,涉及数百个数据字段的采集、清洗、转码和载入工作。涵盖HIS、人事、物资及设备等业务系统,数据时间范围包括信息化以来的历年数据及实时数据等。医院运营分析系统是基于医疗数据中心进行数据的整合展现型应用,对医院运营相关指标进行监控,从临床业务、效率分析、收入分析、疾病分析、手术分析及资源分析等维度,展开深入分析。在直观了解医院运行情况的同时,支持对重点指标项建立预警设置。通过该系统的建设可以对各种运营管理类指标进行展示分析,通过数据来进行科学的管理,提高医院精细化管理水平。


3.3 RDR设计

建设研究型科研数据库,数据涵盖科教各领域的数据,实施服务包括数据领域有基线数据、随访数据、研究对象、研究人员、课题数据、教学数据、样本数据等,并以此数据库来支撑多中心研究工作的开展。科研数据中心为临床大数据搜索引擎、临床科研软件等科研相关系统更加全面、标准及准确地数据支撑。科研数据中心至少应包括以下数据领域:(1)科研病种库,研究对象库、病种库等;(2)随访信息库,回顾性研究随访信息、前瞻性研究随访信息及分病种随访信息等;(3)科研样本库,科教样本信息、样本存储位置信息等;(4)科研项目库,科研项目信息、科研人员信息、科研经费信息等。


通过该系统的建设,可以快速搜索到临床科研医生想要的数据,可以提高科研质量和科研效率,提高数据的利用率。


4 医院数据中心管理系统应用效果4.1 临床诊疗与医疗质量管理

(1)临床诊疗。通过基于数据中心的患者360°视图和临床辅助决策支持系统的建设,可以提高临床诊疗效率,减低医疗风险。


(2)医疗质量管理。通过建立基于数据中心的医疗质量监控管理软件,可以对质量控制指标进行分析和管理,做到事中提醒、事后分析,从而降低医疗事故的发生率。通过数据中心对“床位周转率”“患者等待时间”“平均住院日”等众多指标的控制,可降低患者诊疗费用,提高患者满意度,缓解医患关系,推动构建和谐社会。


4.2 运营及科研管理

(1)运营管理。通过基于数据中心的运营管理系统、绩效管理系统及医护人员360°视图软件的建设,一方面可以提高“人、财、物”等方面的精细化管理水平和医院决策水平,另一方面通过对绩效指标的分析,可提高医护人员的工作积极性。


(2)医院科研与发展。通过基于数据中心的大数据搜索引擎和临床科研软件的建立,可以提高科研人员的科研效率和科研质量,提高学科建设水平。在医院发展方面,通过医疗大数据中心的建立,可以将医院分散的数据进行全面的整合和高效的利用,发挥数据的价值,使医院沉淀的分散的数据变成服务医院的软资产,为数字化医院及智慧医院建设奠定基础。


5 结论

结合“国家医疗健康信息医院信息互联互通标准化成熟度测评方案”“电子病历系统功能应用水平分级评价方法及标准”等标准及医院信息化建设现状,为医院构建基于人工智能的医疗数据中心,旨在实现数据融合、治理及挖掘应用,让医院数据归一化,借助人工智能技术,全面治理医疗数据,提高可利用性,建立高质量的数据资产。同时,充分发挥大数据价值,加强信息安全管理,推动精准医疗技术发展,建立高质量的数据资产,构建大数据的应用体系,以实现医疗服务资源的最大利用,促进医院的运营管理科学化、专业化及精细化,并以数据驱动管理,更好的对临床诊疗、专病研究以及临床科研管理决策起到支撑应用,提升医学科研及应用效能,推动智慧医院发展。


参考文献

[1] 黄跃,魏岚,张蕾,等.基于大数据的医院信息集成平台建设与应用[J].中国医学装备,2019,16(4):103-105.

[2] 李莉,李秀云,李霞.基于大数据架构的医疗档案分析平台的构建[J].中国医学装备,2020,17(10):135-138.

[3] 陈冠臻.浅析大数据与5G通信[J].通讯世界,2019,26(2):67-68.

[4] 王继业,张金帅,苑学贺,等.云数据中心基于冷启动的调度方法研究[J].电力信息与通信技术,2021,19(5):1-5.

[5] 蔡晓辉,魏凤.数据中心网络节点信息共享加密系统设计[J].机械与电子,2021,39(5):31-33,39.

[6] 应建军.面向云计算的数据中心网络体系结构设计研究[J].网络安全技术与应用,2021(5):81-82.

[7] 张浩男,包健,张朝熙,等.基于统一DPI实现大型数据中心网内不良内容信息监测应用的研究[J].网络安全技术与应用,2021(5):77-79.

[8] 陈国京.云计算环境下数据中心的网络安全问题分析及防护[J].电子世界,2021(9):208-209.

[9] 康孝,肖彭瑶,蒋鹏.数据中心IT设备功率因数及其影响分析[J].电信工程技术与标准化,2021,34(5):66-70.

[10] 李康,李欣,张子凡,等.基于电力物联网建设的数据中心能耗管理研究[J].上海电力大学学报,2021,37(3):241-246,283.

[11] 张则阳,庞妺.新基建背景下数据中心数据安全保护策略研究[J].科技经济导刊,2021,29(13):36-37.

[12] Zhao M,Wang X.A Synthetic Approach for Data center Power Consumption Regulation towards Specific Targets in Smart Grid Environment[J].Energies,2021,14(9):62-65.

[13] 朱丽,张彦遒.工业化数据中心助力行业低碳发展[J].通信世界,2021(9):46-48.

[14] 杨蓉.微软开展数据中心液体冷却实验[J].计算机与网络,2021,47(8):11.

[15] Brodie P,Velkova J.Cloud ruins:Ericsson's Vaudreuil-Dorion data centre and infrastructural abandonment[J].Information Communication and Society,2021,24(2):1-17.

[16] 张鹏.急诊医疗管理信息系统的设计与应用[J].机电信息,2021(12):49-51.

[17] Saiyad A,Patel A,Fulpagare Y,et al.Predictive modeling of thermal parameters inside the raised floor plenum data center using Artificial Neural Networks[J].J Build Engineer,2021,42(1):83-86.

[18] 顾明辰,寇建秋,孙赟,等.医院急诊预检分诊系统接口优化方案设计与实现[J].中国卫生信息管理杂志,2021,18(2):248-252.

[19] 魏喜莲.云数据中心网络安全设备部署研究[J].铁道通信信号,2021,57(4):41-47.

[url=][20] Park SJ,Kim JY,Yoon YH,et al.Analysis of the Adequacy of Prehospital Emergency Medical Services Use of Patients Who Visited Emergency Departments in Korea from 2016to 2018ata from the National Emergency Department Information System[J].Emerg Med Int,2021,58(16):142-146.[/url]

[21] 杨明川,刘倩,赵继壮.人工智能数据中心研究[J].信息通信技术与政策,2021,47(4):1-7.

[22] 王少伟,孙咸江.医院数据中心建设研究[J].电子世界,2020(21):27-28.

[23] 刘辉兰,马继锋,张海波,等.火神山医院基于私有云的数据中心建设实践与思考[J].中国数字医学,2020,15(5):16-18.

[24] 罗继军,朱明春.医院数据中心(IDC)的规划设计[J].智能建筑,2020(4):37-40.

[25] 马军,闫若玉,王斌,等.基于混合云架构的医院数据中心的建设[J].中国医疗设备,2019,34(1):95-97.

[26] 温煜,唐丹,徐双平,等.基于大数据架构的医院数据中心管理[J].中国数字医学,2018,13(12):15-16,5.



[/url]


举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

0

关注

1

粉丝

168

主题

Archiver|手机版|小黑屋|科进医疗安全知识库 ( 粤ICP备18035733号-1 )

GMT+8, 2025-2-5 22:45 , Processed in 0.050931 second(s), 25 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.