人工智能等新技术如何升级医疗信息化
燕麦云   2019-07-10

在信息化高度发达的今天,医疗也进入了信息化的快车道。鉴于医疗信息安全关系到民生根本,由全国四十余家大型三甲医院、卫健委信息中心、以及医信专业公司共同打造的、我国第一部关于医院网络信息安全建设标准参考——《医院网络安全建设指引》应运而生。

《医院网络安全建设指引》

 

我有幸成为这本书的编委,与桂林医学院欧镔进主任一道,编写了其中一些章节的内容。

 

何洋成为《医院网络安全建设指引》编委

 

如本书主审、《中国数字医学》主编李华才主任所说,当前医疗卫生信息化建设负重涉远,不仅肩负着“健康中国2030”、深化医药卫生体制改革、全民医疗健康保障、改善医疗服务等多维使命,而且还担负着跨地域、跨机构、跨部门、跨专业的医疗信息交换共享,医联体建设、分级诊疗、智慧医疗、互联网医院等数不胜数的重任,网络安全是首当其冲的问题。

不久前,我在首届中国医院信息工程师创新大会暨《医院网络安全建设指引》新书发布会上,分享了自己对“医院非结构化数据安全管理”的一点思考,这也是书中我所负责编写的章节。在书中,我重点阐述了如何应用领先技术进行医院非结构化数据管理的的方式和方法。

 

何洋受邀参与中国医院信息工程师创新大会暨

《医院网络安全建设指引》新书发布会

何洋在新书发布会上进行分享与演讲

 

本期《何洋开讲》,我把这部分内容中的几个核心观点分享给大家,如果有兴趣,大家可以把这本书找来看看,里面集结了众多医疗信息系统管理者和工程师的干货经验,开卷有益。

 

//非结构化数据:从“重要但不紧急”到“十万火急”//

所谓非结构化数据,简单来说,就是不存储在数据库中,不能用二维表来表达的数据,比如医院常用的办公文档、规章制度、图片、多媒体音视频等文件

根据分析机构Gartner的一项数据显示,企事业单位中的非结构化数据已经超过了80%,而且这个数字还在每年递增。医疗机构也不例外,医院中非结构化数据的增长速度要远高于结构化和半结构化数据。随着人工智能的不断发展,占医院数据量绝大多数的非结构化数据将是一个有待挖掘的金矿。

 

 

在过去很长一段时间里,很多医院都认为,抓医疗设施、环境、利用IT提升运营效率才是“最紧急的事情”,因为预算受限,对非结构化数据的系统性建设已经严重滞后了。

但是在信息时代,数据才是支撑医院运行的底层基础;如果数据出了问题,哪怕最先进的诊疗设备和最高效的流程系统,都会瞬间瘫痪。

不久前肆虐全球的Wannacry勒索病毒事件给医院敲了一个很大的警钟。作为一种针对非结构化数据的勒索病毒,Wannacry会将文件恶意加密,需要用户交付赎金才能解密。从英国国家医疗服务体系NHS开始,Wannacry是一场感染了全球150个国家超过20万台电脑的超级病毒灾难,对中国的医疗系统也造成很大的冲击。

 

Wannacry勒索病毒(图片来源于网络)

 

无论是医院自身还是整个政策大环境,如今都在重新审视和评估数据安全的紧要程度,这一点我们可以从国家最近颁布的《中华人民共和国网络安全法》和《等保2.0》中清晰感受到。

随着国家卫计委《医疗健康信息医院信息互联互通标准化成熟度测评》及《电子病历系统功能应用水平分级评价方法及标准》的推广,医院信息化建设进入了高速发展期。医院IT应用的不断深入已经造成非结构化数据量的极度膨胀,如果这时候不安全地处理好这些数据,那么就不再是可以“继续拖”的问题了,因为这将可能触犯国家法律。

 

//医院非结构化数据的保存与应用急需整体规划和技术革新//

当前医院中的非结构化数据可以大致分为以下四类:

0流媒体数据

其中主要包含医院监控数据,以及诊疗音视频数据(主要包括DSA数字减影血管造影、窥镜、超声动态等);

0PACS影像数据

其中主要包含DICOM文件、高清图片、高清视频等;

0OA电子数据

其中主要是管理制度、采购合同规划、人事档案、科研档案等;

0版式文档

归档后的电子病案、纸质档案、财务原始凭证电子化等。

 

//////////

随着数据量的不断激增,上述提到的这些数据都面临着旧技术跟不上新发展的问题。

流媒体和PACS影像数据是医院数据量的最大头之一,除了安防监控视频外,一家综合性医院一年产生的诊疗数据量就已经达到了10TB的级别。这些数据通常都存储在各自独立的应用系统中,这种数据量对任何的业务系统来说,都是一个沉重的负担,因此医院IT管理人员经常需要删除或导出数据,但导出后的数据又没有专门的系统来存储。

 

DSA数字减影血管造影(图片来源于网络)

 

PACS影像数据(图片来源于网络)

 

OA电子数据是医院非结构化数据中很重要的一个类型,通常情况下,这些数据保存在OA系统中,或是工作人员的电脑中。但问题是,很多医院OA系统在使用一段时间后会变得非常慢,就是因为里面的非结构化数据变得难以负荷。另一方面,保存在医院工作人员电脑中的文件也缺乏有效的监管,可以随意被人拷走或删除,从而造成数据丢失。

 

OA电子数据(图片来源于网络)

 

医院中常见的版式文档包括各种纸质档案、文件、财务原始凭证扫描件、归档后的电子病案等,它们在医院的业务需要、诊断调阅、科研教学、稽查审计、司法证据等场景都发挥着重要作用。

版式文档是不允许被修改的,但这一点在当前技术下却很难百分百做到。比如电子病案,它们通常存储在电子病历归档系统中,为了防止篡改,很多电子病案最后都是使用jpg图片格式来存储,但仍很难杜绝文件在生成jpg图片之前就被篡改的可能性。

 

版式文档(图片来源于网络)

 

除了业务相关的非结构化数据,医院还存在着许多其它的文档存储与流转场景,例如把一个文件从一台电脑拷贝到另外一台电脑。U盘、移动硬盘、Windows文件共享、FTP、NAS等是使用频率最高的设备。但方便归方便,这样的文件共享方式是缺乏监管的,而且数据外泄及丢失的风险极高。

我们需要的是新型的、智能的解决方案,能兼顾安全和易用,真正在医疗的场景中切实发挥作用,产生价值。

 

//人工智能技术驱动医疗信息安全的未来//

人工智能作为计算机领域的前沿技术,已经在诸多现实场景下展开应用,大幅提升了效率。

人工智能技术研发是我们燕麦云实验室的重中之重。过去几年我们投入了大量人力物力,联合包含北京大学在内的多家知名高校打造了燕麦云实验室,旨在围绕人工智能、区块链、智慧物联网、拟态信息安全等前沿技术开展协同科研及技术成果产业化。

 

 

我国当前的人工智能技术发展百花齐放,在医疗行业中其实已经有不少人工智能技术,比如肿瘤治疗智能化决策辅助、智能医疗语音识别输入等运用到了实际的诊疗当中。而我更加关注的是人工智能技术在医疗信息安全方面的发展与应用。

FILEDNA智能文件基因技术是燕麦云实验室的人工智能科研成果,它彻底颠覆了人们对文档防伪和溯源的认知。基于燕麦云实验室专利的人工智能编码技术,FILEDNA在原文件的基础上潜入了一个隐形的DNA信息层,我们可以在这个信息层上嵌入版权信息。

 

FILEDNA技术原理

 

原则上,这个文件的DNA信息层是很难用肉眼发现的,就像我们身体里的DNA信息一样,但当有需要时,透过专有设备即可从文件中将DNA信息提取出来。同时,通过AI技术建立文件的DNA信息库,在提取DNA信息之后,可以追溯文件的操作记录和用户访问日志,定位文件泄露的源头。

FILEDNA技术应用在医疗机构中其实是非常实用的:首先,它能为医院敏感OA电子数据实时、动态地打上数字水印,保障文档的安全流转;其次,它能为为电子病案、财务凭证加入一种新型的智能的数字签名,方便鉴真的同时,杜绝篡改;最后,它还能在纸质文档电子化后,加入智能数字水印,方便溯源与检索。

当前,信息化已经成为了医院不可或缺的基础设施,就像水电气一样,这让医院比以往任何时候都要更容易受到黑客攻击的目标。

尽管我们仍然面临着众多新问题、新情况、新挑战,但我相信,只要与时俱进,不断提升,适应新理念,应用新技术,就一定能帮助中国医院打造坚不可摧的“数据护盾”,助力新时代医疗工作更稳定迅速地发展壮大。