“我们从来没有真正的证据来证明这一点。”他说。
十年后,现任Mercy Technology services(MTS)的企业分析和数据服务副总裁的Dudley表示,该组织60多家医院的临床医生已经可以近乎实时地回答这些问题了。
在2007年采用了Epic电子病历(EMR)系统后,Mercy拥有了超过十年的病人数据,以帮助改善病人护理。2009年,医院的网络将条形码扫描仪引入了手术室,使工作人员能够准确记录所使用的医疗用品和植入设备的详细信息。大约五年前,Mercy又通过指标计划来启动了绩效评估,以确定组织的哪些领域对结果的影响最大。
该组织现在使用了一系列的数据集,每个服务线一个,使用了SAP HANA所收集的来自EMR海量数据的关键元素。内存数据库也方便了对大型数据集的实时探索。
“这与有问题时才来处理数据,每次都要等待30分钟才能运行查询的情况有很大的不同,”Dudley说。“当你可以实时探索时,你就可以用一个假设来接近数据,你可以挖掘和探索数据,得出结论,你就可以在你所做的事情上做出改变。”
这些变化使Mercy在三年的时间里节省了3300万美元的植入设备和手术用品,而且也没有牺牲额外的护理。由于病人数据的不确定性,Mercy可以与其他组织分享这些见解,并致力于将来自其他来源的数据整合到其系统“Real World Evidence Network”当中,该系统为MTS赢得了FutureEdge 50奖项,以表彰其对新兴技术的应用。
产品,而不是项目
在交付数据的洞察力方面,MTS的主要挑战主要是组织方面的。
“如果有人给我提供了我的架构师能够理解的规格……那么我就可以在短时间内提取这些数据。问题在于,如何才能够将提取、定义或度量与企业所希望定义它的方式保持一致,”他表示。
这使得Dudley会要求他的数据消费者需要告诉他他们正在试图解决什么样的问题,而不是告诉他他们想要什么样的数据。“然后我就可以帮助你映射到数据,帮助你解决这个问题,”他说。“这种方式真的很有效。”
让用户满意的另一个关键是不要在交付一个新的仪表板或可视化之后就走开。
“IT想把这些东西当作一个项目来对待,但它们是一个产品,”他说。这意味着需要继续与用户合作,使他们的数据表示与业务需求相一致。
Dudley最大的遗憾是在项目开始时没有实现主数据管理和元数据的管理工具。“这在定义方面是有帮助的。”他说。
但现在,使用MDM工具本身也带来了自己的挑战。“除了这些工具之外,你还必须有一个运营计划和运营资源来有效地运行和管理它们,”他说。
与此同时,一些服务部门也已经投入了自己的资源来帮助管理数据,他说,对他们而言,“一些伟大的事情已经发生了。对于那些没有投资这些资源,只是让我来为他们做所有工作的人来说,我们的周转时间要慢得多,也要花更长的时间。”
还有其他的变通方法,例如可以将所有的仪表板链接到内部的wiki以记录数据定义。“他们在很大程度上会依赖于我的员工来进行管理和维护,这也是非常劳动密集型的工作。”他说。
阅读医生的笔记
四年前推出的自然语言处理(NLP)软件,使Dudley能够接触到大量的数据,而这些数据之前都被封存在临床医生的自由笔记当中。尽管如此,每个临床医生的文档都是不同的,而且几乎没有什么标准。
因此,Mercy从Linguamatics中选择了一个工具,这在很大程度上是因为它的医学本体论库,可以帮助该工具识别某个条件或治疗的同义词。
“在过去,我必须为人们可能会说呼吸急促的每一种的变体进行编码,”他说。
对于那些多年前尝试过NLP但失败了的组织,Dudley建议他们可以重新审视一下,因为像Mercy这样的专业本体库已经得到了很大的改进。
不过,拥有高技能的员工也很重要。“拥有数据科学背景的人似乎是最有效的。”他说。
以这种方式使用NLP提取数据的一个好处是,它可以用来帮助识别受保护的个人健康信息(PHI),这样Mercy就可以在不违反HIPAA规定的情况下共享这些信息了。
“我们将进行NLP并提取我们正在寻找的数据元素,以便进行分析。但我们并不会提供开放的临床记录,因为在记录中可能有很多不同的东西,可能是PHI,但我们不会提供这些。”他说。
更好的基准测试
Mercy现在正在使用它的数据平台来研究质量和安全性,并开发它的护理路径。但还有更多的工作要做。
Mercy收集的数据使它能够对其服务进行基准测试,但仅限于内部标准。为了更好地了解Mercy的表现,Dudley想通过招募他们加入Real World Evidence Network,来将其数据与其他组织的数据进行对比。但大多数组织现在才开始确保他们的数据是定义良好的、记录在案的和未标识的,因此其实也很难找到可以共享和比较的合作伙伴。
目前,我们的重点是与几个志同道合的组织合作,分析心脏病学领域的数据。
“在我们的工作范围越来越广之前,我们希望与他们一起掌握这一点,”Dudley说。“但最终,为了对我们所做的所有不同的事情进行基准测试和比较,我们需要找到某种方式或某种机制来做到这一点。而建立一个数据一致的网络是实现这一目标的唯一途径。”