基本信息字典的设置关系到数据的标准化,业务信息字典的设置关系到数据的价值。如果基础信息字典不规范,将从根本上限制数据的重用。正所谓“基础不牢,地动山摇”,以后再去管理,又是一次人力、物力的重新投入。但是,如果业务数据不真,就会出现很多逻辑和连接上的错误,也会导致数据成为“垃圾”。

数据是否准确,是否符合规范,还是脱离实际的“假”,这类问题属于管理层关注的范围。医院信息部门要尽可能保证数据的“准确性”,这就需要在日常工作中注意对基本信息词典的维护。
我先举个例子:所有信息部的工程师都知道病案首页需要填写外科医生和麻醉师的名字。如果是其他医院的专家做的手术,系统一般不能通过下拉框从本医院的医生列表中选择。虽然系统也提供了手工输入法,但由于种种原因,被当成“专家”填写,导致数据不准确的情况时有发生。如何处理这些数据,并使之“准确”?这不能完全依靠信息化部门来解决。
因此,对数据的治理不仅需要从源头抓起,还需要医院各部门的共同努力,就像在农村普遍推行的“河长制”治理污染河流一样,落实各级责任,共同管好医院信息数据的“长河”。
再比如:患者基本资料中的出生地和居住地信息是否准确,就足以让IT工程师“喝一壶”。原因是:身份证上写的是患者的户籍所在地,但患者的实际居住地会发生变化。最让工程师困惑的是,这些信息以代码的形式存在于数据库中,而且行政区划也会发生变化——以上海为例,浦东新区是由原来的川沙县等区县合并而成的,这就造成了身份证号码与目前的行政区划不完全匹配。如果工程师直接将身份证号码的前三位301转换成“上海市”,第四至第六位104转换成“徐汇区”,显然是一个越来越不准确的。
因此,笔者建议,最可行的办法是将出生地和居住地以汉字的形式保存在数据库中。在汉字识别技术日趋成熟的今天,关键词的查询和检索并不一定依赖于代码检索。旦将这种保存汉字的方法确定为数据标准,就可以消除因行政区划变动而带来的字典中的代码与汉字关系不确定的烦恼,从源头上保证数据不被扭曲。
出生地的信息不失真,这可以通过保存汉字来解决。要保证户籍所在地信息的准确性更是难上加难,因为户籍所在地很可能会经常变动。家庭分居案。在近三年的疫情核酸检测中,暴露出因分户统计造成的统计失真。这个问题值得探讨和研究。
在医院的信息系统中,至少有几十个软件在运行,各种数据也在不断的生成。大量数据的“准确性”是检验信息工程师的责任心和严谨性的试金石。数据的“准确性”也将最终决定医院质量管理水平。