在IT系统中,正积累着越来越多的垃圾数据,由于它们的生成、搜集、加工、分析等环节的混乱,而成为正确决策的“毒素”。
有心人搜集了这样一组数据:3月21日,国家统计局发布了全国70个大中城市1、2月份的房屋销售价格情况,结果显示,北京1、2月份房价同比上涨7.3%。但就在第二天,北京市建委、北京市统计局等部门对外公布:1~2月,北京市商品住宅预售交易平均价格涨幅为17.3%。在同一个城市,同一段时间,不仅两个政府部门—北京市建委和国家统计局的数据差异很大,就连同属一个系统的国家统计局与北京市统计局公布的数据也不能统一。
这种不同部门、不同地区就同一问题所做的统计数据出现很大差异,甚至相对立的现象不仅困扰着民众,使他们无所适从,也在困扰着决策管理层,一不小心就有可能做出错误的判断。
有业内人士认为,数据差异大的原因在于统计方法和计算方式不同。
其实,这样的现象和这样的解释,在IT领域更是司空见惯:不同机构针对相同的市场与领域,得出难以理解的差异,依然可引用上述的解释。
不难理解,上述解释有其一定合理性之外,数据混乱,与组织、部门利益紧密相关。各个组织和部门都希望自己的数据成为决策参照,以引导市场、引导有利于自己的政策出台。
近日,在本刊组织的医疗领域信息主管(CIO)座谈会上,一位主管举了个真实的例子:上级主管部门下发文件,要求在极短的时间内,搜集一定量的病源信息用于医疗预防决策。因要求的信息量大,内容繁复,主管硬着头皮放下手边其他工作,紧锣密鼓地一边安排人员整理录入病案信息,一方面发动不同业务科室医务人员,分工定量到人,向系统输信息。因为时间紧任务急,于是,系统中就有了这样的信息:“18岁女性前列腺炎”,“60岁老太十月怀胎”……主管说,对于这样紧急条件下搜集的繁杂信息,常常也不可能全面检查、核实。那么结果会怎样呢?谁愿意顺着想下去呢?
近来,很多机构纷纷开始“用数字说话”,动不动就要发布个“指数”什么的。几个朋友组建了个小公司,什么研究还没开始,也准备发布个“指数”。抛开其中的市场炒作动机,一个侧面,实实在在地反映了人们在重视数据,需要借助量化的指标更动态地表达与把握变化。但目前的种种重视,难到不恰是一种忽视?
一段时间,人们谈论我国的农副产品涨价,认为该有更好的信息搜集、反馈与调节、预警机制。其实,对比一下美国的情况,我们会有不少启发:美国政府每年拨款15亿美元建设农业信息网络,已建成世界最大的农业计算机网络系统AGNET,覆盖美国国内的46个州、加拿大的6个省和美加以外的7个国家,连通美国农业部、15个州的农业署、36所大学和众多的农业企业。
没有良好全面的数据采集基础,专业的信息分析体系,统一的信息发布平台,也就难以真正挖掘出数据的价值,而建立在垃圾信息上的决策,也就只是自欺欺人。
试想一下,当企业不断对IT追加投入、不断升级换代新设备时,信息系统里是否在同时积累着越来越多的数据“宿便”,散发着腐味与毒素?谁能救救IT系统?
|