【转载】积极推进大数据在政府统计中的应用

2014-03-30 中心编辑

作者:潘璠(国家统计局统计科学研究所所长)

随着社会生产力的不断发展、特别是科学技术水平和信息化程度的提升,我们正在迎来以大规模生产、分享和应用数据为主要内容和特征的大数据时代。同传统数据相比,大数据不仅包括结构化数据,更包括大量非结构化数据,且具有数据量大、应用价值大、速度快、种类繁多、波动大等特点。面对日新月异的形势,作为生产和管理数据的政府统计部门,面对大数据带来的新形势和新变化,更是机遇和挑战并存,动力与压力同在。而近几年来,中国政府统计系统积极推进以一套表为核心的统计“四大工程”,极大地提升了政府统计工作的信息化水平,也为大数据的应用奠定了相对较好的基础。我们要高度重视大数据对政府统计工作正在带来和将要带来的各种影响,充分认识推进大数据应用的必要性和紧迫性,加强顶层设计,分专业分步骤实施,以推动统计生产方式的变革和统计生产力水平的提升。

要统一统计标准。针对大数据标准各异的特点,认真考察不同来源大数据所执行和依照的不同标准,与现行各项统计标准进行比较,对政府统计部门应用大数据的统计标准进行统一规范,要特别重视和研究如何对非结构化数据进行标准化处理。

要规范统计指标。针对大数据的指标数据已经先于政府统计的设计而存在的特点,广泛搜集已经存在并继续增加的各类数据,分析其与政府统计指标在口径、范围、内涵、定义等方面的差异,以对政府统计应用大数据的统计指标进行设计、调整、规范和完善。

要改革调查方法。针对大数据中很多信息数据即时产生、“样本=总体”的特点,改进和完善大型周期性普查、抽样调查等传统调查方法,研究在“全样本”基础上进行抽样或计算的方法,研究利用行政记录、商业交易记录和网上搜索信息进行测算的方法。

要完善采集方式。针对大数据中非结构化数据比重很大的特点,研究对非结构化数据进行采集的方式,开辟新的采集渠道,应用新的采集技术。还要探索如何通过搜索、购买、合作等其他方式,采集重要的基础数据。

要加强横向合作。针对大数据生产主体日趋多元的特点,既要加强与其他政府职能部门的合作,以推进对各种行政记录的开发和利用;也要加强与各种类型的大数据生产企业的合作,以研究和推动商业交易记录、网上搜索信息的搜集、处理和转换。

要改进数据处理。针对大数据量大且内容庞杂的特点,认真研究将非结构化数据转化为结构化数据的方法和技术,积极推动数据处理方式从简单汇总向数据挖掘方向转变,加强对数据的预处理,提高数据处理的智能化程度。

要丰富分析手段。针对大数据速度快、存在形式多样且关联性强的特点,通过加强实时分析、关联分析和可视化分析,提高统计分析的时效性、趋势性和直观性,提升统计工作的分析水平和预警预测能力。

要完善数据发布。针对大数据即时产生、内容丰富、形式多样、主体多元等诸多特点,增加统计数据发布的内容,丰富数据发布的形式,提高数据发布的频率和时效性,加强对数据的解读,更好地满足社会各界对统计数据的多样化需求。

大数据是一种现象,更是一种趋势。我们要把握机遇,顺势而上,努力使中国的政府统计工作适应时代的发展与进步,在新的更高的层面上实现“三个提高”,并推动服务型统计的建设,为全面建成小康社会作出新的贡献。

来源:http://www.zgxxb.com.cn/ppsd/201305140011.shtml