适用于社会经济统计的大数据技术方法体系研究

2020-07-22 管理员

项目名称:适用于社会经济统计的大数据技术方法体系研究

立项时间-结项时间:2020-2022

立项来源:国家统计局重大统计专项

(1)项目背景

我国现代经济统计体系经过20多年的发展已建成全球最大的经济统计系统,在推动社会体系的建设方面发挥了不可替代的重要作用。经济统计的发展也需要适应数据化时代所带来的技术变革要求,在积累经济数据的同时,也需要提升自身的数据管理能力,丰富数据的维度,运用合适的大数据技术方法,处理社会经济中大量的非结构化和异构数据,将这些数据转化为有关社会和经济主体潜在行为的知识。然而,大数据技术在应用到社会经济统计研究中可能面临众多挑战,如数据可用性、数据完整性、数据异构性、不同来源数据的集成、数据匹配,分析社会经济统计研究的数据的可用性、处理复杂性、隐私等。因此,梳理社会经济统计研究中的数据源及能够应用的大数据技术方法,厘清它们的主要设计思想、适用条件、优势和缺陷成为亟待解决的问题。这不仅对社会经济统计相关研究人员的工作提供借鉴和指导,同时还能为推动实施国家大数据战略,加快完善数字基础设施,推进数据资源整合和开放共享,保障数据安全,加快建设数字中国,更好地服务我国经济社会发展和人民生活改善提供帮助。

(2)调研内容

本研究将主要从以下五个方面开展工作:第一,大数据下的社会经济统计理论体系研究,将社会经济统计与大数据技术方法结合,深刻分析大数据机器对社会经济统计学科的影响,辨析大数据的概念、数据分析的转变、以及澄清大数据的认识误区;第二,社会经济统计数据源的层次结构,剖析社会经济数据的来源,有利于对应数据结构类型的归纳、大数据技术的梳理、应用平台的打通,是把握后续研究工作的基础;第三,社会经济统计功能结构,将系统梳理在针对社会经济统计中的不同场景数据涉及的相关社会经济功能结构,深入剖析它们的主要设计及优劣;第四,大数据下的社会经济统计并行计算方法,拟从不同算法多维度的并行化,对社会经济统计涉及的大数据并行计算技术进行梳理;第五,大数据下的社会经济统计方法应用研究,将梳理社会经济统计中经典和新兴的实际应用案例,提出我们的大数据处理架构的建议,该构想用于即使预测社会和经济的变化,并给出相应软件实现的方法和程序代码。