联合国欧洲经济委员会:机器学习为生成现代、高效的统计数据铺平道路
联合国欧洲经济委员会:机器学习为生成现代、高效的统计数据铺平道路
由英国数据科学园区与联合国欧洲经济委员会合作领导的2021年机器学习小组正在推动努力,将有关机器学习和人工智能的理念变为现实,以便为重要决策带来更廉价、更迅速、更准确的统计数据。一项涵盖研究、知识共享和能力建设的为期一年的计划旨在使机器学习成为现代化统计数据生成方式的中心和前沿。
欧洲经济委员会表示,机器学习已经成为日常生活的一部分,这归功于近年来出现的数字革命。随着越来越多的服务趋向数字化并且知识越来越多地被存储在网络中,数据的体量正以前所未有的规模增长,而机器学习依赖于数据,因此,数据越多,机器将能够从所馈送的信息中进行“学习”。
欧洲经济委员会表示,机器学习从数据中提取模式的过程与商业和国家统计局的核心业务没有太大不同,后者通常从调查、等级和行政来源处理数据以生成官方统计数据,例如GDP、就业率和人口统计数据。
的确,机器学习中使用的许多技术都起源于国家统计局几十年来一直使用的统计方法。将国家统计局的工作范围扩大到包括这些新技术,可以加速当前需要大量时间或人工干预的流程,并可以减轻被调查者回答问题的负担。
欧洲经济委员会官方统计数据现代化高级小组处于全球官方统计现代化工作的最前沿。在2019年,该小组开始研究如何利用机器学习帮助国家统计局改善官方统计数据。机器学习项目最终于去年12月结束,来自23个国家的120多人参与其中。在进行了两年的19次试点研究之后,该项目的最终报告得出结论,机器学习不仅是官方统计领域的热词,还是必经阶段,它所具有的潜力真实而巨大。
但是,项目也认识到,合理的顾虑依然存在。严格的质量标准是官方统计的基石,在机器学习中制定标准也不例外。从统计意义上讲,数据质量不仅表示准确性,还指其他方面,例如及时性和成本效益。机器学习的新技术创建了更多维度,必须根据这些维度来评估数据质量,例如可解释性和可重复性。
此外,公众对机器学习的道德性表现出的许多担忧都源于算法的高度复杂性。如果用户无法理解机器学习的决策方式,他们可能会对结果没有信心。
国际合作以确保兑现承诺
欧洲经济委员会指出,要真正利用机器学习来实现官方统计现代化的潜力还有很长的路要走。即使许多欧洲经委会成员国都成功进行了试点项目,基于机器学习的解决方案也未必被列为国家统计业务的组成部分。这些项目调查了机器学习在融入国家统计业务方面面临的障碍,并就可能的解决方案达成共识。
欧洲经济委员会指出,在2021年,这项工作将继续进行。英国对于机器学习在统计中的使用所牵涉的道德方面的问题研究处于领先地位。国际货币基金组织、墨西哥、瑞典和其他国家将着重于将机器学习整合到生产中。芬兰将集中探索数据质量问题。墨西哥将继续努力为官方统计中的数据学习建立一个国际认可的质量框架。