当前位置: 首页 > 专题专栏 > 统计学会

数据或将决定人工智能发展制胜的关键支点

发布时间:2019-12-31 15:31 信息来源:郴州市统计局 责任编辑: 点击量:1

近年,人工智能发展速度惊人,应用领域和深度不断拓展,智能化程度不断提高。谈到人工智能,人们首先想到的是算法,但是近期百度、阿里、华为、IBM等BOSS相继推出自己的人工智能平台,上载了不少通用算法,迁移学习的出现,提升了算法专业化进程,也就是说未来人工智能产业的规模化将以专业化公司提供算法,众多的人工智能企业将在第三方算法的基础上实施自己项目。实施人工智能项目的关键在数据,只有在大量的数据基础上建立相应的模型,才能创造出名目繁多的人工智能产品,数据产业将再次成为产业发展的重心备受青睐。数据的涵盖面非常广,包括视频、图片、语音、文本、传感器数据等,建立高质量的数据体系,提升数据收集、整理、存储能力和水平,对于发展人工智能有着极为重要的推动作用,应引起社会各方面的高度重视和关注。

一、数据产业的发展现状和存在的问题

1.政府和部门是快速收集数据的渠道,是宏观数据收集的主要途径。其一,国家统计局建立了数据库,对规上企业全面实现了网上直报,各级统计机构都通过一套表上报数据,成了国家宏观政策调整的重要数据来源。统计系统还通过普查或者抽样调查的方式,获取社会经济发展方方面面的数据。其二,部门数据收集整理不断加强。如环保部门已经实现了重点企业污染情况实时采集。发改、经信、科技、教育等主要部门都有自身一套完整的数据呈报体系。其三,很多部门都通过各种调查获数据。如全国污染源普查是环保部门主办的污染源分布情况调查,将对全国环境综合治理起到举足轻重的作用。其四,政府和部门的信息化速度很快,门户网站建设日趋完善。通过门户网站收集信息业已成为宏观经济数据重要的来源。其五、公职人员深入基层,获取了大量专有性数据信息,成为解决具体问题的重要参考。

政府和部门的数据收集水平仍有较大的提升空间。一是数据的置信度有待提高。受各方利益的影响,少数部门的数据置信度存在一定的问题。二是与市场脱节。部门数据与市场情况脱轨,不能完全和市场接轨,对市场的指导作用受阻。三是数据公开的程度有限,发布的数据过粗,对微观的知道作用非常有限。四是部门条块分割比较严重,数据分散在各个部门、甚至个人手上,很难作为公共资源加以利用。五是政府和部门的门户网站技术未得到及时省级。很多门户站点只能接受低分辨率图像信息,甚至有的站点只能接受680*480的图片,与现在的终端设备动辄上千万像素格格不入。

2.数据意识淡薄,入宝山而空回。有不少群体接触到的数据信息量非常大,但不理解数据的价值,不懂得分类,例如媒体记者,截至2017年,全国共有持证记者有22.8万人,还有从事记者职业的记者,他们接触的数据信息量相当大,而被采用的稿件非常少,很少有人持续保存这些数据,对数据进行分类的更少。全国的摄影、户外爱好者,他们经常活跃在人迹罕至的地方,他们的摄影作品有艺术价值的毕竟是少数,但作为人工智能训练数据,只要求有一定清晰度就够了,但这些群体保存下来图片、视频信息非常有限。西方很多人都有收集数据的习惯,所以,西方的有效数据集数量远超国内。

3.知识产权意识淡薄,抄袭现象严重。打开百度搜索引擎,搜索结果数量庞大,但可用数据信息非常有限,数据信息大量重复,效率低下,有的网络平台文本、图像、视频、音频等数据全靠抄袭,更有甚者,把抄袭的数据打上自己LOGO,数据污染严重,严重时一张图片被打上十几个LOGO,所剩下的图片信息非常有限。

4.数据市场尚未形成,数据价值评估水平低。现在的数据交易都是零星的协商模式,没有形成有序的数据市场,对数据的价值评估基本没有起步,谁手上有什么数据,谁有数据需求等信息不通畅,造成大量的重复劳动。

5.公益数据平台缺失,部分群体手头的数据无处存放。很多业余数据收集群体,甚至部分仅有数据收集爱好,并不想一次盈利,要这样的群体花钱长期租用空间存放数据,必将影响这些群体收集数据的积极性。

二、建议

1.提升部门数据收集和整理能力和水平。应把数据收集整理作为信息化政务的重要组成部分,与数据相关程度高的部门应安排专门设备和技术力量存储管理数据。提高部门数据的准确性和置信度。完善保密制度,能够向外公开的数据应予以公开,有条件给研发机构提供数据。改变数据条块分割、部门分割的问题。

2.采取有效措施提高国民数据意识。一要进行必要的科普教育,提高国民数据意识和数据收集能力。二要利用各种民间组织,推动数据收集和整理。三要举办有关数据方面的竞技。提升数据收集的吸引力。

3.建立公共数据收集平台。让那些致力于收集数据的人士,有地方存放数据,并发挥数据的作用。可以采用购买第三方服务的形式,购买一定空间用于存储数据。

4.站在供给侧改革高度加强数据市场建设。由于数据需求巨大,应该改善供给侧,保证数据高质量供给,建立安全、可靠、高效的数据交易平台,给数据供给方和需求方提供充分信息。

5.加强互联网知识产权保护。严厉惩处盗用数据行为,确保网上数据的有效性。

扫一扫在手机打开当前页