(资料图片)
7月29日晚,华科论道第四十三期在线上顺利举办,罗克佳华科技集团股份有限公司(以下简称“佳华科技”)董事长李玮做了题为《共赴数字之约 描绘数字未来》的分享。
在数据领域,如何获取大量数据,并保证数据质量的安全性以及对红线的把控,关系到一家数据公司的竞争力。
李玮认为,所谓的广泛的大数据是不存在的,更多的是某个行业中的大数据。以生态环境双碳领域来说,绝大部分数据的获得还是通过公开场合和公共领域,包括各个省市县的国民经济数据、统计数据等公开数据。
但这些公开数据往往散落在各个地方,因此公开数据的清洗工作非常重要,首先要通过一些技术手段标明来源。第二,从公共领域中布设传感器获得的数据,也要进行一些合法性和清洗。所以数据来源的合法性和数据的加工清洗脱敏是最重要的环节,使数据变成一个干净的、可利用的数据。
他表示:“数据领域要聚焦,不能什么数据都去拿,最终是要在一个领域中间形成数据积累,是没有什么巧活可以做的笨功夫。我们前前后后几百人,大概10多年时间一直在做数据收集、清洗的工作,一方面给政府做服务,一方面给企业做服务,把前半段工作做得非常扎实。所以万丈高楼平地起,基层不能是沙子,在基础方面要把数据基础基础打好。”
数据的可用性同样重要,你的数据不能是原始数据往外去卖,一定是做成数据产品,里面一定要有算法,否则只给大量的数据给别人去看那就是属于垃圾了。因此,最主要的还是要对数据加工清洗,要有一个数据工厂的概念和设计体系,最后形成大家可用的数据产品。
李玮强调:“做数据,要聚焦,不能一把抓,变成一个纯粹的大数据公司,大数据收集的公司,那真是没有任何意义。一定是要服务于行业,提升这个行业,造福这个行业,最终推动社会的进步,这才是大数据公司真正的意义。”