今天写一写数据要素,这是个刚刚形成的市场,未来也会有非常好的发展,目前对它了解不算太多,还有点抽象,简单分享一下给大家作为参考。
什么是数据要素?我们知道,生产的三要素是土地、资本和劳动力,现在为了适应新的社会发展需要,国家将数据作为一种新型生产要素。
(资料图)
数据可以是数字、文字、图形、声音、代码等,权属清晰的数据变成了企业或个人一项重要资产,简单讲就是借给别人使用收取产权费,将数据资产实际参与社会生产经营活动之后就成为了数据要素。
数据要素可以让企业用于设计出各个业务系统,支撑企业和政府的业务系统运转,实现业务间的贯通与数字化转型。
通过加工、分析、建模等过程,还能揭示出更深层次的关系和规律,使决策更加智慧、智能和精准。
另外,数据要素还可与其他来源的优质数据在新的业务需求和场景中汇聚融合,实现双赢和共赢。
但是现在数据都在各家企业手中,就像每个人手里拿着一块拼图,没有流动到有用的人手中,因此要推动数据要素市场的形成,建立以市场为基础的调配机制,实现数据的流动价值或在流动中产生价值。
数据要素市场归结为数据采集、存储、加工、流通、分析和生态保障六大模块。
尽管数据要素是一个新兴概念,但与数据相关的企业已经经历了较长时间的发展,比如信创领域在数据存储方面已经提前带领国内数据库企业反弹。
以华为、阿里和腾讯为首的云数据库,以及达梦、南大通用为首的传统数据库,还有 OceanBase、GoldnDB 和 TiDB 等国内分布式交易型数据库都在快速发展。
随着 AI 大模型快速崛起,对模型训练的需求也大幅增加,数据加工中的数据清洗、标注和审核等工作需求激增,百度 EasyData、海康 NLP 等技术获得关注。
数据流通环节作为二级市场的关键环节,培养数据要素市场的目标是实现数据在各市场主体间高效有序自由流通。在数据确权和隐私计算方面的国内企业如拓尔思、易华录等公司获得了市场资金的大幅支持。
生态保障的主要参与者是政府机构和组织,例如北京数据资产评估中心、大数据交易所以及国家数据局等监管机构等。
生态保障包括数据安全、数据合规评估、数据资产评估等,其中数据安全是关键。新技术的发展赋能数据交易安全落地、主要包括区块链、同态加密、多方安全加密、数据安全标识、联邦学习等。
按照数据来源可将数据分为公共数据、企业数据、个人数据。作为数据要素产业链的关键环节,数据流通可分为三种形式:数据开放,数据共享,数据交易。
数据开放是一方无偿提供数据,以公共数据为主,因为一般认为公共数据归国家和全民所有,主要靠政府推动建立公共数据开放平台。
数据共享是双方相互提供数据,中间一般不涉及金钱交易。根据共享主体的不同,可分为政府间共享、政企间共享、企业之间共享等形式。
只有数据交易是有偿的,一方有偿提供数据,另一方花钱买数据。目前市场对数据交易需求旺盛,这也是数据流通的关键。
比较大的几个细分市场,有金融行业数据、互联网数据和传统实业数据。
银行、保险等金融机构需要大量个人、企业数据用于判断客户资产状况、信用情况,以便开展业务并控制风险,证券领域产生大量实时数据,通过处理后快速传输给需求方,可以帮助其进行决策。
用户使用互联网产品会产生大量个人数据,主要包括网络购物、社交平台、本地生活服务平台、娱乐平台、搜索引擎等。
互联网平台通过对数据进行分析,可以在合适时间向用户推送合适的产品及内容,而且互联网企业不断升级算法,对数据也有极大需求。
实体企业的生产经营过程中,数据要素能赋能设计研发、原料采购、生产制造、交易、运输、售后等多个环节,帮助企业更好了解市场需求,了解供应链运转情况,提高生产效率。
传统的数据交易以点对点的方式进行,但这种方式的规范程度和交易效率较低,难以大规模推广。因此数据交易所是实现数据流通,充分挖掘数据要素潜力的关键。
数据交易所可以进行资源整合,将数据供给方、数据需求方及法律咨询、资产评估、数据清洗等服务方整合到平台上,推动供需之间实现高效配置。
并提供原始数据、数据产品以及数据清洗、数据标识、数据挖掘等数据服务。
另外在数据交易前,审查交易双方的准入资质;在交易进行时,通过数据确权、数据价值评估等相关规则与制度规范数据交易事项;在交易完成后,通过相关规范文件,确保数据使用合规合法。
终端下游是数据应用。以数据为核心的企业经营管理目前已经成为数字经济时代的主流趋势,数据应用的需求日益增长。
目前全球多个国家对于数据要素都有了初步认知,欧美较早意识到数据的价值,并探索数据要素市场,因此数据交流流通市场规模较大。
根据 21 年的数据,北美洲数据交易流通规模达 960 亿元,占全球总规模的 48%,欧洲数据交易市场规模为 500 亿元,占 25%,我国数据交易市场规模为 250 亿元,占比 %。
欧洲更注重个人隐私保护,对数据要素市场以监管为主,强调严格立法,准备收取数字税,但还没有形成统一的法律规范。
美国比较注重自由和创新,采用各州分散立法和行业自律的方式进行规范,数据跨境流动法律较为宽松。
我国数据要素市场起步比较晚,更注重均衡发展,既要保护隐私又要自由流动。
人工智能、云计算等技术正推动全球数据量迅速扩张,2017-2022 年数据量增速达 20%以上,2023 年全球数据量为 120 ZB,预计未来三年全球数据量仍将保持较高增速,2025 年全球数据量预计达 181 ZB。
我国是数据量增长最快的国家,2023 年我国数据量规模为 30 ZB,占世界总数据量的 %;北美数据量规模为 ,占世界总数据量的 %。2022-2027 年预计我国数据量规模 CAGR 达 %。
我国数据总量与美国不相上下,数据交易市场规模却小很多,如此庞大的数据量,意味着数据要素市场未来发展潜力巨大,数据要素成为数字经济发展新引擎。
有机构数据显示,我国 2021 年数据要素市场规模达 815 亿元,预计“十四五”期间年均增长率达 25%,有望在 2025 年达到 1990 亿元的市场规模。
细分市场看,2022 年数据存储、数据分析、数据加工规模最大,分别为 180 亿元、174 亿元、160 亿元,而数据采集、数据交易规模较小,分别为 45 亿元、120 亿元。
随着人工智能和互联网技术的进步,数据量的增大对数据存储提出了更高要求,数据的安全、可靠和隐私存储市场需求逐步扩张,AI 大模型的快速演进带动数据加工中的清洗和标注工作需求量激增。
政策也在积极推动数据要素市场的发展,提出很多相关政策,还发布了“数据二十条”这一纲领性文件,确立了数据要素发展顶层指导框架。
今年 3 月成立了国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,多个省市也在密集发布数据要素相关政策。
全国各地大数据交易所陆续挂牌运营,加速数据要素价值转化,数据要素产业已经进入实质性落地阶段。
数据要素市场未来也可以给政府增加收入,过去地方政府一直依靠土地财政,也就是卖地赚钱,然而土地资源有限,加上现在房地产不景气,开发商拿地也十分谨慎。
在经济转型和高质量发展背景下,探索通过税收工具和手段,从数字经济的关键要素中取得一部分财政收入,就显得很有必要。
还有 AI 大模型企业对于数据的需求非常大,数据贯穿 AI 垂类模型训练的始终,增加训练数据量对模型性能提升来说更具性价比。
当前拥有大量数据积累并且具备行业 know-how 的企业,能够在大模型的基础上学习行业特色数据与知识,打造出 AI 垂类模型,这也在推动数据要素市场的发展。
例如拓尔思,拥有千亿级优质数据,在垂类模型高质量训练过程中具备独特优势。公司结合行业 know-how,面向媒体、金融、政务领域推出三大行业大模型,实现行业应用落地。
华为也凭借庞大的数据积累和多年行业解决方案经验助力行业大模型加速落地。基于盘古基础大模型和海量行业数据,华为云陆续推出了矿山、药物分子、电力、气象、海浪等盘古行业大模型。
根据艾瑞统计数据,2022 年我国 AI 基础数据服务(含数据采集与标注)市场规模为 31 亿元。
受各类 AI 应用对于图像、语音和文本数据集及定制化数据服务的需求上涨影响,2027 年相应规模可达到 79 亿元,2022-2027 年 CAGR 达 %。
2022 年中国面向人工智能的数据治理市场规模约为 45 亿元,受数据平台服务、数据治理服务和 AI 应用建设的需求推动影响,数据治理市场中的占比不断提升,2027 年将达到 121 亿元,2022-2027 年 CAGR 为 %。
数据要素产业按功能可分为 4 类,分别为数据汇聚、数据流通、数据应用和数据服务。
数据汇聚包括数据采集、存储、清洗、可视化等;数据流通环节企业则拥有包括对数据登记、确权、评估、定价等职能;数据应用即为将数据赋能商业的过程;数据安全包括数据脱敏、隐私计算等。
数据要素是一个庞大产业,行业涉及的企业非常多,首先是在流通中让数据变现,医保、金融或将成为数据要素最先变现的下游应用领域,相关标的包括山大地纬、久远银海、中科软、新点软件等。
其次是拥有优质数据的企业,由于现在数据和土地成为同等地位的生产要素,因此具备一线和新一线城市数据的数商也跟占据核心地段一样具有优势,代表企业有云赛智联、浙数文化等。
另外,从数据储存到数据交付与应用,覆盖全产业链的公司具备数据要素价值挖掘的优势,相关标的包括深桑达、易华录等。
数据要素应用领域中,目前存在多种商业模式。
医保行业可以通过数据通道的信息化建设,经过企业或个人授权后,从大数据局、医保局等数据汇聚端,经医院流通至商业保险公司,从而满足医保结算的数据需求,加快医保信息审核和理赔速度。
金融行业的数据要素商业模式是通过数据服务商打造与金融产业相关的服务工具,再经过用户的申请或者授权,可以使得相关数据直接抵达使用终端,确保数据安性的同时,提高业务办理的速度。
类数交所模式指公司与地方政府共同成立合资公司,地方政府向合资公司提供地方数据运营权,公司所建设的通道和平台扮演类似数交所的角色,可将数据贩售给数商,通过加工形成数据产品。
还有数交所合作商模式,就是为数据提供方与数据需求方提供数据交易平台。
数据提供方可以通过相应的数据流通技术经过合规登记、挂牌申请等流程将数据上台到数交所,数据需求方针对适宜数据可以进行交易协议签订与清算结算,最后通过 API 接口获得特定的数据。
垂直行业中,医保商业模式的相关标的包括山大地纬、久远银海、中科软;金融行业包括山大地纬、新点软件。类数交所模式的主要标的有深桑达 A、易华录,数交所合作商模式的相关标的主要为云赛智联。
或者还可以从数据要素的供给侧、运营端、安全防护三个维度进行分析,筛选出兼具基本面和商业模式的优质企业。
数据要素供给侧,是指行业数据商,具备细分行业的数据积累,未来在数据要素市场具备“数据金矿”的企业。
典型的诸如各行业应用龙头企业,拥有行业垂类数据包括中科江南、航天宏图、浩瀚深度、中科星图、超图软件、久远银海、中远海控、金山办公等。
数据要素运营端,是指第三方专业服务机构,能够为数据交易双方提供数据产品开发、发布、承销和数据资产的合规化、标准化、增值化服务,促进提高数据交易效率。
数据基础设施提供商包括云基础设施(中国电子云、电信天翼云、移动云、华为云等)、数据安全存储(易华录)、数据通信厂商(锐捷网络)、数据库厂商(星环科技、太极股份)。
国家级数据运营商包括中国电科(易华录)、中国电子(深桑达 A)、中国移动、中国电信等。地方国资系数据运营商为云赛智联、山大地纬等。
数据全生命周期安全防护厂商包括安恒信息、永信至诚、奇安信、启明星辰、三未信安、英方软件、信安世纪、格尔软件、电科网安等。