今年4月,国家发改委首次发函确定了“新基建”。与前几轮基建关注桥梁道路、建筑工程不同,新基建以数字化、智能化为主基调,围绕着5G、云计算、AI展开,全力构建信息数字化基础设施,助推我国经济持续飞跃增长。
作为新基建最核心版块之一的人工智能,是许多领域数字化与智能化转型的基础与关键。在新基建政策推动下,人工智能版块迎来了新腾飞,大批资金、人才流入,一场科技竞赛即将打响。
据天眼查数据显示,以工商登记为准,仅5月,我国新增人工智能相关企业就有近11万家,在传统企业受疫情影响业务收缩时,人工智能产业逆势增长,较去年同比增长28.54%。新增的企业分布在AI产业链的各个层级,而入局门槛相对较低AI基础数据产业受到青睐。
AI离不开数据,新基建撬动行业变革
作为驱动AI的三驾马车之一,数据相对算法、算力,受关注程度不高,但数据的重要性却是不容忽视的。
在目前主流的深度学习框架之下,算法模型十分依赖人工标注的数据,并且短时间内,这种依赖还很难改变。
Google AI部门负责人Jeff Dean曾在公开课上演示过传统训练方法与深度神经网络算法在不同数据规模之下的表现,结果证明深度神经网络模型的准确率与数据量呈正相关,也就是说,数据量越大,算法模型最后的效果就越好。
通常情况下,训练一个最简单的图像物品识别算法,需要至少数万张图片标注数据;一个文本审核程序,需要数十万甚至上百万条NLP数据训练;一个语音交互应用,需要数千小时的语音训练,并且还得针对不同口音、不同话题持续优化;而布局一个智慧城市应用,所需的数据量更是惊人。
在新基建浪潮下,AI科技企业为了抢占市场,不断提高算法精确度,并且与许多传统产业相结合,创造新的应用场景,因此将释放出大量的数据采集与标注需求,涌向市场。
根据艾瑞咨询发布的《2020年中国AI基础数据服务行业发展报告》预测,中国人工智能基础数据服务市场规模,到2025年将突破100亿元,发展前景巨大。
AI基础数据产业引来洗牌期,突围者会是谁?
在新基建的政策推动下,国内AI数据市场规模将迎来猛增,玩家逐渐入局分食蛋糕,AI数据服务商之间的竞争开始日益加剧,一场突围赛迫在眉睫。
从市场整体来看,目前我国AI基础数据市场的竞争者主要有两类。一是中小数据供应商、众包团队,这类供应方通常盘踞在国内三、四线城市小镇,依靠大量廉价的劳动力,迅速占领市场,成为了AI数据产业的中坚力量。
但总体而言,这类供应模式还属于劳动密集型产业,在市场扩张早期,能享受到部分红利,随着大批竞争者的涌入,最终会因缺乏商业壁垒,而生存困难。
考虑到长远发展,许多供应商转型,从而诞生了品牌数据服务商这一新模式。
品牌数据服务商从技术和服务流程两方面深化,角色从数据提供者,转变为数据处理专家,通过为客户提供一站式的数据解决方案,来建立自己的竞争壁垒。
从市场反馈来看,越来越多科技公司倾向选择品牌数据服务商。主要原因是品牌数据服务商技术相对更成熟,拥有自有标注平台,在规范性、安全性都更有保障,并且对于小语种标注、NLP、语音合成等难度较高项目,品牌数据服务商也更具优势。
目前,市场上已经涌现了一批品牌数据服务商,但囿于技术、资金等因素,总体数量还相对较少。
景联文:专业数据服务为AI商业赋能
2012年组建的景联文团队是市场上最别树一帜的AI品牌数据服务商。景联文早期专注于指纹防伪技术,靠算法发家,2017、2019年连续两届拿下LivDet:Fingerprint Liveness Detection Competition(国际活体指纹检测大赛)全场冠军。
因为指纹算法业务的采集需求,景联文在原有基础上逐渐衍生出了数据采集与标注业务,并于2016年正式面向市场开放。
得益于多年指纹采集业务的流程经验,在数据来源合规以及交付保密性方面,景联文一直走在行业前列。
随着人工智能产业的发展,景联文乘着这股浪潮,在行业中迅速崛起。目前景联文在全国范围内拥有5个标注基地,220名全职人工智能训练师;上线了自有标注平台,涵盖了绝大多数主流标注工具,支持语义分割、拉框标注、多边形标注、关键点标注、3D点云、2D3D融合标注、图片分类、声纹识别、ASR转写、韵律标注、NLP、文本分类、OCR转写、情绪判断等多种标注业务;提供企业私有化部署、跨地区作业等定制服务。
无论是前两年的行业降温,还是疫情期间的断档,景联文的业务都非常稳定。
景联文CEO郑晓薇说“景联文的发展方向从来都是能够为客户提供合理、安全、可靠的AI数据解决方案,这是目前市场上非常稀缺的一种竞争力。”
而对于新基建带来的机遇与竞争,郑晓薇则表示:“我们有信心接住这股浪潮!”
伴随着一系列的政策红利扶持,AI技术将以最快的速度更新迭代,最终将在教育、安防、家居、生产等多个领域实现商业落地。而为客户提供一站式数据服务的景联文,在这轮新基建中,将作为基建力量,默默支撑着人工智能产业迈向新的高地。