科技 economic
您现在的位置:首页 > 科技 > 为人工智能输送“燃料”,这家公司想让AI数据服务更智能 | 创新家

新闻

化工事故年损百亿?谷东科技AR黑科技如何化险为夷? 化工事故年损百亿?谷东科技AR黑科技如何化险为夷?

化工行业年产值3.6万亿美元,背后却藏着触目惊心的安全隐患。数据显示,我国每年化工灾害事故高达百起,直...

  • 全国农技中心到广东调研智慧农业,丰农控股获高度认可

    3月19日至22日,全国农业技术推广中心组织浙江、山东、广西、四川、陕西、广东等省农技推广部门领导专家,调研广东智慧农业。调研组以现场查看、座谈交流等方式,聚焦智慧果园,深入走访广州、韶关、河源、惠州、...

  • 天自照明微孔交叉出光射灯照明行业新趋势

    天自照明首次在国内推广小孔出光射灯,凭借其在照明技术上的独特优势,一举推出6种结构,20款家族式矩阵小孔出光产品,全系列独立开模制造,利用交叉出光技术,通过特定的结构设计、光学设计、LED光源设计,充分...

  • 微软智能办公工具OfficePLUS让创作更轻松!PPT/Wor...

      近日,微软发布智能办公工具OfficePLUS V3.0版本。 全新升级的OfficePLUS V3.0新增了Excel插件,继已发布的PPT/Word插件之后, 完成了对Office核心使用场景的全方位覆盖,让用户拥有更加轻松的创作体验。 ...

科技

勇闯前人未至之境,Pimax Frontier 2022破界而来 勇闯前人未至之境,Pimax Frontier 2022破界而来

北京时间11月10日上午10点,小派科技将携又一款VR3.0力作在PimaxFrontier2022海外发布会正式亮相。去年...

  • G客 4力释放!耕升 GeForce RTX® 40系列GPU评测解...

    2022年9月20日,NVIDIAGTC 2022主题演讲在美国加利福尼亚州圣克拉拉举办。在本次主题演讲中,无数玩家和创作者们期待的GeForceRTX®40系列GPU和NVIDIA®DLSS 3正式发布,为玩家和创作者带来巨大的性能提升。 &n...

  • “破圈”的协作机器人|看越疆如何赋能新商业!

    协作机器人以革新的人机交互技术,打破了传统机器人应用场景的边界,由于安全易用,灵活智能等先天优势,协作机器人在越来越多的场景下释放出巨大潜能,从工业到商业应用快速延伸,势如破竹,触发了前所未有的机遇。 ...

  • 用高科技替代除草剂 保障粮产与食品“双安全”

    “新冠肺炎疫情迅速蔓延全球,一些国家和地区正在加强贸易管控。对于我国粮食安全同样带来严峻考验。”近日,在江苏扬州江都区宜陵镇北斗导航数字化精准化物理除草新技术现场会上,扬州大学机械工程学院张瑞宏教授...

为人工智能输送“燃料”,这家公司想让AI数据服务更智能 | 创新家

发布时间:2020/06/26 科技 浏览:444

记者 | 周伊雪

编辑 |

1

2016年,以AlphaGo战胜韩国围棋九段选手李世石为标志,人工智能技术(主要是深度学习)开始在世界范围内掀起热潮。随着这股热潮,为人工智能算法输送“燃料”的数据标注行业也开始兴起。

深度学习的核心理念是希望计算机通过反复学习和模仿来接近人的智商。因此,初期为了训练模型需要输入大量标准化的数据。但在现实世界中,数据都是非标准、非结构化的,而将这些数据进行标准化、结构化的过程在业内被称为“打标签”。没有这个过程,就没有人工智能模型的建立。

通俗地说,如果人工智能是发动机,标准化数据就是这台发动机的燃料。

艾瑞咨询调研显示,2019年中国AI基础数据服务行业市场规模为30.9亿元,根据需求方投入情况和供应方营收增长情况推算,预计2025年市场规模将突破100亿元,年化增长率为22%。

倍赛BasicFinder是一家提供自营加第三方数据采集与标注解决方案的公司。公司创始人兼CEO杜霖毕业于上海交大ACM试点班,选择数据标注行业作为创业方向源于杜霖的一次经历。

深度学习技术兴起后,2015年下半年,杜霖与几个交大同学想到应用这项技术做一个关于冰箱内食品的识别系统,希望能做到自动识别冰箱内的食材情况,以提醒用户处理过期食材或者及时补货。

为了做出这套系统,杜霖发动周围的朋友共采集五万多张冰箱内食材照片。耗时6个半月后,终于做出了系统模型。但他发现,整个过程中采集和标注数据的时间花了四个半月,而真正建模的时间只有一个半月。这令他意识到,数据采集或许才是现阶段人工智能领域发展的核心痛点。

一些业内人士认为,现阶段人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,想要落地,解决行业具体痛点,需要大量经过标注处理的数据做算法训练支撑。某种程度上,数据量决定了人工智能技术的落地程度。

2016年,杜霖创立了以数据采集和标注作为核心业务的倍赛。公司提供两种业务模式:一是为根据客户需求,提供数据采集、标注到模型训练和评估的全流程服务。另外,推出私有化数据标注平台BasicFinder Hive和在线数据标注平台BasicFinder SaaS,令客户可以将数据标注流程和标注工具集嵌入到人工智能模型研发的业务链条中。

目前,倍赛的技术团队共70人左右,全职数据标注团队大约有2000人。2019年下半年,倍赛获得五岳资本和Talkingdata的四千万人民币投资。杜霖透露,自成立以来,公司营收的年均复合增长率超过200%,2019年公司的营收已经达到数千万级别,预计今年将实现盈亏平衡。

数据标注行业可以成为观察人工智能领域发展变化的一个窗口。从2015年到现在,人工智能行业的投融资数额逐渐减少,行业从狂热回归理性。但杜霖认为,这并不代表行业发展进入停滞,事实上,倍赛BasicFinder的营收仍然在增长,越来越多的传统行业公司开始成为倍赛BasicFinder的客户。

某种程度上,这也反映了人工智能商业化落地过程中一项重要的趋势变化:当谷歌等公司将深度学习底层框架开源后,建模门槛逐渐在降低,拥有场景的传统行业开始在人工智能商业化上扮演更重要的角色。以技术和算法见长的人工智能公司则在式微。

“越来越多的传统公司寻求用人工智能技术提升业务效率。”杜霖告诉笔者,原来倍赛的客户中有七八成是AI公司,现在AI公司则占到不足四成。

比如,农牧行业的新希望集团希望通过人工智能技术实现“猪脸识别”,以此监控猪的健康状况,提升养猪效率。目前,除了商汤、旷视这样的人工智能公司,招商银行、新希望集团、上汽集团这样的传统行业企业也成为倍赛的客户。

此前行业需求爆发时,为数据打标签的门槛并不高,成本是拿到订单的关键要素。杜霖告诉笔者,两年前,市场曾疯狂涌入很多数据标注公司,甚至有网吧、刷单公司都摇身一变成为数据标注公司。但随着需求方对于数据标准的要求越来越细致、对场景的理解要求更深刻,在数据标注行业,技术扮演的角色正越来越突出。

据杜霖介绍,倍赛BasicFinder已经可以实现从数据标注到模型训练迭代的一站式服务。

“靠廉价劳动力进入这个行业的公司,因为无法满足客户对数据精度和质量的要求,以及无法通过技术手段来降低成本,都会被市场淘汰。”杜霖说,比如在某些数据标注业务场景中,使用带AI辅助的标注工具可以提升数十倍效率。

艾瑞咨询认为随着业务门槛提升、客户需求多样化, 越来越多的“中小型数据供应商” 在为生存问题而苦恼,该群体在未来1-2年内将迎来一阵倒闭潮。

杜霖也强调,数据标注行业正在从分散走向集中,未来能够通过技术提升行业效率、降低成本,工具链足够高效和完善的公司将在竞争中最终胜出。

姓 名:
邮箱
留 言: