原标题:“AI数据基石”持续升级,云测数据发布AI工程化的新一代数据解决方案

中国经济周刊-经济网讯 (记者 贾璇) 当下,在AI工程化实践中,核心问题是如何将AI数据、算法、模型与实际场景相结合,如何高效运用数据。百度网盘和云空间,

近日,Testin云测旗下AI训练数据服务品牌云测数据在2022年中国国际服务贸易交易会上,发布面向AI工程化的新一代数据解决方案,这也是AI数据行业领域面向AI工程化的首个数据解决方案。

近年来,人工智能在各行业大规模应用,人工智能技术逐渐从瀑布式开发转为敏捷开发,MLOps等模式应运而生。

云测数据相关负责人表示,如果大致归纳,可以将算法迭代分为三阶段。第一阶段为算法预研期。前期预研立项,对传感器及场景要求较低,需要行业基础数据集。第二阶段为算法研发期。场景定义明确,已完成传感器选型,需要场景化定制采集、清洗、标注数据。第三阶段为算法持续优化期。需要基于场景持续给予生产环境数据对模型进行迭代优化。数据用途不仅用于训练,还运用于评测、仿真场景构建或业务逻辑处理等。

“每个阶段所需要的数据特点鲜明,且不可或缺。如何更好地帮助企业完成算法持续优化期的数据,是帮助企业完成工程化,面向产业落地至关重要的一步。”该负责人说。

为此,云测数据面向AI工程化推出新一代数据解决方案,该方案通过成熟数据管理和标注平台,与企业完成系统集成+支持企业自定义预标注、算法接口+人员管理、项目管理体系+安全交付软硬件支持的方式,在保证数据隐私安全的标注环境下,高度支持企业所需数据的高效流转、持续进行数据处理任务,提高规模化生产效率。

通过云测数据面向AI工程化的新一代数据解决方案,可在保障数据安全的基础上,加速AI企业算法模型开发周期,在AI数据训练过程中综合效能可提升200%以上、数据交付质量最高可达99.99%标注精度、助力企业降本增效。

同时提升数据管理、场景库管理能力,帮助运用人工智能的企业对数据资产加以沉淀、安全管控和风险治理,提升企业AI治理能力,推动挖掘更加多元化的AI价值。

通过采用云测数据标注平台,可提高多个场景下的数据能力。如在自动驾驶领域,可实现车企DataOps(即Data和Operations组合)数据闭环中数据清洗、标注工作,与原流程相比提升2倍流转效率;在零售货检方面,通过云测数据标注平台,将货柜检测数据持续回流,基于算法预标注结果进行可视化审查并修改,与纯人工标注效率提升3倍。

在数字经济持续发展的背景下,人工智能发展迅速并与各种应用场景深度融合,已成为促进经济创新和发展的重要技术。在多元化的人工智能场景落地背景下,推进人工智能数据质量向更高标准发展已成为行业广泛关切的重点。

近年来,云测数据积极推动人工智能数据行业标准化工作的建设,先后参与编制《智能网联汽车激光雷达点云数据标注要求及方法》、《智能网联汽车场景数据图像标注要求与方法》,为产业智能化贡献经验与智慧,推动了AI数据服务垂直领域构建标准化体系。

今年5月,云测数据与华为、百度、百度网盘加速器京东、中原银行等数十家科技公司共同编写《人工智能研发运营一体化(Model/MLOps)能力成熟度模型第一部分:开发管理》,这是Model/MLOps能力成熟度模型系列的首个标准。

“开发管理”部分将面向具备自研能力的用户方企业、ModelOps/MLOps 开发平台产品提供方等对象,以需求管理、数据工程及模型开发三大能力子域作为开发管理的切入点,为具备人工智能软件研发交付运营能力的组织在实施模型开发管理过程中的能力给予评价和指导。

此外,云测数据参编的“数据处理”部分有力地推动了AI数据服务领域构建标准化体系,为AI模型快速获取高质量训练数据提供了科学方法论。

同时,云测数据先后推出“云测数据标注平台”、uc人工客服百度云盘网官智能团建系统官网“AI数据集管理系统”等技术成果,为AI相关企业提供处理大规模感知数据的能力。通过结构创新、智能化、工程化、标准化的标注平台产品赋能AI训练数据行业,极大地加速了人工智能相关应用的落地迭代周期,助力企业AI数据训练综合效率提升200%、标注精准度最高达99.99%。

通过源源不断产出的高质量、场景化的AI数据,云测数据促使人工智能产业加速发展,持续提升了Al应用的规模化落地效果。