当前位置 >> 长沙新闻

加“数”奔跑!长沙与5家行业知名企业达成战略合作 数据标注底座更“实”

发布时间:2024-10-24 10:15:48

  星辰在线10月23日讯(星辰全媒体记者 贺亚玲 通讯员 吕鑫)10月22日,由国家数据局数字科技和基础设施建设司指导,国家数据局人工智能专班主办的首届“数据标注产业大会暨供需对接会”在北京召开。长沙作为全国首批7个数据标注基地之一,与5家数据标注、人工智能领域知名企业签订合作框架协议,标志着长沙高水平建设数据标注基地又迈出坚实的一步。

  在大会数据标注基地企业招引推介环节,长沙市数据局党组书记、局长周娟平重点推介了长沙的发展环境和基础条件优势,详细解读了数据标注基地面向企业的招商政策,分享了基地建设的最新进展,并公布与各界合作的诉求,引发与会企业代表广泛关注和热议。

  经过充分的供需对接,长沙市数据局与北京星尘纪元智能科技有限公司、中国长远控股有限公司、数字天蚂信息技术有限公司、智慧足迹数据科技有限公司、中国科学院地理所国家重点实验室、北京聆心智能科技有限公司等企事业单位签订了合作框架协议,涉及长沙数据标注基地建设、千人数据标注基地建设、地理信息数据标注、大模型数据标注服务等多个领域,将携手推进长沙数据标注基地建设,带动数据标注、人工智能产业蓬勃发展。

  数据标注是指对图片、语音、文本、视频等数据进行处理,标记对象的特征,生成满足机器学习训练要求的可读数据编码。数据标注企业,通常需要完成数据集结构/流程设计、数据处理、数据质检等工作,为下游客户提供训练数据集、定制化服务。数据标注一直是人工智能技术研发中不可或缺的一环,伴随着AI在自动驾驶、金融、医疗、安防等多个垂直场景的深度落地,数据训练需求海量增长,数据标注也摆脱了传统劳动密集型行业的局限性,向高技术含量、高知识密度和高价值等特性发展。目前主流的机器学习方式是以有监督的深度学习方式为主,此种机器学习方式下对于标注数据有着强依赖性需求,未经过标注处理的原始数据多以非结构化数据为主,这些数据无法被机器识别与学习。只有经过标注处理后的数据,成为结构化数据才能被算法训练所使用。

  当前市场上数据标注的主要类型有计算机视觉、语音工程、自然语言理解、自动驾驶点云等等。作为人工智能算法有效运行的关键环节,在中国人工智能产业高速增长的背景下,数据标注行业也呈现出整体向上的发展趋势。相关机构根据国内需求方与供应方营收增长情况推算,预计2024年数据标注市场规模为130亿~180亿元,2025年市场规模为200亿~300亿元。

  此次签约为长沙数据标注基地建设注入了新的活力。作为承担数据标注基地建设任务的城市之一,未来两年,长沙将以建成全球高质量音视频文创数据特色开发基地、打造国家文化和科技融合试验区为总体目标,大力发展数据标注产业,推动视频数据合成技术达到国际先进水平,构建工业制造、交通运输、金融服务、医疗健康、教育教学、文化旅游、地理信息、公共安全等8个行业高质量数据集,带动标注从业人员1.5万人,拉动标注产业规模达15亿元,带动数据相关产业规模达100亿元以上。与此同时,推动形成全省数据标注产业链同国家人工智能重大生产力协同发展的格局,打造创新活跃、应用广泛、要素集聚的全国人工智能产业发展高地。

  【来源:星辰在线】

  长沙市台办供稿

长沙市人民政府台湾事务办公室

联系邮箱:stbxzc20130516@163.com

华夏经纬网版权所有