湖南日报·新湖南客户端通讯员 周妍
1月13日,国家发展改革委、国家数据局、财政部、人力资源和社会保障部四部门联合发布了《关于促进数据标注产业高质量发展的实施意见》,为数据标注产业的腾飞按下了 “加速键”。
在2024年5月的数字中国峰会上,长沙凭借其丰富的音视频等行业数据资源、优质的高校科研人才资源以及完备的人工智能产业链,成功入选承担国家数据标注基地建设任务的7大城市之一。随着这一重量级“国字号”平台的落地,长沙数字经济发展来势喜人,蚂蚁集团、迅雷集团等互联网大厂纷至沓来,数据标注、人工智能产业迎来发展的“春天”。
到2026年,长沙将构建工业制造、交通运输、金融服务、医疗健康、教育教学、文化旅游、地理信息、公共安全等8个行业高质量数据集,带动数据相关产业规模达100亿元以上。与此同时,推动形成全省数据标注产业链同国家人工智能重大生产力协同发展的格局,打造创新活跃、应用广泛、要素集聚的全国人工智能产业发展高地。
抢抓经济新“风口”:标注产业迎来高光时刻,长沙迎风起舞
随着国家重磅文件的出台,社会各界给予数据标注行业更多的关注和认可。与此同时,政策上的大力支持和资源上的优先配置,将为数据标注行业的发展提供有力保障。可以预见,数据标注将成为数字经济新的重要增长点。
什么是“数据标注”?简单理解,就是给文本、语音、图片、视频等各种各样的数据“打标签”。自动驾驶、低空经济、智能制造、智慧医疗……随着人工智能越来越广泛的应用,数据标注正在成为千行百业推进数字化转型的“刚需”。
大模型时代,AI开发以数据为核心,数据的多寡与质量直接关系到大模型的智能水平。数据标注作为人工智能的基础核心环节,意义重大。
建设国家数据标注基地,长沙产业基础扎实,创新土壤优渥:数字经济总量达5000亿元,在全国数字经济百强市中排名第14位;国家新一代人工智能创新发展试验区、国家人工智能创新应用先导区“双区”加持,国家超算长沙中心、中南智算中心在此汇聚,已打造视频文创、金融服务、地理信息等多个高质量行业数据集,大模型应用遍地开花,铁建重工、万象效能、拓维信息交通CV等20余个大模型正在加速研发应用。其中,万兴科技“天幕”、视旅科技VtripGPT、智慧眼“砭石”、芒果TV等大模型通过国家生成式人工智能备案审核,并面向公众提供服务。
此外,长沙发展数据标注产业的应用场景极其丰富、市场空间极为广阔:先后发布智慧城市应用场景清单5批次544个应用场景,总投资额205.43亿元。成功入选全国首批中小企业数字化转型城市试点,近5年来累计推动1660家企业实施“智改数转网联”,建设7000余个应用场景。湖南大数据交易所已发展数商718家,上线数据集交易专版,上架数据集产品284个,交易额达1.5亿元。承办全国2024年“数据要素×”大赛湖南分赛,共吸引全国898支队伍参赛,在工业制造、文化科技、商贸流通等领域涌现诸多优秀案例。率先全国发布政务数据授权运营试点暂行管理办法,针对数据中台汇聚的52家单位的198亿条数据,按照“一场景一评估一授权”模式,在医疗健康、商贸流通、数字金融等领域的16个场景开展授权运营试点。成立湖南省数据标注产业联盟,已吸引企业、高校、科研院所等50余家单位加入,促成7笔数据标注服务合作,订单规模达4.7亿元。
推动产业新发展:赋能优势产业 助推“文化+科技”融合发展
为落实国家数据标注基地建设任务,长沙将整个城市作为一个“大基地”,以全市数字产业为基础,结合相关园区的资源禀赋,构建了“1个综合标注基地+N个行业标注基地”的产业布局。
在2024年9月的岳麓峰会上,长沙首批数据标注基地正式授牌。获得长沙数据标注基地授牌的三个园区各具实力和特色:长沙信息产业园入驻智能网联汽车、数据标注、网络安全等各类数字企业1万余家,打造人工智能创新中心算力服务平台,被授予“综合数据标注基地”;马栏山视频文创园汇聚湖南卫视、芒果TV、中广天择等4千余家文创企业,推出“天择V链”数据交易平台,积累30万余小时高质量算料,形成“数、算、网、研、用”一体化生产环境,被授予“视频文创数据标注基地”。长沙天心经济开发区汇聚地理、气象等8大数据中心,集聚企业6000余家,拥有遥感、测绘等数据超5000TB,被授予“地理信息数据标注基地”。湖南省大数据交易所上线数据集交易专板,上架数据集产品284个,交易额达1.5亿,形成数据采集、标注、交易、应用闭环产业链。
未来,长沙将根据各园区的资源禀赋和产业基础,持续拓展“1+N”产业体系,打造各具特色的数据标注产业集聚区,为长沙“4433”现代化产业体系注入新的活力和动能。特别是对于文化旅游、工业智造、智能网联等优势领域,数据标注将为行业垂类大模型的研发应用提供坚实基础。
长沙建设国家数据标注基地,主要任务就是建成全球高质量音视频文创数据特色开发基地,推动视频数据合成技术达到国际先进水平。马栏山视频文创标注基地的落地,将进一步推动音视频标注行业企业的集聚,为“文化+科技”融合发展注入新的动能。而正在推进的多云融合调度平台、渲染平台、网络平台、数据平台等“四大平台”和音视频实验室、文博可信数据空间等“新基建”也将催生出更多的新质生产力。
开辟就业新空间:数据标注行业成为就业岗位的“孵化器”和“蓄水池”
随着数字经济规模快速增长,新业态、新模式、新产业层出不穷,催生出数据采集、数据标注等新的就业形态和大量就业机会,激活了就业市场的“一池春水”。越来越多的年轻人投入数字经济的怀抱。
2024年7月,长沙举行了首届“星城杯”人工智能训练师技能大赛,开设自动驾驶人工智能训练师和数据标注师两大核心赛道,其中数据标注师赛道还设置了文化、地理信息、医疗、政务、金融等5个子赛道,大赛吸引百余名高手同台竞技。
陈军是长沙谱蓝网络科技有限公司的一名数据标注工程师,亦是此次长沙市“星城杯”技能竞赛地理信息赛道一等奖的获得者。据陈军介绍,像他这样的职业数据标注师,仅谱蓝科技一家企业在长沙就有近800人,其中00后数据标注员达到500人左右,可以说,这是一个青年人才较为集聚的行业。
2020年2月,数据标注员作为人工智能训练师的一个工种,被正式纳入国家职业分类目录。短短几年,这个劳动力需求量巨大的行业迅速壮大。现在,数据标注师的工作并非简单的“体力活”,更需要具备一定的专业知识和技能。例如,医疗数据标注师需要具备医学相关知识,才能准确地标注医学影像数据;金融数据标注师需要具备金融相关知识,才能准确地标注金融交易数据等。
随着人工智能技术的不断发展,数据标注师的需求量还将持续增长。据相关机构预测,到2025年,中国数据标注师的缺口将达到200万人,是一个非常大的就业岗位“蓄水池”。
长沙作为首批国家数据标注基地,在人才资源方面有着得天独厚的优势。“拿深圳的高薪、住长沙的房子、干全球的事业”是吸引年轻人在长沙干事创业、安居乐业的独特魅力。长沙中高端人才综合成本优势明显,拥有本科院校23所、高职高专院校38所,每年培养大学毕业生20余万人。同时,长沙基础教育、医疗水平在全国名列前茅,房价收入比为全国35个主要城市最低,三线城市的生活成本却有着一线城市的生活品质,连续17年获评“中国最具幸福感城市”,上榜中国最具人才吸引力城市前十。
为汇聚培育更多的数据标注人才,长沙设立了数据标注人才职业技能培训补贴1千万元,将加快建设AI数据应用人才公共实训基地建设,带动大学生就业,让更多的青年人才在这个领域成长起来。
来源:新湖南
湖南省人民政府台湾事务办公室
华夏经纬网络版权所有