中共四川省委台湾工作办公室
四川省人民政府台湾事务办公室
四川在线记者 董晓尚
2025年4月27日,四川日报报业集团参编的《AI大模型语料库安全技术指南》团体标准正式发布,标准由17家单位联合起草,四川日报报业集团是其中唯一媒体单位。标准由中国国际科技促进会审核通过,是大模型语料库安全领域重要的技术规范。
随着人工智能系统,特别是大语言模型成为社会各个方面不可或缺的一部分,以一个全面的大模型语料库安全技术标准来解决它们的安全挑战变得至关重要。《AI大模型语料库安全技术指南》团体标准给出了AI大模型语料收集、语料处理、数据评估、安全评估等指导。标准适用于AI大模型的软件产品提供者,语料收集平台、语料处理平台语料评估等。
2024年起,川观新闻就启动建设“若水”四川省情语料库,依托大模型等相关技术,建设省情高质量数据集及数据应用标准化服务体系。在此基础上,四川日报又和多家单位共同启动建设格桑花藏地语料库。将对已整理的超200亿字符的藏文资料、30000多小时的音视频资料进行训练,形成千万条高质量多模态藏语语料。通过数据清洗、知识提取等智能处理,形成藏语核心语料及细分领域知识库,为藏语研究、内容生产与传播提供支撑。
基于《AI大模型语料库安全技术指南》团体标准,“若水”四川省情语料库和格桑花藏地语料库将进一步强化语料安全和应用安全,为媒体领域的大模型相关应用及智库服务提供强力支撑,也为其他人工智能大模型提供安全语料支撑、知识增强服务,助力各类机构研发的人工智能系统提升意识形态安全水平,实现主流价值观对齐。
来源:四川在线
主办:四川省人民政府台湾事务办公室
华夏经纬网络版权所有