关于发展生成式人工智能 加强出版业前沿技术应用的提案

发布时间: 2024-02-27
【字体:

  生成式人工智能技术在知识生产、信息获取和人机交互方面取得了划时代的突破,正在引发新一轮的科技革命和产业变革,不断催生新产业、新业态和新商业模式,培育经济发展新动能。生成式人工智能技术同时也给传统出版业带来了挑战和发展机遇。2022年4月,中共中央宣传部印发《关于推动出版深度融合发展的实施意见》,指出要加强前沿技术探索应用,“紧盯技术发展前沿,用好信息技术革命成果,强化大数据、云计算、人工智能、区块链等技术应用”。但是,生成式人工智能与出版业的融合发展仍面临诸多现实问题:

  一是技术开发与落地应用存在困难。生成式人工智能大模型的三要素是数据、算力与算法。出版业普遍具有较高质量的数据积累,根据国家新闻出版署发布的《2021年新闻出版产业分析报告》,2021年全国共出版图书、期刊、报纸、音像制品和电子出版物426.65亿册(份、盒、张)。但是,出版业在算力方面存在严重不足,算法技术相对落后。人工智能大模型使用具有一定的门槛,如需要一定的基础设施投入等,而出版业的单位体量通常较小,在一定程度上制约生成式人工智能的应用。

  二是生成内容质量不高,存在安全隐患。生成式人工智能基于概率产生内容,经常存在知识记忆错误、信息时效性不足、逻辑推理错乱、专业知识缺乏等问题。如果对大模型的训练数据管控不严,很容易暴露敏感信息,甚至生成不符合社会主义核心价值观的不当内容。

  三是生成训练语料存在合规性问题。生成式人工智能大模型训练需要海量高质量语料数据,但出版业缺少新闻出版数据应用到大模型中的政策指导。大模型技术厂商有强烈的数据需求,希望利用新闻出版机构的高质量数据训练生成式人工智能大模型,但是,新闻出版机构由于缺乏定价标准和收益分配规则,且担心数据安全问题,不敢与大模型技术厂商合作,导致出版机构的高质量语料数据难以高效流通,发挥数据要素价值。

  为此,建议:

  一是加强政策引导和扶持。加快推进生成式人工智能在出版业的落地应用,助力出版业向知识服务业转型。充分考虑出版业发展特点,遵循生成式人工智能服务管理相关文件要求,制定并完善适用于出版业的管理办法,规范、促进出版业人工智能大模型的训练和应用。加强政策扶持,鼓励创新探索,培育生态体系,营造良好政策环境,促进出版业与人工智能融合发展。支持行业组织、企业等在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作。设立扶持计划或项目,推动出版业生成式人工智能基础设施和平台建设,促进算力等资源协同共享。

  二是建立行业准入机制。为保障生成式人工智能技术的有序发展及相关出版融媒体产品坚持正确政治方向、舆论导向、价值取向,建议加快制定出版业的人工智能大模型认证准入相关政策,从国家、行业层面制定人工智能相关技术产品的准入门槛,包括相应的认证、备案、监管等细则。同时,为确保大模型训练结果的准确性和可信度,建议制定相关工作指南,以确保训练过程的高效和结果的可靠性、安全性。

  三是建立训练语料付酬标准。面对大模型训练数据中可能涉及的侵权问题,除了规范数据合规使用外,监管部门还应着力推动制定生成式人工智能训练语料的权益分配办法,充分考虑多元利益相关主体的不同诉求,既激励人工智能产业的创新发展,又能够保障高质量数据生产者的合法权益。

作者:
责任编辑: 邵飞
>