$鼎集智能(SZ836954)$  

生成式人工智能引发新一轮智能化浪潮,筑牢数字安全屏障需采取哪些新举措?


  武虹(中国科协创新战略研究院研究员):生成式人工智能作为大模型、大数据、大算力的产物,在强大算力支持下,借助大型语言模型将收集到的海量信息进行处理并回应用户的个性化需求,近乎无成本地生成针对特定提问内容编写的答案,是人工智能领域一次出色的集成创新。


  也应看到,生成式人工智能并不公开其收集和整理的海量互联网语料、模型架构及训练内容,加之其深度学习算法基于统计原理之上,仅对客观规律进行揭示却无法给予解释,已构成事实上的数据及技术黑箱,势必会对数据安全模式带来新的扰动。因此,有必要采取新的应对措施。


  一是强化数据全生命周期监督管理。生成式人工智能语料库的大规模集聚将带来包含数据采集、处理加工、存储及输出等覆盖数据全生命周期的安全问题。数据采集输入阶段,可能会有未经审核的虚假信息入库进而影响语料库质量;数据处理加工阶段,语料库的标注过程可能有意识形态和价值观影响风险,同时算法也可能会有相当程度的倾向性引导,其运算结果又会被潜移默化地注入后续数据处理;数据输出阶段,更是存在非真实世界批量自动产生的海量数据被当作新的语料库,产生后续迭代风险。因此,建议进行数据全生命周期的安全体系构建。例如,针对个人隐私及知识产权等数据,通过隐私计算及区块链等强化数据安全防范力度;针对医疗、金融、电商等重点行业,通过访问控制、安全可信计算环境等技术手段加强防护。


  二是提升对攻击性人工智能的防范意识。攻击性人工智能通常分为两种形式,即“使用人工智能的攻击”和“攻击人工智能”。随着生成式人工智能技术快速提升,网络攻击者编写恶意代码以及实施数据攻击的技术门槛大大降低。同时,大模型也面临被注入特定引导词以诱导其输出伪造数据甚至违法答案等间接数据安全风险。传统的成本高昂的攻击手法,向分布式、智能化、自动化方向演进。建议推动以企业为主体、基于人工智能的新一代数据安全防护等专项研究;鼓励相关行业的科技领军企业发布横向课题,联合高校及科研院所开展协同攻关;通过风险投资引导初创公司将成果应用于数据安全对抗业务,促进以企业应用为导向的生成式人工智能对抗模型产学研一体化创新体系构建。


  三是完善国家层面的数据安全战略规划及顶层设计。生成式人工智能在进行人类对话、推理和翻译写作时,给人类的信息掌控及自主决策能力等带来挑战。同时,生成式人工智能也极大促进了交互式数据的迭代输出与自动传输,增加了危及国家数据主权、信息与网络空间安全的潜在风险。面对生成式人工智能引发的不确定性,需提前研判可能的安全风险,建立健全政府、企业与社会等沟通交流机制,探索推动多方合作的治理模式,加速构建国家层面数据安全战略规划和大模型监管应用法律支撑,通过夯实自主可控新基建设施、加快行业自治规范与国家强制性法律法规等协同体系构建,以及发起或加入单边及多边协议或联盟等方式,巩固国家数据安全防线。


  从国际上看,在生成式人工智能安全防范方面,一些国家的经验做法值得借鉴。例如,欧盟2021年提出《人工智能法案》草案,旨在基于风险识别分析方法为人工智能制定统一的法律监管框架和规制体系。2023年12月,欧洲议会、欧盟委员会和27个成员国谈判代表就该法案达成协议,针对ChatGPT等生成式人工智能工具的透明度问题做出相应规定,其中包括由人工智能生成的内容需提供受版权保护的训练数据集摘要等,还对人工智能风险级别进行了划分,并给出对应的监管要求。美国白宫2022年发布《人工智能权利法案蓝图》,将公平和隐私保护视为法案的核心宗旨。2023年1月,美国国家标准技术研究院发布人工智能风险管理框架,提供系统化评估路径,将人工智能的风险管理分为治理、映射、测量和管理4个模块。其中,治理模块主要针对人工智能系统全生命周期实行有效风险管理机制;映射模块主要用于明确特定场景与其对应的人工智能风险解决方案;测量模块主要采用定量、定性或混合工具,对人工智能系统风险和潜在影响进行分析、评估、测试和控制;管理模块主要针对系统风险进行判定、排序和响应,明确风险响应步骤,定期监控记录并完善风险响应和恢复机制。

追加内容

本文作者可以追加内容哦 !