360重点是要打赢三场战,“通用大模型之战”、“大模型安全之战”以及“大模型应用之战”。

360集团副总裁殷宇辉:解析企业级AI大模型的多维技术革新与场景融合

www.163.com 2024-12-24 19:18

12月18日,由亿欧主办的WIM2024创新者年会在北京威斯汀酒店正式拉开帷幕。

本届WIM创新者年会以“AI For X 未来产业范式跃迁”为主题。这是中国第一场专门聚焦“未来产业”的千人峰会——会议邀请了来自未来产业界的100+位头部企业专业嘉宾、超过2000位行业从业者齐聚一堂,共同总结2024年未来产业创新成果,预测2025年最新创业创新趋势。

本次大会在北京、上海、深圳三地举办,三城联动、持续三天(12月18日-20日),会议以独立演讲、圆桌论坛、报告首发、百人晚宴、榜单发布等多种丰富形式,为大家带来一场商业视听盛宴!2024年是世界创新者年会(World Innovators Meet,WIM)走过的第十个年头。

十年来,中国科技创新动能澎湃,新兴产业风起云涌。本次峰会邀请了360集团副总裁、360数智化集团CEO殷宇辉,发表了《企业级AI大模型:多维度技术引领与场景共建》的主题演讲,他的主要观点如下:

1、面对变革,重点是要打赢三场战,“通用大模型之战”、“大模型安全之战”以及“大模型应用之战”。

2、大模型全新特性带来了全新安全挑战,传统网络安全无法应对,要用大模型能力应对新型安全问题。

3、AI的安全包含三个方面,自身安全、应用安全和伦理安全,这些问题既需要关注,也要做好。

4、大模型应用场景发展趋势是专业化和垂直化。

5、最完整的场景优势是我们整体弯道超车的关键,中国企业要在保障大模型基础上做好应用落地。

以下是速记整理(有删减):

首先感谢大家,我是殷宇辉,来自360,目前负责360集团数字化、智能化业务开拓及技术中台管理工作。

今天很高兴在亿欧AI for X大会上和大家分享一下,我们一些企业落地大模型的方法论和实践。

今年大家会发现有几个趋势,一是AI应用方面已经从免费玩具变成了付费工作,今年很多大厂推出了自己的AI会员服务,我知道有几家做生图、工具包今年营收都还不错。

二是我们可以看到AI一部分已经成为了大家生活、工作的助手,豆包、KIMI、360AI工具包也好,大家可以很方便的去做ppt、翻译论文。

三是产业方面,大量场景开始用AI从外围工具走到业务核心,早期最主要是作为一个比如说系统内周报生成,或者报告文档的生成,但是现在深入到生产制造的各个行业里面去了。

大模型的发展至今,竞争已经变得日益激烈,这不仅体现在国内市场,国际市场也是如此。

这种竞争态势不仅关乎个人,对企业而言竞争同样激烈。面对这场大变革,我们认为重点是要打赢三场战,第一场通用大模型之战,第二个大模型安全之战,第三个大模型应用之战。

在这三场战争中,中国企业既拥有优势也面临劣势。由于中美关系的紧张以及两轮制裁的影响,中国企业在技术领域,尤其是GPU芯片和算力方面遭受了限制,这是我们的劣势所在。

然而,中国企业的主要优势在于拥有最完整的产业链和最丰富的应用场景。因此,这些场景可能是我们整体弯道超车的关键环节。我们认为,中国企业最要紧是在保障大模型基础上做好应用落地。通用大模型之战,也就是打造通用人工智能(AGI)。

Open AI在年底连续十天的发布会展示了其在多个领域的探索和尝试,包括医疗和安全等。我们观察到Scaling Law的效果正在减弱,这表明AI技术演进到了新阶段。这并不意味着竞争会停止,卷算力、卷数据、卷参数,模型向着万亿参数发展,从今天的角度来看,这场竞争相当于造“原子弹”,无论国内还是国际,最终可能只有少数企业能够坚持并走完全程。

其实对于更多企业来讲,它不需要关注千亿、万亿这种通用模型,更应该关注垂直模型,或者十亿、百亿这种量级的模型,进而在保证安全前提下找到合适的应用和场景。第二点,大模型的安全问题已经超越了传统网络安全的范畴,变得特别难以应对,并带来了前所未有的安全挑战。

例如,最近出现的许多案例中,数据投毒问题尤为突出。相信大家已经通过新闻了解到,数据投毒的影响是多方面的:轻微的情况下,它可能导致价值千亿的模型连续训练数月而无法收敛,或者导致模型的效果大打折扣;严重的情况下,它可能导致整个模型在伦理识别上出现问题。

因此,当我们讨论人工智能的伦理安全时,实际上也在探讨是否可能违反机器人三定律:第一定律是机器必须永远服从人类;第二定律是机器必须保护人类的安全,除非这与第一定律相冲突;第三定律是机器必须保护自己的存在,只要这与前两条定律不冲突。

从长远来看,我们不禁要问,是否会有一天违反这些定律?然而,目前我们确实看到了新的攻击手段和手法,它们能够绕开大型模型的基础设计,从而引发更多的危害。

如果各位关注了Open AI的发布会,会注意到Open AI最近发布了其人工智能安全策略,该策略重点解决了大家之前的担忧。在以往的代码模型或使用Open AI接口时,人们普遍担心数据是否会被上传。我认为,最近发布会上公布的一系列策略将更好地保护数据和个人隐私。

在应用场景方面,我们的观点是,发展趋势将逐渐专业化和垂直化。正如云知声的黄总所言,在医疗领域,通过将大模型与小模型以及场景相结合,可以实现多模态的丰富应用。对于这一点,我们也正在进行持续的探索。我们有几个观点。

首先,模型会越做越专。

其次,模型会越做越小,但这并不意味着模型的性能会降低。因为大量的小模型基本上都是通过大模型蒸馏出来的,蒸馏出来的模型仍然具备强大的能力。

第三,成本将会越来越低。以我们线上为终端用户(ToC)提供的AI搜索服务为例,后台实际上已经集成了接近12家大模型。这个大模型推理价格过去一年半基本上下降200多倍。

到企业真正落地这个模型,我们提出了六步走方法论。我们总结认为,在确保安全的前提下,要学AI,用AI,造AI然后一步一步去走向深水区。

这与前面嘉宾所讲的内容相似,关键在于如何利用企业内的知识管理,包括医疗行业和其他行业在利用智能体等技术,以提高企业效率。

方法论第一步,讲的是人人智能,人人普惠、人人受益。

因为要想实现企业里面对于AI的应用,必须得由一线员工去主导,让最了解业务的员工真正用上对AI相关的产品。例如,我们最近推出的360AI搜索产品,实现了拍照提问、语音搜索和听取答案的功能,与刚才的演示相似,我不再赘述。与传统的关键词搜索相比,AI搜索确实有很大的改进,能够实现模糊语义理解和生成摘要,快速一键搜索到答案。

方法论第二步,企业办公和营销场景要率先AI化。通过360PC端的数据分析,我们认为办公和营销是最早可以实现AI化的领域,因为这两个场景最为成熟,且对企业核心业务的干预相对较少。

先在这些领域应用AI,可以解决许多工作单点效率提升的问题。基于当前通用大模型提供的助手能力,基本上可以满足企业70%至80%的需求。我们也推出了360办公一站式工具集,包含360多种不同功能的一站式工具,如会议整理、表格、PPT、PDF等。大家有兴趣也可以尝试使用。

方法论第三步,大模型安全必须“以模制模”。大模型安全是一个非常严肃的话题,目前也面临着重大挑战,例如注入词攻击等系列问题,这些问题难以通过传统方法得到有效解决。

要解决大模型安全的问题,可能需要用安全大模型,也就是用大模型来解决大模型本身的安全问题。最近我们一方面联合信通院发布全球首份大模型漏洞报告,里面涉及国内外将近40种基础大模型,从架构到应用意识等相关的漏洞分析。

此外,我们昨天推出了新的AI安全产品,因为现在虽然在政企、企业客户里面往往不只是有一个大模型,它有一系列的大模型。但是这些大模型如何保证内容安全、底层架构安全以及输出可信度达标,这些是大模型能不能从企业内部提效,变成对外服务一个关键。因为生成式大模型的幻觉问题尤为严重,尽管已有如RAG等处理手段,但如何确保在公开平台上的内容输出始终是可信和安全的,这是一个值得高度关注的话题。

总结一下,我们在大模型安全侧提了八个字,叫做安全、向善、可信、可控,也是基于这个理念我们一步步完善自己的360智能大模型。

方法论第四步,选择最合适的业务场景,落地大模型。对于垂直大模型我们希望选择最合适的业务场景去落地,该怎么选择呢?我们有两个原则、四个要点。

一是四个方向原则,叫“对上对下对内对外”。“对上”,对你的领导提供什么样的数据分析支持;“对下”,给员工提供什么便利;“对内“,是怎样改善内部的IT或者服务、业务系统”;“对外”,怎样改进获客及业务增收的流程。

二是四个“十倍”原则,即“降低10倍人力”、“降低10倍成本”、“提高10倍效率”以及“提升10倍体验”。这个“十倍”并不是指在采用大模型技术的初期就能立即实现的效果,而是可能需要经过三到五年甚至更长时间周期才能体现出来。正如前面所提到的,大模型技术在初期更多地体现在成本方面,如果仅从直接的经济收益来计算,可能在短期内难以看到明显的回报。

三是"四"个要点,原先,我们使用的通用大模型主要依赖于大数据、大算力和大工程。然而,当这些模型需要在企业中落地时,我们需要遵循以下步骤:

第一步,掌握企业内部分散的知识或专家经验,并将这些专家经验进行知识管理。

第二步,针对这些数据和知识,打造专业的模型。这一过程中涉及到众多技术,包括微调(Fine-tuning)和响应生成(Response Generation)等。

第三步,构建相应的智能体。智能体能够将多个片段化的场景整合起来,我们称之为“剧本”(Playbook)。

第四步,融合工作流。通过将这些智能体与企业现有的工作流软件相结合,可以将所有智能体串联起来,从而有效地实现融合的工作流。

接下来,我将介绍两个复杂的应用场景。这些案例是我们与客户合作的大型方案实例,目前也在一些试点钢铁企业中推广。炼钢是一个极其复杂的过程,涉及几个典型的处理场景:

北材南运:钢材和原料在不同时间节点的价格波动。例如,北方的钢材运往南方港口,需要确定何时能够预测出最佳运输时机。

高炉炼钢工艺:这一工艺非常复杂,过往的知识往往掌握在拥有十几年经验的老师傅手中。挑战在于如何将这些专家经验复制并转化为可操作的模型。

炼钢中的尾料废水处理:过往的处理方法涉及不同的配比,废水处理不仅仅是排污问题。以上只是一些典型的例子。我们与相应的钢铁厂和专家合作,整体梳理后,能够将炼钢工艺拆解成190多个工序,并结合专家经验构建了大约142个大小模型。只有针对这些模型进行深入研究和应用,才能真正实现业务流程的优化和拆解。

这是我们讲的方法论的第五步,在传统行业和业务中找到工作流程中的卡点和堵点,有了卡点堵点,下一步是利用大模型和AI来制定相应的解决方案,以帮助它提质增效。

第二个复杂场景涉及政务、公安、检察、法院和司法等公共安全领域,特别是在应急处置和预案管理方面。面对这类复杂且严肃的场景,存在以下挑战:

一是通用模型难以理解行业内的专业术语和套话。

二是业务人员需要全链条的支持,即使得到了最终结果,也需要将大模型的思维链路完整地复现出来。

三是业务系统极为复杂,例如在这些场景中,存在多模态摄像头、基于业务规则的海量大数据模型,以及多达十几个到几十个的业务处置系统。

这涉及到方法论的第六步,面对复杂场景,实现多智能体配合,调用多模型能力。如何连接大模型与业务系统,实现以业务目标为中心的工作流管理,是一个至关重要的问题。

经过我们的全面分析和拆解,我们实现了多智能体的协同配合,能够调用底层的大小模型,如多模态大模型或数据处理大模型,最终实现了从视觉识别到数据分析再到应急处置的一体化协同工作流程。

总结来说,人工智能(AI)不仅提升了生产力,也是数字化转型和治理改革的深水区。在这一领域,更多需要的是工程技术和专家经验的结合,而非完全依赖单一的大模型来解决问题。可能需要我们采用多智能体系统以及其他解决方案。同时,我们也见证了像AlphaFold这样的前沿探索正在进一步得到实证和落地,相信未来“AI for Science”将为人类带来更大的想象空间。

追加内容

本文作者可以追加内容哦 !