风起于青萍之末,浪成于微澜之间。3月30日,彭博社发布了专门为金融领域打造的大型语言模型((Large Language Model,LLM),取名:BloombergGPT。
AI大模型落地金融行业
专业领域的 GPT 大模型就这样来了。
据彭博社发布的论文显示,这是一个具有500亿参数的语言模型。在保证LLM通用性能的基础上,更加聚焦金融场景,更加适应金融术语的复杂性与独特性,有效实现了GPT+垂直知识的深度融合。
BloombergGPT一亮相,最为行业关注的就是,构建了目前已知的最大的领域特定数据集。
为训练BloombergGPT,彭博构建了一个全面的数据集“FINPILE”,主要由英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件,以及从彭博档案库中提取的社交媒体消息。
开发团队将这些数字资源进行创建、收集、整理和训练,构建了迄今为止最大的特定领域数据集,一个拥有超过7000亿个标签的大型训练语料库。
对比来看,500亿模型参数的BloombergGPT,核心突破在于金融语料,实现了模型在金融领域的知识强化。
BloombergGPT的出现对金融行业无疑是一次颠覆性创新。可见,未来具备细分领域高质量数据的公司在大模型的应用上将获得先发优势。金融行业或成为垂直 GPT率先落地的场景。
金融AI大模型 蓄势发力
金融行业复杂且含有大量金融术语,整个行业需要一个专攻金融专业的模型。越来越多的金融机构迈出了金融AI大模型应用的第一步。
近期,某两家大型国有银行分别推出类ChatGPT的大模型应用ChatABC,和基于昇腾AI的金融行业通用模型。
垂直行业的高价值量数据对于 AI 大模型的训练和垂直领域应用至关重要,金融行业数字化程度领先,拥有数据富矿,有望成为 AI 大模型率先落地的垂直领域之一。应用端,我们看到生成式和理解式大模型在银行、保险、资管、投研、投顾等多个细分领域正在落地或拥有潜在落地场景,帮助金融机构降本增效。
眼下,GPT大模型的开发已经成为业内的趋势,众多的公司开始有计划的推出基于自身领域的垂直类大模型。
“这正是科技投资的重要机会。科技的特点是内生的颠覆性,总会有一些新的要素去取代旧的要素。科技的本质是提升供给效率。”嘉实基金大科技研究总监王贵重表示。“各种GPT最近爆火出圈,标志着AI在自然语言学习(NLP)领域的大模型的进展,AI的认知能力得到了跃升。这类利用人工智能来生成内容(AIGC)的重大意义在于它可以大幅提升人机的交互体验。”
人工智能新范式的探索
这一类AI大模型是商业模式的创新应用,最大的机会在于它可以赋能多个场景。
金融行业在AI应用的切入点,比其他行业更具有独特价值。通过AI可以实现金融资讯、产品介绍内容的自动化生产,塑造虚拟数字人客服、投研服务等,AI与金融业务的融合会愈发密切。
以投资研究领域举例,AI大模型或将成为投研从业者的“小助理”。
理解式大模型不仅可以帮助了解国内外的宏观政策、行业信息、公司和产品信息,并将关键信息进行抽取与提炼,还能通过对海量非传统数据进行挖掘来发现另类投研因子。生成式大模型则能实现研报的自动生成和翻译。
“从今年开始信息革命有望开启全新篇章。2023年将是‘信创政策+订单’双重确定性之下的加速放量之年。伴随GPT类模型持续发展,这类利用人工智能来生成内容(AIGC)的重大意义在于它可以生产信息和大幅提升人机的交互体验,有望给各个行业带来机会。在中国,依然处于产业的早期,大家越来越意识到数字化的重要性。而此轮数字化将会和人工智能深度融合,也会给中国公司带来发展的机会。” 王贵重分析。
大家都在看
*风险提示:基金投资需谨慎。投资人应当认真阅读《基金合同》、《招募说明书》、《产品资料概要》等基金法律文件,了解基金的风险收益特征及其特有风险,并根据自身的投资目的、投资期限、投资经验、资产状况等判断基金是否和投资人的风险承受能力相适应。基金管理人不保证基金一定盈利,也不保证最低收益或本金不受损失。基金过往业绩及其净值高低并不预示其未来业绩表现,基金管理人管理的其他基金的业绩并不构成本基金业绩表现的保证。本产品由嘉实基金管理有限公司发行与管理,代销机构不承担产品的投资、兑付和风险管理责任。
本文作者可以追加内容哦 !