6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升,整体超越GPT-4 Turbo,在8个国际主流测试集中排名第一,国内大模型全面领先。

面向万物互联的时代,星火语音大模型持续升级。多语种多方言识别及翻译方面,支持37语种、37方言免切换,多方言识别效果平均提升30%,多语种效果领先whisper-V3。针对强干扰场景的语音识别难题,突破多人混叠场景的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。

面向医疗领域,讯飞晓医APP再次升级,上线个人数字健康空间,打造每个人的健康助手;面向教育领域,业界首发星火智能批阅机,集智能批改、精准学情、个性学习于一身,支持自由排版,不限纸张大小,在支持多学科多题型智能批改的同时,还能即时生成多维学情报告,为老师作业讲评和面批辅导提供精准素材。

面向具身智能和人形机器人企业需求,推出业内首个支持多模态交互的机器人超脑平台2.0,很好地解决了机器人在嘈杂环境下听、说、理解和思考的难题。 目前,已有400+机器人企业采用讯飞机器人超脑平台,占到市场份额的60%+。

借助这套系统,机器人不仅能实现语音识别、自然语言处理等基础功能,还具备人像识别、唇形识别等多种感知能力。能够在人流密集、环境嘈杂的服务场景中精准捕捉到用户的声音,然后运用讯飞星火大模型深入分析客户的自然语言语义,精确理解用户意图。

同时,讯飞拟人语音技术也使得机器人回复更具人性化,能够与用户进行更加亲切自然的交流。

目前,科大讯飞的多模态交互系统已被广泛应用于各种设备中,如数字人一体机、商用及家用服务机器人等,尤其在智能家居、智慧汽车、智慧零售、教育等领域展现出了强大的赋能作用。

比如在汽车领域,在大模型加持下,星火汽车智能座舱全新升级,不但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型,赋予了高度智能的交互体验。

在千行百业规模化应用落地的同时,星火开发者生态也正在加速增长。讯飞星火V3.5发布以来,不到半年时间里,讯飞星火开发者已增长至702万,海外开发者超40万,大模型开发者数则达到57万。

科大讯飞董事长刘庆峰表示,只有自主可控的繁荣生态,才有中国通用人工智能的大未来。在通用人工智能时代的浪潮下,面向未来的人工智能新生态应该以自主可控的技术为底座,兼顾软硬一体,关注源头技术生态、智能体生态、应用生态和行业生态。要科学理性认识中美科技综合差距,以长期主义打造自主可控的AI产业生态。

追加内容

本文作者可以追加内容哦 !