“今天中国通用人工智能的状况,就跟讯飞25年前创业的时候一样,跟中国语音产业发展之初的状况无比相像”,1月30日,讯飞星火V3.5发布会上,科大讯飞董事长刘庆峰分享了由他主编的图书《星火相传》,讲述科大讯飞技术奠基人王仁华教书育人的经历和科大讯飞的创业故事。
25年前,智能语音产业爆发前夜,IBM、微软等国际巨头纷纷在中国设立研究院,进军中国市场。语音是文化的基础、民族的象征。著名语言学大师吴宗济向王仁华和刘庆峰说:“中国被人掐住了咽喉。”刘庆峰在王仁华的鼓励下带着5个大学同学创立科大讯飞,立志“中文语音技术要由中国人做到世界最好,中文语音产业要掌握在中国人自己手上”,开启了科大讯飞的“登山”之路。
初心:让中文语音技术掌握在中国人自己手里
王仁华是中国科学技术大学电子信息与信息科学系的教授。上世纪80年代,乘着改革开放的东风,王仁华成为赴美访学的教授之一。在美国,他研究数字信号处理,参观贝尔实验室,学习美国大学的科研模式,下定了要做产学研一体化的决心。
回国之后,他打破体制局限,一边在中国科学技术大学任教,一边创立了中科大智能语音实验室。这是中科大首个“教授负责制”的实验室。王仁华一边做研究一边四处拉项目,赴东京大学学习,与东京大学、香港大学等国内外高校展开合作,引进先进设备,壮大实验室的实力。
1992年,大学二年级的刘庆峰被选中,踏入了实验室的大门。刘庆峰很快脱颖而出,他做的KD-863系统在当时国家“863计划”的语音合成评测中获得最高分。科大讯飞的种子由此萌芽。
那个年代,中科大的学生以出国为荣。看到优秀的师兄弟们陆续离开,刘庆峰一直想:怎样才能把这些人才留在国内,做中国自主创新的技术?
1999年,硕士毕业的刘庆峰放弃出国留学的机会和高薪offer,在王仁华的鼓励和支持下,创立科大讯飞,走上以公司化促进产学研合作的道路。
王仁华任公司首任董事长,但他毫无私心,顶着压力、创新机制,把学校奖励的总计600多万元技术股权奖励分配给学生,并说“庆峰应该拿得比我多”。
科大讯飞从被称为“草台班子”的大学生创业公司成长为如今的人工智能“国家队”,并成为中国高校产学研合作的样本案例,王仁华和刘庆峰的“师生配”也为学界、业界所关注。
攀登:从智能语音到认知智能,坚持AI不动摇
科大讯飞以技术起家,创业5年才实现盈利。当时,互联网、游戏、房地产,哪个行业都比人工智能赚钱,讯飞内部也曾出现分歧,有人认为“开公司应该什么赚钱就做什么。”刘庆峰顶住压力,坚持人工智能方向不动摇。
他和王仁华一起,先是带着科大讯飞攀上语音合成、语音评测、语音识别三座大山。科大讯飞研究院笃定“从研究中来,到产品中去”的研究逻辑,坚持从产业出发,“做有用的研究”。一旦坚定研究的方向,就不计投入。
以语音识别为例,当时,科大讯飞已经在和移动、电信等运营商以及华为等公司合作,将语音技术嵌入到他们的设备、应用中。当时,国内语音识别技术的市场主要被美国公司Nuance占据,科大讯飞也与之合作了一段时间。2005年,科大讯飞首次实现盈利,立刻决定做中国自己的语音识别技术。
王仁华和刘庆峰做了三个布局:一路人去香港大学学习;一路人和清华大学合作,组建联合实验室攻关;第三路则外请加拿大约克大学教授江辉(王仁华的学生)作为技术顾问。
清华大学-科大讯飞联合研究中心主任吴及至今仍感叹他们的魄力:“那时,讯飞刚刚赚钱,立刻拿出几百万和清华合作。”
这背后的逻辑,是科大讯飞做自主创新技术的决心,也是产业上长期主义的布局。
这个逻辑贯穿科大讯飞之后的每一次技术攀登。
语音识别最终被科大讯飞做到了行业领先,声动炫铃、讯飞输入法、讯飞语点等典型产品应用让科大讯飞跃上新的台阶。当深度学习技术的苗头冒出,嗅觉敏锐的科大讯飞立刻决定跟进,成为国内率先将深度学习技术应用在语音识别系统上的公司,占据先机。
创业12年,科大讯飞不仅实现了当初的承诺“中文语音技术要由中国人做到世界最好,中文语音产业要掌握在中国人自己手上”,还把多语种技术做到了世界领先行列,站在技术之巅建立起自己的智能语音王国,并创造了蓬勃的产业生态。
与此同时,科大讯飞将眼光看向更长远的未来,布局认知智能,开启“超脑计划”,要让机器从能听会说到能理解会思考,决心要再攀一座高山。
在技术上,科大讯飞的目标还是一样:“要做就做第一”。在认知智能的关键技术自然语言理解上,科大讯飞布局机器翻译、机器阅读理解、常识推理等多项核心技术,连续在国际比赛中取得第一。截至目前,科大讯飞在认知智能领域一共获得40余项世界冠军。在应用上,科大讯飞始终面向社会刚需,相关技术在教育、医疗、金融、工业、司法等多个领域常态化应用。
这就是科大讯飞所说的“技术顶天、应用立地”。
现在,科大讯飞不仅承建了语音及语言信息处理国家工程研究中心、认知智能全国重点实验室,还入选首批国家新一代人工智能开放创新平台,成为中国历史最长、最专注的人工智能公司之一。
再攀高山:通用人工智能时代的讯飞“星火”
为什么刘庆峰会说现在的情况和25年前相似?2023年被称为通用人工智能元年,随着ChatGPT的发布,大模型的竞争有目共睹。
但是,浪潮褪去,才知道谁在裸泳。通用人工智能如当初的智能语音一样,只有真正将技术掌握在中国人自己手里,只有真正做到产业落地、量质齐飞,才能真正有利于人类的生产生活和发展。
科大讯飞一开始做大模型,就确定了“1+N”的方向:“1”就是指通用认知智能大模型,对标ChatGPT拆解文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互等七大核心能力;“N”是指应用,要让大模型在教育、办公、汽车、人机交互等各领域真正落地。
2023年至今,科大讯飞总共举办了5次大模型的发布会,每一次迭代都带来7大核心能力的升级和多个领域的应用案例。讯飞“星火”在《麻省理工科技评论》大模型评测、新华社研究院大模型体验报告等权威机构对主流大模型的评测中,科大讯飞均获得第一名。
最新版本,是1月30日的讯飞星火V3.5,七大能力全面升级,在语言理解、数学能力、语音交互能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。
讯飞星火可以像人一样和用户对话,发音自然,“情商”还挺高;搭载了讯飞星火的翻译机可以不切换就识别出多个语种,“跨语言群聊”变得稀松平常;越来越多的大企业将业务和讯飞星火结合进行打磨,太平洋保险、交通银行、国家能源集团、中国移动等企业在保险、金融、电力、商务等领域全面探索如何为企业提质增效、开发出对客户更有价值的解决方案……
最值得一提的是,讯飞星火V3.5,是在全国产化算力平台上训练的全国产大模型。
“科技自立”是科大讯飞做技术一贯的坚持。在复杂的国际形势下,面对“卡脖子”的算力难题,科大讯飞迎难而上。在安徽省和合肥市的支持下,科大讯飞联合华为建立了中国首个国产化算力平台——“飞星一号”,该平台可支撑万亿参数大模型的训练。
为什么讯飞星火能干得成?刘庆峰总结出三个原因:
第一,最核心的是这么多年的技术积累,科大讯飞有成熟的算法,并在过去25年一直专注人工智能领域。第二,有成建制的团队。团队组织氛围特别好,不存在内耗,凝聚成了非常强的战斗力。第三,有像华为这样的深度合作伙伴。
科大讯飞的大模型以“星火”命名,和25年前创业之初就镌刻在科大讯飞墙上的那句话——“燃烧最亮的火把,要么率先燎原,要么最先熄灭”一脉相承。“正是因为几代人接续的长期主义,才有了今天,我们在如此重要的语音领域敢于对全世界说:‘我们是领先的’。”在讯飞星火V3.5发布会上,刘庆峰说,只要坚持顶天立地的产业发展路线,坚持面向未来,2024年一定可以实现星火燎原,通用人工智能能够在中国的各大领域深度广泛应用,坚持源头技术创新,大模型的底层能力一定会站上全新的台阶。
《星火相传》书中有两处写到“王仁华的预言”。
第一次是2008年,科大讯飞刚刚上市,王仁华获得安徽省重大科技成就奖,在答辩时,评委们问王仁华“真正的人工智能,什么时候才能成为现实”?王仁华回答“十五年”。2022年ChatGPT惊艳了全世界,每一个普通人都可以0门槛使用人工智能,王仁华一语成谶。
第二次是在2023年8月4日,在王仁华80岁寿辰的生日宴上,他对学生们说,“今天,我们说的20年后的两件事,一个是科大讯飞在世界上掌握话语权,一个是我要活到100岁,我们都要努力!大家不要忘记自己的承诺,我也要拼命活到100岁!”话毕,台下掌声经久不息。
科大讯飞一直有登山文化,每年司庆刘庆峰都会组织员工去登山。刘庆峰曾说,为什么要登山?因为山就是信仰,而“攀登本身的过程就是一种巨大的幸福。”
本文作者可以追加内容哦 !