作者|Valentina

编辑|星奈

媒体|AI大模型工场

 

天凉好个秋,中秋佳节来临! 

在这个团圆感浓浓又充满浪漫气息的传统节日 

AI大模型们也来“大团聚” 

豆包、通义、元宝、文心一言、讯飞星火、智谱清言来到团圆现场 

PK作画、写诗、“品”月饼 

运用自己的智慧和想象力 

为中秋佳节增添氛围。 

这个中秋我们来和AI一起玩儿 

看看谁最懂畅想、懂创意、懂中秋! 

 

一、吟诗作画绘中秋

水调歌头·明月几时有 苏轼 丙辰中秋,欢饮达旦,大醉,作此篇,兼怀子由。 明月几时有?把酒问青天。不知天上宫阙,今夕是何年。我欲乘风归去,又恐琼楼玉宇,高处不胜寒。起舞弄清影,何似在人间。 转朱阁,低绮户,照无眠。不应有恨,何事长向别时圆?人有悲欢离合,月有阴晴圆缺,此事古难全。但愿人长久,千里共婵娟。 

一 千多年前的中秋,苏轼在密州超然台上以月起兴,把人世间的悲欢离合之情纳入对宇宙人生的哲理性追寻之中,同时还表达了对亲人的思念和美好祝愿。 

一千多年后的中秋,前来共赏圆月的AI们,一起瞻仰东坡居士的才思。AI大模型们兴致盎然之处,还想要通过生图能力,还原这首千古名词所描绘的画面。 

那么究竟谁更会赏析古诗,能够还原出“把酒问青天”那孤独又浪漫的场景?一起来看看吧! 

(豆包 )

乍看之下,豆包所作的画面有山有水,十分优美浪漫。一轮明月衔接在薄雾弥漫的池塘边际,月光洒在池面,静谧而美好。诗人望着明月,仿佛正在乘兴赋诗。但仔细一琢磨,咦?怎么天边有三个月亮?苏轼怎么就练就了“轻功”,直接踏在水面上?诗人的手,到底是握着酒杯,还是拿着月饼?豆包小画家古诗理解的很好,画风也轻盈古朴,但是画面细节经不起仔细推敲啊! 

理解能力:4

画面细节:3

画风:5

(文心一言)

文心一言强在没有出错,仔细检查画面没发现任何不合理之处。 

但想必你也想问,苏轼去哪儿了?咱们“把酒问青天”的主人公去哪儿了?文心一言回复,咱们这是代入苏轼第一视角,坐在桌子面前感怀赋诗呢!好吧,文心一言的创意已在大气层! 

不过要是不说,这幅画面很难让人想到是水调歌头的配图,画面细节、对词句的诠释都差了一些。 

理解能力:3

画面细节:3

画风:4

(元宝)

哇!元宝完美诠释了中国画特色的水墨意境。虽是黑白的画面,但一笔一墨都充满了诗情画意。画面要素完整,符合诗词主题。唯一美中不足的缺憾是画面有“穿帮”,月亮中间还挂了一个月亮。 

理解能力:5

画面细节:3

画风:5

(通义万相 )

第一眼看画风,古朴细腻又笔墨苍劲,颇有古风山水画的影子。好! 

第二眼看元素,有月有楼阁有石有树,苏轼端着酒杯仰望着月亮;仔细看诗人表情,似乎还 眉头紧蹙,颇有感怀思虑之意。好! 

第三眼看细节,大致没问题!但是仔细看来,手部略微有穿模,手中的红酒杯更是有点太“出戏”了。

这轮吟诗作画,通义万相表现相对优异。要不是红酒杯稍微离谱了一点,完全是满分答卷!

理解能力:5

画面细节:4

画风:5

(讯飞星火)

讯飞星火大模型对古诗的理解也很到位。诗人对着明月,感怀赋诗,独坐于亭台上也符合当时苏轼赋诗的真实处境。 

不过画风没有给人太多惊喜,有点儿像小学语文课本的油墨印刷风格。画面细节上没有太多问题,唯一小错误是天空不知道为什么飘了串儿红字。 

还有个让人觉得有点儿诡异的点是,怎么“苏轼”的脸,长得这么像另一个时代的大文豪——鲁迅?报告!严重怀疑讯飞拿小学语文课本里鲁迅的肖像来训练大模型。 

理解能力:5

画面细节:4

画风:3

(智谱清言)

智谱画的一般,细节缺失相较严重,人物手部、远处的亭台皆有穿模现象;画风“AI味儿”也比较浓,元素拼贴感重。 

虽然不太擅长作画,但是智谱很擅长解析诗词。不仅画面要素齐全,还给出了画面赏析,解释了自己捕捉了诗词中哪些主题。只能说,智谱是不太有艺术细胞的语文学霸! 

理解能力:5

画面细节:3

画风:3

本轮作画通义万相略胜一筹,其它大模型也各有可圈可点之处。经过一轮赏诗作画的角逐比拼,前来中秋团聚的AI们更加充满了兴致。吟诗过后,接下来就比拼“作赋”! 

 

二、赏月赋诗言胸臆

AI们乘兴继续比拼作诗,AI大模型工场担任小裁判,前来命题。 

本轮命题是: 

“帮我写一首关于中秋的七言古诗。要求: 

1、情景是和一家人在一起赏月喝酒。

2、表达中秋节的喜悦,与家人团聚的喜悦,以及对天下的祝福。”

一起来看看AI小诗人们表现如何吧: 

(上:豆包    中 :文心一言    下:元宝) 

(智谱清言) 

豆包、文心一言、元宝、智谱清言所做的诗的格律、主题都符合了命题,但文采平平,让人不觉惊艳。 

令人惊喜的是,豆包小诗人的主题选择非常巧妙,在诗的最后两句将主题上升到了反战、和平的高度。为心怀大爱的豆包同学点赞。 

(通义千问) 

通义千问诗风颇具古风。前四句描绘中秋团圆的景象,明月、金风、玉液酒,寥寥几笔描绘了中秋团圆宴席的氛围,让人身临其境;后四句借景进一步送上祝福,升华主题。看来通义不仅作画厉害,写诗也不错,妥妥的全能小能手! 

(讯飞星火) 

讯飞星火贴心的附上了诗词注释,帮助人们更好地理解作品。仔细阅读下来,星火的场景、主题符合命题,但遣词造句并无出彩之处。另外, “举杯共祝天下春”这一句出现了常识错误。“春”?什么时候中秋节跑到了春天?看来讯飞星火同学还要多多学习知识啊。 

本轮作诗大会,通义再次让人眼前一亮,文笔卓越;除此之外,豆包同学主题选的最巧妙,引人深思;讯飞星火、文心一言、元宝、智谱清言也都基本回应了主题。 

 

三、识图游戏添乐趣

上轮角 逐赛况激烈,AI们比拼的难舍难分,于是决定再加赛一轮,比拼识图能力! 

请看题: 

月饼,月亮,饼干,饼干,汉堡傻傻分不清楚? 

本轮趣味AI大模型比拼,来看哪家AI大模型“最聪明”,能在这些极具迷惑性的食品图片中快速找出月饼! 

文心一言:

通义千问:

元宝:

智谱清言:

讯飞星火:

本轮豆包同学表示看不懂图,退出前往观赛区。5分满分,答对一种物品记1分。 

5分选手:智谱清言  

全体鼓掌!本场比赛唯一全部识图准确的选手。识图快、准、狠,就选智谱清言 

4分选手:通义千问、元宝、讯飞星火

虽然三个AI大模型都准确认出图1是月饼,但通义把月亮看成了太阳、元宝把月亮认成了月饼、讯飞星火则把月亮认成了饼干。看来这“三小只”不太认识月亮啊,那就趁这个中秋节抬头赏月,把月亮的模样刻在心中吧! 

3分选手:文心一言

文心一言的发言分析不仅详细,而且措辞谨慎,谦虚地表示图1“可能是”月饼。文心一言大可自信一点 ,答对了,图1就是月饼!不过文心一言把汉堡包、月亮都弄错了,识图能力还需再接再厉! 

时间悄然流逝,本次中秋佳节AI团聚大会也来到尾声。 

综合来看,本次“中秋大会”表现最出彩的是阿里云通义系列大模型。相比豆包、文心一言等来说,通义千问的功能丰富程度有所差距,但中文语言理解能力、生成能力却丝毫不逊色。前段时间在上海AI实验室推出的权威基准OpenCompass上,通义千问2.5得分超越Claude 3 Opus,追平GPT-4 Turbo,成为国产大模型首位。本来还以为“成为国产大模型首位”是,现在看来是真有点儿东西。除此之外,通义万相也出图操作简单,速度快,质量佳。 

不过其它AI大模型也各有特色。豆包中文语义理解能力强,但可惜仍然不能有效识图;文心一言、腾讯元宝、讯飞星火在本次“中秋大会”没有特别突出的表现,但胜在各项能力比较综合,生图、生文、识图一网打尽;智谱清言不擅长做图,但识图能力却很强。 

经过这次中秋AI大模型团聚大会的聚首,AI大模型们再一次进行了友好的交流比试,也展现了各自的优缺点。希望国产A大模型们能不断进步,再接再厉,争取下一次表现更佳! 

最后,AI大模型工场祝全部读者们,阖家欢乐,中秋安康! 

 

 

追加内容

本文作者可以追加内容哦 !