一、政策环境

【2024以“AI驱动安全”为主题的数字经济发展建设论坛召开】

获悉,6月6日,以“AI驱动安全”为主题的(GDEC)数字安全高层论坛暨北京网络安全大会战略峰会在北京国家会议中心开幕。

本次论坛的顺利召开为2024全球数字经济大会成功举办奠定了良好基础,邀请10多个行业领域的200多家企业的代表,分享人工智能发展等实践经验,传递数字安全理念、分享数字发展经验,谱写数字经济高质量发展新篇章。

二、产业发展

【COMPUTEX 2024 展会召开,英伟达Blackwell芯片已开始投产】

6 月 3 日媒体消息,在COMPUTEX 2024 展会上,图形芯片巨头英伟达发布了未来规划,宣告了其拥抱人工智能的决心。

英伟达新架构Blackwell宣布不过3个月,老黄就把后三代路线图全公开了:2025年Blackwell Ultra,2026年新架构Rubin,2027年Rubin Ultra。黄仁勋强调,英伟达将在2025年推出Blackwell Ultra AI芯片,下一代AI平台名称为Rubin,该平台将采用HBM4内存。

【AR逆势大涨,一季度设备销量为6.6万台同比增长62%】

根据CINNO Research机构日前发布的数据显示,2024年第一季度中国消费级AR设备销量为6.6万台,同比增长62%。AR产品逐渐被消费市场认可的现象背后是投融资动态的活跃。另据数字显示,2024年一季度国内AR相关融资18起,主要是AR的硬件为主,显示出市场对这一领域的浓厚兴趣。

【谷歌ChatDirector利用2D头像生成3D虚拟人,增强视频会议临场感】

获悉,谷歌新推出ChatDirector技术,利用2D头像生成3D虚拟人,通过空间感知共享会议环境和语音驱动布局转换,改善传统视频会议体验,增强视频会议临场感。

此前,谷歌展示的 Visual Captions 和开源的 ARChat,以促进实时视觉效果的口头交流为目标。谷歌表示,ChatDirector 通过空间化视频头像、虚拟环境和自动布局转换,构建了一个拟真的虚拟环境。

【Meta Connect 2024将于9月25日和26日举行】

据外媒6月4日消息,Meta近期公布了Meta Connect 2024的举办时间,将于9月25日和26日举行。此次大会将深入探索人工智能与混合现实的未来发展,并分享Meta构建元宇宙宏伟愿景的最新进展。同时,Meta也会揭晓该公司VR/AR领域的最新动态,可能包括备受瞩目的Quest 3S以及Horizon的更多信息。

【Oculus Rift的创造者帕尔默·拉奇宣称正开发一款神秘的VR头显】

帕尔默·拉奇是Oculus VR的创始人,他的公司在2014年被Meta(当时名为Facebook)收购。而拉奇在也2017年离开了Meta,之后还对低成本VR头显的策略表达了自己的不满。现在,这位创始人在近日透露了一个最新的消息,宣称他正在研发新的VR头显。

拉奇作为VR领域的知名人物,他的新研发无疑将引起业界的广泛关注。如果新头显能够成功推向市场并获得用户认可,它将可能推动VR技术的进一步发展和普及。尽管目前关于新VR头显的具体信息有限,但拉奇的这一宣布无疑为VR行业带来了新的期待和可能性。

【谷歌正在为其AR搜索引入提示语功能】

事实上,Google Lens(镜头搜索/AR搜索)是谷歌推出的一项颇为实用的功能,它允许用户通过拍照的方式实现物体识别、翻译等功能。

近日,外媒测试发现Google Lens现已支持通过语音或者文本的方式添加提示语句。目前该功能可通过Android的《Google Search》APP使用,如果进一步推测,这或许是谷歌为未来的AR眼镜所做的铺垫。

【郭明錤:维持对苹果Vision Pro今年出货量40万至45万部预估不变】

近日,在郭明錤更新Vision Pro出货调查中指出,本月中旬前Vision Pro已开始陆续出货至非美国市场。此外,郭明錤认为目前对全球2024年出货量预估不变,仍维持40万-45万部。

【阿里云发布开源模型Qwen2,宣称性能超美国强开源模型Llama3-70B】

6月7日上午消息,阿里云更新技术博客:重磅发布全球性能最强的开源模型Qwen2-72B。据介绍,该模型性能超过美国最强的开源模型Llama3-70B,也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。

相比2月推出的通义千问Qwen1.5,Qwen2实现了整体性能提升,代码、数学、推理、指令遵循、多语言理解等能力大幅提升。在MMLU、GPQA、HumanEval、GSM8K、BBH、MT-Bench、Arena Hard、LiveCodeBench等国际权威测评中,Qwen2-72B斩获十几项世界冠军,超过美国的Llama3。

据悉,通义千问Qwen系列模型正在全球爆火,总下载量一个月内翻了一倍,已突破1600万次。全球开源社区已经出现了超过1500款基于Qwen二次开发的模型。Qwen系列的72B、110B模型多次登顶HuggingFace 的Open LLM Leaderboard开源模型榜单。

三、市场动态

【苹果(AAPL.US)Vision Pro正念应用程序或将具备“呼吸追踪”功能】

6月3日消息,苹果正在为Apple Vision Pro开发一项新的“呼吸追踪”功能,该功能很可能在正念课程中发挥作用。据悉,该功能通过引导式冥想或自导式冥想课程为用户提供沉浸式冥想体验。

【微美全息(WIMI.US)探索基于改进的分布式一致性和哈希熵的区块链共识机制】

在区块链技术中,共识机制是确保网络中所有节点达成一致状态的重要组成部分。共识机制用于解决分布式系统中的信任和一致性问题。在区块链中,共识机制确保所有节点对于交易和区块的状态达成一致,并且防止恶意节点对系统的攻击和篡改。

据悉,微美全息正在探索基于改进的分布式一致性和哈希熵的区块链共识机制,该共识机制结合了分布式一致性算法和哈希熵算法的优势,旨在提高区块链网络的效率和安全性。分布式一致性算法具有高效、可扩展和容错性强的特点,能够有效解决传统共识机制中存在的性能瓶颈和单点故障问题。

同时,引入了哈希熵算法来增强共识机制的安全性,哈希熵算法利用密码学原理和哈希函数的特性,对区块链中的交易数据进行加密和验证,确保数据的完整性和不可篡改性。通过引入哈希熵算法,提高数据的随机性和不可预测性,可以有效抵御潜在的攻击和欺诈行为,提高区块链网络的安全性。

微美全息研究的基于改进的分布式一致性和哈希熵的区块链共识机制具有更高的安全性、可扩展性和效率,相信其将在未来的区块链应用中发挥重要作用,并为分布式系统的发展提供新的思路和方法。

【谷歌(GOOG.US)公开研究原型ChatDirector:将视频会议的真人形象空间化】

谷歌研究团队认为视频会议系统通常用于个人和专业场合,在2D屏幕上进行交流,缺乏面对面交流的流畅性,原因在于缺少了重要的空间视觉提示,如眼神交流。因此,一项新的研究名为“ChatDirector”,它通过在空间感知视频会议环境中为所有与会者提供语音驱动的视觉辅助,增强了传统的基于2D屏幕的视频会议体验。

谷歌研究团队开发了一种空间感知视频会议环境,可在3D会议环境中显示远程与会者的3D人像。在每个本地用户的设备上,ChatDirector流式输出(1)音频输入以及由Web Speech API识别的语音文本;(2)RGB图像以及由U-Net神经网络推断的深度图像。

同时,接收每个远程用户的数据,重建3D人像并显示在本地用户的屏幕上。为了实现视觉视差效果,会根据MediaPipe人脸检测技术检测到的本地用户头部移动来调整虚拟渲染摄像头。

【赋能工业数字化:NVIDIA(NVDA.US)AI与Omniverse推动制造业数字化变革】

英伟达宣布,各大电子制造商正在使用英伟达的技术并借助新的参考工作流将其工厂改造成具有更高自主化水平的设施。该工作流结合了NVIDIA Metropolis视觉 AI、NVIDIA Omniverse™基于物理学的渲染与模拟以及NVIDIA Isaac™ AI机器人开发与部署。

英伟达表示:“制造业的AI时代已经到来。生成式AI和数字孪生技术所带来的变革性影响正不断提高各个工厂的自主化水平。借助NVIDIA Omniverse、Metropolis和Isaac,工业生态系统可以加速采用自主技术,帮助工厂提高运营效率并降低成本。”


追加内容

本文作者可以追加内容哦 !