AI知识解读之五:华为最新的“文生图”与文生视频pika或Sora的差距
声明:此文完全没有贬低华为技术的意思,相反,赞扬华为在国内第一个实现Al“文生图”功能。此工作是否有软通动力的参与?目前没有公开信息,但软通作为华为最大的合作者,几乎关联到华为的各个项目当中,相信会有一定的贡献。
近几天,华为公布了“文生图”功能快速生成多场景图片。华为的文生图功能与美国的文生视频软件Pika或Sora在技术水平和应用场景上存在显著差距。
首先,从技术层面来看,Pika或Sora作为文生视频模型,其技术复杂度和生成质量远超现有的文生图产品。特别是Sora支持60秒的视频一镜到底,视频背景细节丰富,成片效果令人难以分辨是虚拟的还是现实的。此外,Sora还提供了故事板、用文本调整原视频、不同场景视频融合等功能,这些功能使得视频生成更加灵活和创意。相比之下,华为的文生图模型虽然在高分辨率图像合成方面表现出色,支持从1K到6K分辨率的图片生成,且效果媲美MidJourney和DALL·E,但在视频生成方面尚未有公开的类似技术。
其次,从应用场景来看,Sora的应用范围更广泛,不仅可以生成视频,还可以进行故事板创作、文本调整原视频、不同场景视频融合等,这些功能使得Sora在影视制作、广告创意等领域具有更大的应用价值。而华为的文生图模型主要应用于图像生成,虽然在高分辨率和图像细节方面表现出色,但在视频生成方面尚未有相关公开技术。
以上个人见解。由于是新生事物,花了很多时间考虑,觉得我讲的不错,点点关注,点点赞。如有其他想法和问题,欢迎留言讨论,我会尽力给予解释。
追加内容

本文作者可以追加内容哦 !