此前,尚未开放给大众的文本到视频工具Sora也引起了外界怀疑。在一次采访中,OpenAI的首席技术官米拉·穆拉蒂(Mira Murati)没有正面回应“是否使用YouTube、Instagram、Facebook等平台的内容训练Sora”这一问题,她听到该问题时复杂的表情甚至成为了互联网梗图。

YouTube首席执行官尼尔·莫汉(Neal Mohan)在4月5日对此表态,称目前没有证据表明OpenAI用了YouTube视频训练Sora,但如果OpenAI果真这么做了,那“明显违反”了YouTube平台的使用条款。

要是以为YouTube是在努力保护用户(或说创作者),可能有点天真。莫汉在采访中也提到,谷歌确实用了YouTube上的一些内容训练了旗下大模型Gemini。

另一边,巨头Meta的马克·扎克伯格(Mark Zuckerberg)也将平台数据视为自己的竞争优势。扎克伯格曾直言:“我们战术的下一个关键部分是从独特的数据中学习。”“在Facebook和Instagram上,有数千亿张公开分享的图片和数百亿段公开视频。”

在去年怒喷微软,威胁要起诉其使用X的数据训练AI的埃隆·马斯克(Elon Musk),也悄悄更新了X的隐私政策,表示会使用社交媒体数据来训练机器学习和AI模型。在网友的追问下,马斯克干脆承认:“只会用公开信息(训练),不会用私信和任何私人数据。”

有海量UGC(用户生成内容)且自己也做AI的公司,数据是不卖的,只给自己用。其他AI公司要么就铤而走险偷偷用,要么就要去找那些有内容但愿意出售的公司。

ShutterStock和Reddit都是活跃在数据交易场上的“大卖家”。

图片网站ShutterStock几乎和所有叫得上名字的AI大公司都合作了个遍,包括但不限于OpenAI、Meta、谷歌、亚马逊,达成使用其图片训练AI的协议。每笔交易的最初价格从2000万美元到5000万美元不等,而且后续还扩大了交易规模。

随着AI浪潮翻涌,“美国贴吧”Reddit意识到自己的数据对AI公司至关重要,且非常宝贵。去年开始,Reddit开始与一系列AIGC领军企业展开谈判,商议数据付费使用的问题。说白了就是,不付费要授权,休想用这一头部美国贴吧的内容喂AI了。谈判陆续有了进展,如今年2月,Reddit就与谷歌达成协议,授权数据给其训练AI,合同价值约每年6000万美元。

在这样的态势下,Photobucket这样的老牌社区被盯上只是时间问题。

Photobucket的首席执行官泰德·伦纳德(Ted Leonard)表示,他正在和多家科技公司谈判,涉及130亿个内容(照片和视频)的授权。每张照片的授权价格在5美分到1美元,视频则为1美元以上。

一位买家告诉伦纳德,他们想要超过10亿个视频,比Photobucket拥有的还多。以现在的谈判来看,Photobucket坐拥数十亿美元的内容。

机智的Photoshop在去年10月更新了其用户条款,授予平台“不受限制的权利”,可以出售任何上传的内容,用于培训AI系统。

伦纳德甚至表示,有望用数据授权替代公司的广告销售业务。

by Bianews

看好美股的铁汁们,可借助标普500ETF(513500)和纳指100ETF(513390)快速上车,分享这波AI浪潮投资机遇。

$标普500ETF(SH513500)$$纳指100ETF(SH513390)$$微软(NASDAQ|MSFT)$

#算力总龙头大涨,A股AI行情要来了?#

#押注AI重整Mac产品线,苹果股价大涨#

#英特尔加入AI芯片赛道,影响几何?#

风险提示:以上数据来源均为公开信息,仅供参考,不构成任何操作建议或推荐。基金投资需谨慎。基金管理人承诺将本着诚信严谨的原则,勤勉尽责地管理基金资产,但并不保证基金一定盈利,也不保证最低收益。基金的过往业绩并不预示其未来表现,基金管理人管理的其他基金的业绩并不构成本基金业绩表现的保证。投资者在投资基金前,请务必认真阅读《基金合同》及《招募说明书》等法律文件。本基金适当性风险等级为R3,在代销机构申购的应以代销机构的风险评级规则为准。如需购买本基金,请您关注投资者适当性管理相关规定,提前做好风险测评、并根据您自身的风险承受能力购买与之相匹配的风险等级的基金产品。

免责声明:转载内容仅供读者参考,版权归原作者所有,内容为作者个人观点,不代表其任职机构立场及任何产品的投资策略。本文只提供参考并不构成任何投资及应用建议。如您认为本文对您的知识产权造成了侵害,请立即告知,我们将在第一时间处理。

追加内容

本文作者可以追加内容哦 !