虚拟和现实世界已分不清！OpenAI首个AI模型宣告：60秒全AI生成_***_模子

2024-12-22 16:34:52 云服务

OpenAI Sora宣扬***(00:59)

虚拟和现实世界已分不清！OpenAI首个AI视频模型宣告：60秒视频全AI生成_视频_模子云服务

“一名时尚女子走在充满霓虹灯和广告牌的标志性东京街头，她穿着玄色皮夹克、红长裙和黑靴子，拎着玄色手袋，戴着太阳镜，涂着赤色口红，走路自傲又随意。
街道湿润且反光，在灯光映射下形成镜面效果，行人走来走去。
”这段60秒的***，并非真实拍摄，而是OpenAI最新的“文生***”模型Sora，这一段笔墨描述便是段Prompt（提示词）。

当地韶光2月15日，人工智能（AI）巨子OpenAI宣告，正在研发“文生***”模型Sora，可以创建长达60秒的***，个中包含高度详细的场景、繁芜的摄像机运动以及充满活力的情绪的多个角色，也可以根据静态图像制作动画。
OpenAI称，目前红队成员（red teamers）可以利用Sora来评估关键的危害或风险，还向一些视觉艺术家、设计师和电影制作人供应访问权限，以获取有关如何改进该模型以对创意专业人士最有帮助的反馈。

根据OpenAI官网，Sora能够天生具有多个角色、特定类型的运动以及主体和背景的准确细节的繁芜场景。
Sora不仅理解用户在提示中提出的哀求，还理解这些东西在物理天下中的存在办法。

00:08

无人机拍摄的海浪拍打大苏尔加雷角海滩波折峭壁的景象。
(00:08)

在部分场景中，Sora的效果足以“以假乱真”，例如一段8秒的东京地铁车厢窗户***，除了行车过程中，列车窗户上的反射外，***中间人物倒影也非常逼真。

00:08

提示词：穿过东京郊区的地铁窗外倒影(00:08)

再来看另一段***，官方提示词为：“雪后的东京城熙熙攘攘。
镜头穿过繁忙城市街道，跟随几个人享受俏丽的雪天并在附近的摊位购物。
绚丽的樱花花瓣随着雪花随风飘扬。
”Sora天生的***呈现了所有要素，且镜头不在是单镜头，而是一贯向前且会变换方向的运动镜头。

00:17

东京雪景AI***(00:17)

须要把稳的是，目前Sora属于半成品，OpenAI称，它可能难以准确仿照繁芜场景的物理事理，并且可能无法理解因果关系的详细实例。
例如，一个人可能咬了一口饼干，但之后饼干可能没有咬痕。
还可能会稠浊提示的空间细节，例如稠浊旁边，并且可能难以精确描述随着韶光推移发生的事宜，例如遵照特定的相机轨迹。

00:19

Sora天生的缺点案例(00:19)

OpenAI官网先容，Sora是一种扩散模型，它从看起来像静态噪声的***开始天生***，然后通过多个步骤肃清噪声来逐渐对其进行转换天生***。
Sora能够一次天生全体***或扩展天生的***以使其更长。
通过一次为模型供应多个帧的预见，OpenAI办理了一个具有寻衅性的问题，即确保主题纵然暂时离开视野也保持不变。

与GPT模型类似，Sora利用Transformer架构。
Sora建立在过去对DALL·E和GPT模型的研究之上。
它利用DALL·E 3的重述技能，该技能涉及为视觉演习数据天生高度描述性的标题。
因此，该模型能够更精准遵照天生用户的文本指令。

OpenAI表示，Sora是能够理解和仿照现实天下的模型根本，相信这一功能将成为实现AGI（通用人工智能）的主要里程碑。

Sora***一出，急速震荡业界。
只管这不是首个AI***，其他企业也有类似文本天生***的AI模型，谷歌正在测试名为Lumiere的模型，Meta则有名为Emu的模型，还有人工智能初创企业Runway也在开拓相应产品来帮助制作***，但外媒指出，人工智能专家和剖析师表示，Sora ***的长度和质量超出了迄今为止所见的水平。

美国伊利诺伊大学喷鼻香槟分校信息科学教授Ted Underwood指出，没想到在两三年内还会有如此持续连贯水平的***天生技能，OpenAI的***可能展现了该模型的最佳性能。

多名AI从业者称，从Sora公布的预览***来看，切实其实太“猖獗”。
在国外Reditt社区，有个网友提问，本日OpenAI公布的Sora模型是否会成为自动化对付经济影响的里程碑？下面有将近100条回答，有网友称，起初ChatGPT的发布让用户看到了统统皆有可能，而现在人工智能正在不断进步发展，让用户看到了强大的技能能力。

X平台网友截图

有外洋网友评论称，Sora的涌现是一项改变天下的产品，但同时也指出，Sora天生的***或许让人工智能专家也难以分辨真假，这或许是个棘手的问题。

X平台网友截图

外媒援引布法罗大学Media Forensic Lab主任Siwei Lyu的话称，随着像Sora这样的人工智能程序不断涌现，除了由图像和音频深度假造构成的现有寻衅之外，***假造技能将带来更多寻衅。
卡内基国际事务伦理委员会研究AI和监控技能的高等研究员Arthur Holland Michel则表示，当像Sora这样的工具落入那些确实想利用新技能迭代造成侵害的老谋深算者手中时，事情会变得更加糟糕，“每当有功能更强大的新产品发布时，其可能被滥用的办法也会越多。
”

不过，AI***或许能给电影制造带来不少惊喜。
电影导演和视觉殊效专家Michael Gracey说，看看仅仅在图像天生的一年里就取得了如此造诣。
“一年之后，我们会在哪里？”Gracey预测，不久之后，像Sora这样的人工智能工具将使电影制作者能够仔细掌握他们的输出，从头开始制作各种***。

Gracey认为，往后或许不再须要一个由100-200名艺术家组成的团队来用3年韶光完成动画长片，但他也提醒，AI工具是根据现实生活中艺术家的作品进行演习，而不给予他们补偿，这是一个大问题。
“当它剥夺了其他人的创造力、事情、想法和实行力，而不给予他们应有的名誉和经济报酬时，那就不好了。
”

须要指出的是，实现AGI的背后须要大量的算力来支持，也便是足够多的GPU（图形处理芯片），目前英伟达是环球生产GPU的霸主，但芯片市场一贯面临供不应求的局势。
也正是因此大模型的算力需求，OpenAI首席实行官山姆·奥特曼（Sam Altman）正试图筹集万亿美元来重塑环球半导体家当。

就在一周前，据外媒宣布，奥特曼正与包括阿联酋政府在内的投资者洽谈，希望筹集到数万亿美元的资金来提高环球芯片制造能力，为其AI研发供应充足动力，有知情人士称，该项目可能须要5-7万亿美元。

7万亿美元是什么观点？

英伟达CEO黄仁勋12日曾在公开场合有些讽刺地回应称，“（7万亿美元）显然能买下所有的GPU……如果你认为打算机无法发展得更快，可能会得出这样的结论：我们须要14颗行星、3个星系和4个太阳来为这统统供应燃料。
但是，打算机架构其实在不断地进步。
”

外媒援引知情人士的话称，奥特曼正在建议OpenAI、投资者、芯片制造商和能源供应商之间建立互助，将共同出资建造芯片工厂。
最近数周韶光，奥特曼已经与多位人士进行了会商，包括软银和台积电等，乃至包括阿联酋的谢赫·塔农·本·扎耶德·阿勒纳哈扬（Sheikh Tahnoun bin Zayed Al Nahyan），他是阿联酋总统的兄弟，也是阿布扎比多个主权财富基金的主席。

按照奥特曼的想法，未来数年内要建立数十家芯片代工工厂，建造所需的资金由中东投资者供应，而台积电来制造和运营这些工厂。