AI新进展带来哪些投资机会？_模子_视频

2024-12-22 17:53:18 智能问答

——高铭《天才在左疯子在右》

AI新进展带来哪些投资机会？_模子_视频智能问答

用一段笔墨描述就可以形成一段“真实”的视频，曾经想象中的场景如今已经实现！

春节假期尚未结束，OpenAI发布的新一代笔墨天生视频模型——Sora就已经引发热潮，通过笔墨天生1分钟的高质量视频，极其真实、个性化的视频表现，且符合现实天下物理规律的图像，令人惊艳，这也直接带动了成本市场的表现。

Sora模型有何特点，龙年AI投资有哪些趋势？本期《风向》将为您逐一梳理。

文本转视频，时长达1分钟

一个视频胜千言，从OpenAI放出的视频来看，通过一长串的提示词，诸如“几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近”，AI就天生了极其真实的动态画面场景。

资料来源：OpenAI官网

提示词：几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近，它们长长的毛茸茸的皮毛在风中轻轻飞舞，远处覆盖着积雪的树木和雄伟的雪山，午后的阳光下有缕缕云彩，太阳高高地挂在空中间隔产生温暖的光芒，低相机视角令人惊叹地捕捉到大型毛茸茸的哺乳动物，具有俏丽的拍照和景深。

如果不是猛犸象已经灭绝，或者视频标注了AI天生，我相信包括笔者在内的很多人会认为是实拍镜头。

不仅仅是动物，人物和场景表现也极其真实。

资料来源：OpenAI官网

提示词：一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。
她穿着玄色皮夹克、赤色长裙和玄色靴子，拎着玄色钱包。
她戴着太阳镜，涂着赤色口红。
她走路自傲又随意。
街道湿润且反光，在彩色灯光的照射下形成镜面效果。
许多行人走来走去。

根据OpenAI官网的先容，Sora能够天生具有多个角色、特定类型的运动以及主体和背景的准确细节的繁芜场景，该模型不仅理解用户在提示中提出的哀求，还理解这些东西在物理天下中的存在办法。

其次，该模型能够更加准确的理解人类给出的提示词，借助GPT的能力，Sora将用户的简短提示转换成更详细的提示，使其能够准确地阐明提示词，并天生质量更高的图像。

犹如电影中常见的多机位拍摄，Sora模型还可以在单个天生的视频中创建多个镜头，准确地保留角色和视觉风格。
而且天生的视频也可以重新编辑，比如让植被更加茂密等等，如果嫌视频的韶光过短，也可以让AI向前或向后拓展视频。

Sora的技能报告显示，OpenAI并不是把Sora纯挚当作一个视频模型来看待，而是将视频天生模型作为“天下仿照器”，不仅可以在不同设备的原生宽高比直接创建内容，还能展示出对真实天下的仿照能力，如3D同等性、长期同等性和工具持久性等。

依托于大措辞模型，让机器模拟人

根据公开资料，在文生视频领域，比较成熟的模型思路有循环网络（RNN）、天生对抗网络（GAN）和扩散模型（Diffusionmodels）。

结合OpenAI官网下的文献参考，Sora为利用Transformer架构的扩散模型。
它从看起来像静态噪声的视频开始天生视频，然后通过多个步骤肃清噪声来逐渐对其进行转换。

如果用普通但不太严谨的话来阐明，之前的GAN模型更多的是对其他图片“形”的模拟，而扩散模型更多的是对“神”的模拟，比如图像内涵，图像与图像的关系等等。

随着演习打算的增加，样实质量显著提高

图片来源：Sora技能报告

在其技能报告中，Sora可以将图片和视频转化为补丁，从而可以用更广泛的数据演习。
OpenAI将图片和视频数据转化为统一的表示办法——补丁（patches）来进行演习，补丁类似于大措辞模型中的tokens，并且可以高度扩展。
通过统一数据的表示办法，Sora可以用更广泛的数据演习，使天生的视频更加真实。

目前Sora模型还在进行安全测试，仅向有限的创作者开放。
据彭博社估量，GPT-4经由6个月的测试后正式开放，参考GPT-4，估量Sora或将于8月向"大众年夜众开放。

政策端大力鼓励，海内AIGC商业化已全面铺开

去年8月尾，海内首批大模型产品通过《天生式人工智能做事管理暂行办法》（下称《办法》）备案，可正式上线面向公众做事。

去年下半年，一批海内大模型陆续向社会开放，C端商业化逐步铺开。
此前，这些大模型厂商已开始布局B端部分场景，与多家企业签订合约。
当前国产AIGC在BC两端同时发力，商业化全面铺开，已脚踏实地开启赢利之路。
上述备案完成与《办法》正式履行日相隔仅半个月，表示监管层对这一新兴家当的鼓励态度。

去年9月初，工信部和财政部联合印发《电子信息制造业2023-2024年稳增长行动方案》再次强调了对人工智能和大模型发展的重视，表示要推动前辈打算家当发展和行业运用。

目前，海内AIGC的家当架构分为根本层、中间层和运用层。

全体AI天生内容链条第一层是根本层，也是由大措辞模型为根本搭建的AIGC技能根本举动步伐层。

第二层为中间层，及垂直化、场景化、个性化的模型和运用工具。
预演习的大措辞大模型是根本举动步伐，在此根本上可以快速抽取天生场景化、定制化、个性化的小模型，实现在不同领域的运用支配。

第三层为运用层，面向C真个笔墨、图片、视频天生等内容的天生做事。
侧重于用户的利用体验和需求，使得用户可以用消费级的显卡算力挖掘丰富的内容，包括ChatGPT、Sora等等。

根据中国电子学数据，2021年中国人工智能核心家当市场规模为1300亿元，同比增长38.9％。
根据《新一代人工智能发展方案》，到2025年，我国人工智能核心家当规模将超过4000亿元，带动干系家当规模超过5万亿元。

投资方向怎么选？

中信证券研报认为，从投资角度来看，Sora背后的呈现能力为自动驾驶、设计等须要现实天下建模的行业供应了明确方向。
Gemini在短期内的部分商业场景表现可能会更为出色，尤其是须要结合图片与笔墨的多模态运用处景。
撤除运用真个投资机会，硬件真个需求也一定会随着多模态的技能进步而不断提高。

从AI投资的角度看，嘉实基金大科技研究总监王贵重认为，随着OpenAI和GPT4的面世，意味着AI从弱人工智能向强人工智能的迈进。
目前，AI行业正处在在一个爆发的出发点，未来随着大模型本钱的不断低落，AI赋能各行各业将会成为一种可能。
所有跟信息技能干系的领域都会迎来一定程度的重塑，但仍有大量的长尾的运用没有得到显著的知足。

目前科技投资的整体架构分为底层的根本举动步伐、芯片层、做事器层，云层，再到上面的大模型、专用模型，末了到各个行业的运用，未来须要在整体的研究图谱中密切跟踪各个行业的发展进度。

最看好的环节依然是AI运用。
第一，曾经被互联网改变的行业会再一次被AI改变。
首先是内容，无论是一维媒介笔墨，二维媒介图片，三维媒介视频，四维媒介游戏，还是社交、搜索、短视频、电商，我们用的互联网运用都会集成AI功能。
第二，软件会从功能软件到智能软件，软件的能力会进一步提升，帮我们做更多的事情，交互也会更加友好。
无论是办公、OA、CRM、ERP，乃至一些专业的画图、EDA等工具。

风险提示：以上不雅观点不构成详细投资建议。
基金投资需谨慎。
投资人应该负责阅读《基金条约》、《招募解释书》、《产品资料概要》等基金法律文件，理解基金的风险收益特色及其特有风险，并根据自身的投资目的、投资期限、投资履历、资产状况等判断基金是否和投资人的风险承受能力相适应。
基金管理人不担保基金一定盈利，也不担保最低收益或本金不受丢失。
基金过旧事迹及其净值高低并不预示其未来古迹表现，基金管理人管理的其他基金的古迹并不构成本基金古迹表现的担保。