2023 的人工智能之年_人工智能_模子

2025-01-10 12:41:58 文字写作

原文链接：[https://journal.everypixel.com/2023-the-year-of-ai](https://journal.everypixel.com/2023-the-year-of-ai)

2023 的人工智能之年_人工智能_模子文字写作

未经许可，禁止转载！

作者 | Kristina Korotenko 责编 | 夏萌

出品 | CSDN（ID：CSDNnews）

2023 年，人工智能领域无疑成为了行业的焦点，带来了深刻的变革。
本文概述了这一年中最有影响力的大事宜，这些事宜预示着这一创新领域未来的发展方向。

人工智能的发展

不像去年的 ChatGPT 或图像天生器的推出那样革命性的创新，今年的人工智能发展虽然取得了显著的造诣，但紧张是专注于现有技能的完善。
只管没有带来令人震荡的效果，真正的通用人工智能（AGI）仍旧还有很长的路要走，但今年是从过去的重大打破向更加强大的技能转变的过渡期。
为了更好地展示这一转变，我们制作了一张基于韶光线的路线图：

图像天生

Adobe Firefly：Adobe Firefly 和 Generative Fill 为多样化的视觉内容创作供应了强大的支持，这包括插画、艺术观点设计和照片编辑。
Adobe Firefly 被集成进 Photoshop，从而遍及了 AI 技能，使其得以广泛做事于更多用户。
此外，文本效果功能的推出，也标志着技能的一大进步，利用户能够将特定风格或纹理运用于笔墨和短语。

Midjourney：Midjourney 的 V.5 模型在图像天生领域是一个主要的里程碑，它展示了在效率、连贯性和高分辨率方面的显著改进。
最新的 alpha 版本，Midjourney V.6，引入了额外的增强功能，如更精准的提示跟随、扩展的模型知识库和一定程度的文本绘制能力。

DALL·E 3：基于 ChatGPT 的 DALL·E 3 简化了图像天生过程，减少了繁芜提示工程的需求。
此外，ChatGPT 还引入了一项帮助用户根据反馈优化提示，进而调度图像效果的功能。

Shutterstock.AI：Shutterstock，一家图库巨子，通过集成 AI 功能，让用户可以把笔墨提示转换成可授权利用的图像。
Shutterstock 采纳了保护艺术家权柄和报酬的方法，这在AI内容创作领域是前无古人的，可以看作是 AI 道德发展的第一个主要举措。

2007 年与 2023 年文本到图像算法的演进

***天生

Stability AI：Stability AI 推出了 Stable Video Diffusion，一个创新的开源***天生模型，已在 GitHub 上开源。
它有望在 AI 天生***的各个领域发挥关键浸染，这与 AI 图像天生趋势是相辅相成的。

HeyGen：一家 AI 创业公司推出了一款集声音克隆、嘴唇动作调度和措辞翻译于一体的***工具。

Runway Gen-2：Runway 发布了 Gen-2 模型，用户现可仅用文本提示、图像或***轻松天生完全***。

Pika 和 Pika 1.0：首次发布便吸引了五十万用户，每周产生数百万***。
随后，Pika 1.0 的升级版 AI 模型让用户能够更多样化地创作和编辑***，风格涵盖 3D 动画、动漫、卡通到电影等。

Meta 的 Codec Avatars：Meta 的 Pixel Codec Avatars（PiCA）模型使我们在***通话中看到更逼真的 3D 人脸，使远程会议效果更靠近真实。

文本天生

Bard 和 Gemini：Google 的 Bard 为谈天机器人领域引入了更贴近人类的情绪和感情。
Google 在 Bard 谈天机器人中融入了基于多模态数据集演习的 Gemini，它被誉为目前“最强大”的 AI 模型，是 OpenAI 的 ChatGPT 最强的竞争对手之一。

Grok：Elon Musk 的创业公司 xAI 展示了其对 AI 开拓的承诺，并可能与 OpenAI 展开竞争。
他们发布了 “Grok”，这是一款具有诙谐感、背叛精神，并通过 𝕏 平台得到实时知识的谈天机器人。
xAI 承诺，Grok 被设计来回答其他 AI 系统谢绝的挑衅性问题。

OverflowAI：Stack Overflow 的 OverflowAI 加强了知识整理能力，支持在 Visual Studio Code 和 Slack 中进行 AI 驱动的答案搜索。

Llama 2：Meta 发布了 Llama 2，这是其开源大型措辞模型的最新版本，显示了效率方面的提升。
Meta 的精调 LLM 在对话用例中经由优化，多数基准测试中超过其他开源模型。

GPT-4：OpenAI 的 GPT-4 现在可以处理图像输入，天生标题、分类，进行听说互换，并支持实时网页浏览。
OpenAI 扩展了插件支持，推动了开源生态系统的发展。
GPT-4 代表了 OpenAI 在开拓通用人工智能（AGI）路上的下一步。

Mistral 7B：Mistral AI 在今年估值达到约 20 亿美元，发布了 Mistral 7B，一款寻衅 GPT-4 和 Claude 2 的大型措辞模型。
Mistral AI 强调其技能开放性，免费供应模型的***。

Mixtral 8x7B：Mistral AI 还推出了 Mixtral 8x7B，这是一个高质量的稀疏专家稠浊模型（SMoE），拥有开放权重和总计 46.7B 的参数，代表了在提高真实性和减少偏见方面模型开放性的新阶段。

Yi-34B llm：今年估值达到 10 亿美元，李开复的创业公司 01.AI 发布了 Yi-34B —— 一款开源神经网络模型，参数数量超过竞争对手，强调了它在本钱和效率方面的上风。

其他进展

Segment Anything Model (SAM)：Meta AI 展示了 SAM 是一个能够直接“剪切”图像中物体的分割模型，展示了显著的适应性。
SAM 经由大量数据集演习，其在工具分割方面的性能表现卓越。

直接偏好优化 (DPO)：直接偏好优化 (DPO) 是一种稳定高效的方法，可用于微调大规模无监督措辞模型和教授文本到图像模型。
它通过利用人类反馈实现精确的掌握，而无需依赖繁芜的强化学习（RLHF）。

Zephyr 直接偏好优化蒸馏 (dDPO)：Zephyr-7B 是 dDPO 方法的成果，为 7B 参数谈天模型设立了新基准，实现更好的意图对齐，且无需大量演习。

自主 AI 代理：自主 AI 代理的涌现是一个显著的趋势，标志着向更高等和自主的 AI 系统的转变。
这些 AI 代理被看作是通用人工智能（AGI）的一个初步表示，由于它们能够根据用户的目标自动天生任务和指令，并独立事情直至目标实现。

EvoDiff：微软的 EvoDiff 是一个用于高速且节省本钱的蛋白质设计的开源 AI 框架，承诺将在治疗学和工业运用方面取得进展。

Stable Audio：Stability AI 发布了 Stable Audio，这是一款能够根据大略的文本提示天生短时高质量的音频片段的工具。

GPT 商店、Copyright Shield（版权盾）、ChatGPT 机器人布局器：OpenAI 推出了 GPT 商店，用于发卖定制的 GPT 机器人，版权盾用于处理版权侵权索赔的法律用度，以及一个无需编码就能定制 ChatGPT 版本的平台。

Stability AI 开源其大型措辞模型 (LLM)：Stability AI 开源了其模型，包括 StableLM-Alpha 和 Stable Vicuna，两者以天生文本和代码的出色性能著称。
Stable Vicuna 是第一个利用人类反馈强化学习（RLHF）演习的开源谈天机器人。
此外，Stability AI 还发布了 SDXL Turbo，一款实时的文本到图像天生模型。

互助关系

在充满活力的 2023 年，行业领导者之间也存在一些主要的互助，这些互助关系对未来的发展轨迹产生了深远影响。
以下是 2023 年在人工智能领域具有定义性的紧张合并和互助伙伴关系：

Stability AI 收购 Init ML

Stability AI 通过收购 Init ML——一支盛行编辑运用 ClipDrop 背后的开拓团队，其目的非常明确：将 Stability AI 的尖端技能整合进 ClipDrop 的生态系统中。
这次互助已经匆匆成了 SDXL Turbo 的开拓。

Runway 与 Getty Images 的互助

Runway 与 Getty Images 达成了计策互助伙伴关系，建立计策互助，推出了新***天生模型 RGM（Runway 和 Getty Images 模型）。
该模型结合了 Runway 的 AI 技能和 Getty Images 的丰富的授权创意内容库。
这次互助旨在根本性地改变内容创作流程，使企业能够天生高质量、定制化的***，以匹配其品牌形象。

Snowflake 收购 Neeva

数据仓库平台领导者 Snowflake 收购了致力于用天生式 AI 改进搜索体验的初创公司 Neeva。
Neeva 最近关闭了其无广告、基于订阅的搜索引擎。
Neeva 的创始人承认，吸引用户考试测验新搜索引擎颇具寻衅。

Shutterstock 与 OpenAI 的互助

Shutterstock 与 OpenAI 承诺进行为期六年的互助扩展。
OpenAI 获准访问 Shutterstock 的高质量数据，包括多样化的图片、***和音乐库，用于丰富其演习数据集。
Shutterstock 连续利用 OpenAI 的技能，推出了 Shutterstock AI 图像天生工具。

法律领域

在不断变革的人工智能法律领域，2023 年创造自己处于一个充满不愿定性和持续辩论的环境中。
面对新的寻衅，环绕版权、公司政策和更广泛的监管框架的谈论持续进行，这些谈论塑造了人工智能法律领域的轮廓。
以下是 2023 年最关键的法律议题：

欧洲人工智能法案

欧盟推出的人工智能法案是环球首个旨在规范人工智能利用的全面法律。
法案依据 AI 系统的风险级别分类，并据此制订规定。
只管原则上已获赞许，该法案的履行被推迟，估量将于 2025 年开始实行。

美国版权局对 AI 天生内容的态度

美国版权局采纳了明确的态度，谢绝为 AI 算法 Midjourney 创建的图像注册版权。
这一决定成为明确指出单独由 AI 创作、无人类参与的艺术作品不符合版权保护的先例。
此外，美国版权局还发布了辅导见地，澄清人类利用 AI 工具创作的作品可能符合版权保护。
该辅导见地确认，需根据人类在创作过程中的决定性浸染来评估利用 AI 工具的作品。

“现有法律体系尚未准备好接管 AI 创作作品的版权，由于 AI 是基于现有数据学习，这对确定归属权构成寻衅。
通过国家进行的调查，估量明年办理这个问题的做法将得到发展。
在缺少更广泛的"大众年夜众参与的情形下，目前独立办理这个问题变得困难。
”
Everypixel 公司状师 Daria Kuznetsova
麦肯锡发布了一份全面的图表，捕捉了 2023 年与人工智能管理干系的主要政策和监管动态，强调了 2023 年在塑造人工智能的法律框架方面的重大贡献。
来源：麦肯锡
争议
2023 年见证了许多引人瞩目的争议，这些争议反应了人工智能领域不断演化的规范和不愿定性。
随着人工智能的发展，这些辩论变得不可避免。
以下是这一年的一些最具争议的话题：
企业限定 ChatGPT 的利用
出于安全和隐私的考虑，摩根大通、花旗集团、美国银行、德意志银行、高盛和富国银行等紧张金融机构禁止了 ChatGPT 的利用。
这表示了一个普遍的趋势，即企业对员工发布了关于在事情场合利用 AI 的法律辅导。
OpenAI 利用廉价工人惹争议
《时期》杂志的一项调查戳穿了 OpenAI 与 Sama 互助，雇佣肯尼亚的廉价工人为 ChatGPT 筛选敏感内容。
这一创造引发了关于工人报酬和内容审核对生理康健影响的伦理问题的谈论。
OpenAI 的领导层动荡
Sam Altman 离职并迅速回归 OpenAI 成为上月的***。
在与董事会的沟通不一致后，Altman 辞去了 OpenAI 的领导职务。
临时 CEO Mira Murati 与大部分员工支持 Altman 的回归。
这一前所未有的情形引起了广泛关注，留下了关于这一变动背后真正缘故原由和其未来影响的疑问。
200 亿美元交易终止，Adobe 宣了结止收购 Figma
Adobe 操持以 200 亿美元收购 Figma 却遭遇监管障碍，欧洲委员会和英国竞争与市场管理局对潜在反垄断问题进行了调查。
这项拟议的交易影响超出了设计考虑，由于 Adobe 在客户数据平台方面的主导地位引发了首席信息官们（Chief Information Officers， CIOs）对其可能对云软件支出的影响的担忧。
终极，由于在欧洲和英国得到反垄断批准面临困难，Adobe 终极放弃了这笔交易，并向 Figma 支付了 10 亿美元的分离费。
AI 天生图片获索尼天下拍照奖，拍照师谢绝领奖
拍照师 Boris Eldagsen 在索尼天下拍照大赛（Sony World Photography Awards）中提交了 AI 天生的艺术作品并获奖，引起了轰动。
Eldagsen 谢绝接管奖项，引发了关于 AI 天生图像在传统拍照比赛中地位的辩论，对真实性和创造力的传统不雅观念发起了寻衅。
关于 2023 年人工智能的发展，你有何意见？欢迎在评论区分享你的不雅观点。