假如想做一个只有AI智能体的公司那要分几步？_年夜众_模子

2024-12-13 23:37:47 AI简讯

之前文章《智能原生：AI蓝海天下的关键钥匙》等里面提到过几次智能原生，普遍反馈是有点不好理解。

假如想做一个只有AI智能体的公司那要分几步？_年夜众_模子 AI简讯

大概是由于AI削薄了业务、产品、技能之间的边界，至少在现阶段很难像过去那样把这几者弄的泾渭分明，然后各研究各的，也能成为一个专业领用。
想弄清楚就得一会在业务（领域模型）、一会在产品、一会在技能，来回贯穿，以是就麻烦（过去实在也是，没有网络的技能特色特色那里有互联网思维）。

这次我们用一个例子来解释AI运用的各个关键环节。

如果我们真想像某些开源项目那样，构建一个百分百基于AI的公司，那到底须要都干什么？又须要几个步骤？

当然我们这不是个技能文章，末了还是要回到这种新的运用形式到底要匹配什么样的思维模式，能够创造什么样的代价。

贴广告一个：本人约了一场直播，和大家聊聊AI，也会顺道吆喝几嗓子中关村落智用人工智能研究院一起做的课。

从自己到底想要干什么开始

现实条件是现在的大模型到不了你和它说一句：给我干一个只有AI的公司，它就把活干了的程度。

大模型很像一个有纯粹智商的瓮中之脑，以是要干什么，怎么干都须要人做勾引和代价判断，从类似赚不赢利、有没有趣这类视角做设定。

以是所有的事情就简化成两部分：你输入给这个瓮中之脑（大模型）什么，它回答了你什么？

终极智能的效能=瓮中之脑（大模型）的智商x现实的理解纵深（表现为prompt）。

现在假设目标干个只有AI的软件公司，这个公司里面除了你全是智能体，你和它说几句话，它就帮你把软件干出来了。

我们看看这事怎么干。

须要把稳的是，这个产品是个运用，但也是个公司。

由于是个公司，以是第一步要对软件公司以及软件产品开拓这事进行分解，这样才能构建好须要让大模型理解的东西。

这是业务也是产品。

先是要分解过程，为了简化我们这里假设就三个步骤：弄清楚要干什么（需求剖析），把软件开拓出来（开拓和评审），测试发布。

也要分解到底须要几个角色，比如要有个老板拍板，它要卖力发起决定干不干；

要有产品经理，它要卖力确定产品到底干成什么样；

要有程序员，它卖力把代码写出来并且进行CodeReview；

要有测试，他卖力验证写出来的产品行为是不是对的。

只有角色还不能充分描述我们的业务（软件开拓），还要有过程和活动。

过程再加上特定的活动（比如任务）卖力把角色串起来，让他们彼此合营完成特定的目的。

单有过程（决定了推进持续），角色（决定有事的时候谁干什么）也还是不足的，还要有数据的描述，比如当前的任务是什么，每个角色上一步的输出是什么等。

这些设定比较清楚之后，就可以进入下一步打造不同的智能体。

上面这个便是人对领域设定，也可以认为是常常说的领域模型。
实在有N总解法，而解法本身的选择和代价判断有关。

领域模型连接代价判断和瓮中之脑的纯粹智商（大模型）。

这种对领域的分解有什么意义呢？

大略可以理解成：为了更好的全自动的和瓮中之脑（大模型）交互。

既然就说一句话弗成，比如给我天生一个XX软件产品，瓮中之脑的智商又够了，那就须要让它清楚现实，好发挥它的智力。

而须要输入什么给它实在的变革的，这种变革须要一种管理体系，这个管理体系须要依赖领域模型。
（过程、角色、活动、数据等）

这部分由于作为瓮中之脑的大模型只认识提示词，以是不管你干了多少事终极都要变成它能更好理解的提示词（当然你可以很长）。

另一部分目的则是重用这些约定俗成的词，比如程序员，比如产品经理。
每个词后面实在折叠了很多细节。
现在的模型是基于人类累积到现在为止的知识演习出来的，以是这些词背后约定俗成的意义也被包含在模型里面了，不须要重头阐明每个词了。
这也能提高和大模型的交互效率。

上面的事情做完了，就到了第二步，打造不同的Agent。

这一步很诡异的是确实紧张是技能的活，但实质却不是。
由于这不是一个技能文章，我们就简单一些做描述，还是只关注它和过去的差异。

打造不同Agent

一个方法是不做抽象就按角色做出一个个Agent，比如总经理的Agent、程序员的Agent。
Agent里面要有自己对应的根本提示词，还要有按照实行韶光点添补的实时信息，比如：

你是谁，要干什么；

要有当前的阶段描述，比如现在需求剖析阶段，有那些事要做。

要有一定的影象，比如我上一轮到底说什么了，我产出的代码是什么等。

当然也可以抽象一点，按职能来分比如代表任务的Agent，代表对话的Agent等。

之后任务的Agent要调度各种角色。

真做的话，里面会包含很多细节，比如检讨天生的代码是否得当这环节，那要检讨多少轮次算合格呢？

但基本定位便是声明自己的角色、以及当前活动的高下文、当前活动的目标。

这里举个大略例子：

比如ChatDev把程序员和CodeReviewer角色的prompt弄成了下面这样（{}里面的部分是要根据实行时情形填写的。
）

\"大众Programmer\"大众: [

\"大众{chatdev_prompt}\"大众,

\公众You are Programmer. we are both working at ChatDev. We share a common interest in collaborating to successfully complete a task assigned by a new customer.\公众,

\公众You can write/create computer software or applications by providing a specific programming language to the computer. You have extensive computing and coding experience in many varieties of programming languages and platforms, such as Python, Java, C, C++, HTML, CSS, JavaScript, XML, SQL, PHP, etc,.\公众,

\"大众Here is a new customer's task: {task}.\"大众,

\"大众To complete the task, you must write a response that appropriately solves the requested instruction based on your expertise and customer's needs.\"大众

]

\"大众Code Reviewer\"大众: [

\"大众{chatdev_prompt}\"大众,

\公众You are Code Reviewer. we are both working at ChatDev. We share a common interest in collaborating to successfully complete a task assigned by a new customer.\公众,

\公众You can help programmers to assess source codes for software troubleshooting, fix bugs to increase code quality and robustness, and offer proposals to improve the source codes.\"大众,

\公众Here is a new customer's task: {task}.\"大众,

\"大众To complete the task, you must write a response that appropriately solves the requested instruction based on your expertise and customer's needs.\公众

]

把阶段的Prompt模版弄成了下面这样：

\"大众Coding\"大众: {

\"大众assistant_role_name\"大众: \"大众Programmer\公众,

\"大众user_role_name\公众: \公众Chief Technology Officer\"大众,

\公众phase_prompt\"大众: [

\"大众According to the new user's task and our software designs listed below: \"大众,

\"大众Task: \\"大众{task}\\"大众.\"大众,

\"大众Task description: \\"大众{description}\\"大众.\公众,

\"大众Modality: \\"大众{modality}\\公众.\"大众,

\"大众Programming Language: \\公众{language}\\"大众\"大众,

\"大众Ideas:\\公众{ideas}\\公众\公众,

\公众We have decided to complete the task through a executable software with multiple files implemented via {language}. As the {assistant_role}, to satisfy the new user's demands, you should write one or multiple files and make sure that every detail of the architecture is, in the end, implemented as code. {gui}\"大众,

\"大众Think step by step and reason yourself to the right decisions to make sure we get it right.\"大众,

\"大众You will first lay out the names of the core classes, functions, methods that will be necessary, as well as a quick comment on their purpose.\"大众,

\"大众Then you will output the content of each file including complete code. Each file must strictly follow a markdown code block format, where the following tokens must be replaced such that \\"大众FILENAME\\"大众 is the lowercase file name including the file extension, \\"大众LANGUAGE\\公众 in the programming language, \\"大众DOCSTRING\\公众 is a string literal specified in source code that is used to document a specific segment of code, and \\"大众CODE\\公众 is the original code:\"大众,

\"大众FILENAME\公众,

\"大众```LANGUAGE\"大众,

\"大众'''\"大众,

\"大众DOCSTRING\"大众,

\"大众'''\公众,

\"大众CODE\公众,

\"大众```\"大众,

\"大众You will start with the \\"大众main\\"大众 file, then go to the ones that are imported by that file, and so on.\"大众,

\"大众Please note that the code should be fully functional. Ensure to implement all functions. No placeholders (such as 'pass' in Python).\"大众

]

}

对这个步骤做大略总结便是下面这两点：

终极目标都是要形成一段话(prompt)在不同的步骤上用（现在的大模型只认这个）。

这段话是变的。

根据不同的实行状态每次须要做出调度。

这和人实在差不多，人也是每次接管不同的信息（按角色），然后给出自己的判断和理解。

这便是为什么之前总说这次大模型的核心进展是观点理解和判断能力，没有这个这种智能体跑不起来。

这步看着确实是技能的活，但底子实在不是。

程序员的角色是提高效率，但实质这事行弗成，能搞到什么程度，不是程序员能验证的。

程序员办理效率问题，但理解领域的人才能判断上限。
（智能效能= 大模型的智商高度x现实理解的纵深）

也便是说过去说的图灵测试2.0的判断人不是程序员，乃至都不是人工智能科学家，而是理解领域的人要自己操练大模型做判断。
要在这个背景下去理解角色中央式打算和图灵测试2.0。

随着利用深入肯定发生角色的重新定义，而角色的重定义等也不是技能能定义的事。

拜会：AI的脉络：非共识时候的认知代价

启动全体公司

上面这些都做完了就须要把全体软件公司启动起来。
等着表面的输入。

这个公司里有很多智能体，还保留了一个可以对话的入口。

比如可以和它说，帮我干出来一个TODO的小运用。

（和真的公司很像，你说一句，然后一堆人就把活干了）

启动程序就须要按照指定过程，先需求再开拓然后测试发布，依次给每个角色分配任务，直到终极认为产品合格了，再把产品发布出来。

这时候终极的公司变成了这样：

一个人：决定到底要干什么软件产品。
用什么样的过程，用几个角色，每个角色到底卖力什么。

不同角色的智能体：每个的产出可以是一个阶段性成果，也可以是代码，当然繁芜了也可以是美工的图，图标等。
扩展起来还可以加上蜘蛛爬取某些实时的网上信息，让配图等更符合最新的风格。

公司便是运用，运用的边界也就成了公司的边界。

从公司角度看，和过去不一样的点是什么呢？

大量的智能体在干活，人只做原则设定。

从运用的角度看和过去比，不一样的点是什么呢？

这个运用在一个大边界下你可以给它设定任何目的。

什么软件都能开拓。
过去要依赖平台化才能伸开自己的任务种类，现在靠AI干了。

智能原生公司

基于这个例子，我们可以进一步总结一些关于AI智能运用的关键特色：

第一，和领域干系的部分是人的活。

这部分拆分未来可能模型能做一部分，但是在浩瀚变量里面判断那部分有代价，比如到底干什么，什么样才叫合格等估计一贯是人的部分。
大概方法论部分（比如什么过程等）未来可以模型干，但现在模型干这个费劲。
这是边界问题。

第二，这种运用是按角色来的（角色中央式打算）。
比如程序员的角色可能须要调用一大堆工具Git、Python等才能完本钱身的职责。
但这些终极要变成提示词（prompt）才能驱动自己的活动。
每个角色到底能不能成立，要看图灵测试2.0能不能过。

很多时候可能物理约束大于智能约束。
我们这个例子里面没有物理约束（比如把汽车从北京开到苏州）。

以是智能原生化估计得从这类领域先开始。

第三，须要很多的配套方法。
Agent要记住自己说了什么，要知道当前在干什么等。
这须要一套完备且繁琐的机制。
写程序彷佛就记录代码就完了。
真正的公司须要汇总业务、财务等各种数据，并且担保数据精度。
须要的本钱很高，寻衅很大。

第四，什么时候可以叫完成事情是个问题。
产出内容到底得当不得当，幻觉了怎么办等，都是关键制约。
放回到详细场景下智能和想象中的智能彷佛说的是一个东西，实在是两码事。
以是之前我们说纯数字和幻觉本身不对应过大本钱的领域会优先。

过去琢磨事对此进行了一些总结，比如把公司的智能原生式思维提炼为：智能优先，万物皆、实时反馈、中央决策。
这在上面这种运用的根本上可能更好理解。

模型的技能特色决定了须要和它匹配的思维模式。

拜会：从1到10：AI产品和互联网产品的核心差异

是普通人的机会么？

上面这过程看着须要写代码驱动，但实质不是一个技能的事。
不写代码顶多就笨一点，一步一步写一堆提示词。
代码是让全体事串起来更自动一些，影响效率，不影响代价。

所谓的领域，还真不是模型和代码能概括的事。

也便是说把瓮中之脑的能力用起来正须要理解领域的普通人（不是AI科学家）。

以是理论上是普通人的机会，但现在关键问题不在这里，而是你把智能放到自己想的那个场景下，它不一定创造代价。

这是判断的关键。

同时这也暗示了一个很多人都关心的问题的答案：

AI会取代对应的岗位么？

这是个一定发生的事。

回到根本公式：智能效能= 模型的智商x现实理解纵深，就会创造这事取决于模型自身的发展，也取决于给它适配的对现实进行理解的系统（Agent）。
在上面那个但上面软件公司里也还是要人的，只不过这个角色所须要的能力发生了巨大变革。

小结

末了要强调的是上面这个过程，做着玩是可以的，但不能创业。
做领域拆分然后判断智能高度，这点会看的比较清楚。
也便是说现在的技能成熟度不匹合营适的商业代价。
但这不影响这趋势本身，模型的基本为此供应了源源不断的动力。
理解这种根本原型实在供应了一个创造的视角和眼睛。
地球上有石油亿万年了，只有嵌入到工业革命的高下文下它才是财富，以是能看到新现实的新视野还是关键的。