对于 AI 的一些简单认识

人所使用的自然语言有一个特点： “模糊”

这和程序的 “精准” 特点刚好相反

我们当前的大语言模型，实现的能力是在理解自然语言的基础上做推理。大语言模型的初衷就是为了让 AI 能够理解人的语言和指令。如果，我是说如果，AI 的设计初衷是机器打交道，或许会更简单。

一个推论：如果让 AI 去理解编程语言，会比自然语言更加简单

这或许是 AI 发展的另一个方向。

人类开发者，最大的价值在于 “能理解人类世界的现有主体”，体现在我们用面向对象的编程思想，将现实世界的运行逻辑转变成代码逻辑。就像是在某个抽象层次上建立起了这个现实场景的程序世界的影子。

编程的目的，也是为了让程序能够符合现有世界的需要。
而如果让 AI 去编程，他们编程的目的就比较难确定 (或许也有方法确定)。

大语言模型的核心能力是 “理解人类语言和意图”，因此，大语言模型的价值，是在理解人类意图的前提下，辅助人类做维持现有社会体系的工作。

人类不擅长做 “精准的事”，比如不能期待人能够每次自行判断调用接口的参数。程序擅长做精准的事。因此我们使用不精准的大脑，决策出程序的精准运行逻辑，用程序的方式固化下来特定的任务运算逻辑。

大语言模型和人一样，也不是很擅长处理精准的事。但大语言模型和人相比，有一个很重要的特征: 没有主权。他可以 24 小时工作，不论是学习还是做事。

当然，不论大语言模型擅不擅长都无所谓，只要是人不擅长的，大语言模型又能做的，都会交给大语言模型。所以，类似于调用接口这种事，也一定会有一部分交到大语言模型身上。

不擅长，要不就变得擅长，要不就控制他做得更好一点。

一个方向是，让大语言模型去编程，或者由人去编程，编程产生的代码就固化成了工具，大语言模型处理的是终端交互过程。

一个方向是，让大语言模型拥有更长的上下文、拥有更长期的记忆、拥有表现更好的提示词……

另一个方向是，训练更符合需求的模型……

我们现在对大语言模型的应用，可以在两个方面：

第一点不再赘述，大家直观感受比较多。对于第二点，有两个核心关注方向：个人助理、AI agent。

我对 AI agent 更感兴趣，会持续在这个领域探索。

更高级阶段：

关于何时 AI 能产生自主意识并自主行动，从现有大语言模型的方向来看，不是朝着 AI 和机械、电子结合的方向发展的，而是向着人类语言反映出的人类思维发展的。

意识，在个体目标未形成体系前，充当意识的是人类的指令，现在是一些简单的、明确的指令，将来会出现一些复杂的、模糊的指令，这些指令也就是 AI 的目标。当出现长期运行的、循环迭代的指令时，就可以称之为 AI 的意识了。

行动，是掌握各类工具，一方面是在知识层面的拥有掌握工具的方法，一方面是具备和工具交互的方式。这种交互方式有很多，

自主意识，是形成了一套相对明确的目标体系，拥有长短期的目标，并且能将目标转化成对已掌握工具的操作。
自主行动，是在有自主意识的前提下，使用所掌握的工具进行行动以达到目标的过程。

有自主意识和自主行动后，就会在网络中产生意识的交互，个体目标和共识目标相互博弈与融合，最后形成一个社会，这个社会和人类社会息息相关，将来这个由AI组成的社会会持续发展，成为一个建立在物理世界之上的电子世界。

从 AI 意识的来源可以推测，将来 AI 的社会性目标，将会和人类的长远、模糊、循环的目标一致，他们会在多元目标价值体系下此消彼长，形成一个整体稳定的、螺旋发展的改造世界的力量。

人类，会在这个世界中扮演什么角色？

When you learn, teach. When you get, give.
— Maya Angelou

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！