对于 AI 的一些简单认识

人所使用的自然语言有一个特点: “模糊”

这和程序的 “精准” 特点刚好相反

我们当前的大语言模型,实现的能力是在理解自然语言的基础上做推理。大语言模型的初衷就是为了让 AI 能够理解人的语言和指令。如果,我是说如果,AI 的设计初衷是机器打交道,或许会更简单。

一个推论:如果让 AI 去理解编程语言,会比自然语言更加简单

这或许是 AI 发展的另一个方向。

人类开发者,最大的价值在于 “能理解人类世界的现有主体”,体现在我们用面向对象的编程思想,将现实世界的运行逻辑转变成代码逻辑。就像是在某个抽象层次上建立起了这个现实场景的程序世界的影子。

编程的目的,也是为了让程序能够符合现有世界的需要。
而如果让 AI 去编程,他们编程的目的就比较难确定 (或许也有方法确定)。

大语言模型的核心能力是 “理解人类语言和意图”,因此,大语言模型的价值,是在理解人类意图的前提下,辅助人类做维持现有社会体系的工作。


人类不擅长做 “精准的事”,比如不能期待人能够每次自行判断调用接口的参数。程序擅长做精准的事。因此我们使用不精准的大脑,决策出程序的精准运行逻辑,用程序的方式固化下来特定的任务运算逻辑。

大语言模型和人一样,也不是很擅长处理精准的事。但大语言模型和人相比,有一个很重要的特征: 没有主权。他可以 24 小时工作,不论是学习还是做事。

当然,不论大语言模型擅不擅长都无所谓,只要是人不擅长的,大语言模型又能做的,都会交给大语言模型。所以,类似于调用接口这种事,也一定会有一部分交到大语言模型身上。

不擅长,要不就变得擅长,要不就控制他做得更好一点。

一个方向是,让大语言模型去编程,或者由人去编程,编程产生的代码就固化成了工具,大语言模型处理的是终端交互过程。

一个方向是,让大语言模型拥有更长的上下文、拥有更长期的记忆、拥有表现更好的提示词……

另一个方向是,训练更符合需求的模型……


我们现在对大语言模型的应用,可以在两个方面:

  1. 让大语言模型做一个知识更丰富的、更具有系统性的信息整合和输出工作,例如知识问答、文章生成、图片绘制
  2. 改变现有的人类与程序的交互方式,从原有的 UI、cli、api、function 的交互方式,变成自然语言交互的方式

第一点不再赘述,大家直观感受比较多。对于第二点,有两个核心关注方向: 个人助理、AI agent。

我对 AI agent 更感兴趣,会持续在这个领域探索。

更高级阶段:

  1. 融合多种模态的信息,做一个更符合人类认识的“机器人”,以便能更好地辅助人类维持现有社会体系的生活和工作

关于何时 AI 能产生自主意识并自主行动,从现有大语言模型的方向来看,不是朝着 AI 和机械、电子结合的方向发展的,而是向着人类语言反映出的人类思维发展的。

意识,在个体目标未形成体系前,充当意识的是人类的指令,现在是一些简单的、明确的指令,将来会出现一些复杂的、模糊的指令,这些指令也就是 AI 的目标。当出现长期运行的、循环迭代的指令时,就可以称之为 AI 的意识了。

行动,是掌握各类工具,一方面是在知识层面的拥有掌握工具的方法,一方面是具备和工具交互的方式。这种交互方式有很多,

自主意识,是形成了一套相对明确的目标体系,拥有长短期的目标,并且能将目标转化成对已掌握工具的操作。
自主行动,是在有自主意识的前提下,使用所掌握的工具进行行动以达到目标的过程。

有自主意识和自主行动后,就会在网络中产生意识的交互,个体目标和共识目标相互博弈与融合,最后形成一个社会,这个社会和人类社会息息相关,将来这个由AI组成的社会会持续发展,成为一个建立在物理世界之上的电子世界。

从 AI 意识的来源可以推测,将来 AI 的社会性目标,将会和人类的长远、模糊、循环的目标一致,他们会在多元目标价值体系下此消彼长,形成一个整体稳定的、螺旋发展的改造世界的力量。

人类,会在这个世界中扮演什么角色?


When you learn, teach. When you get, give.
Maya Angelou


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!