
近期,Kimi智能助手在“今天星期几?今天是2024年3月24日,星期四。”这个对话上出现了错误,这引起了一些对Kimi AI能力的质疑和嘲笑。
值得注意的是,即便是OpenAI的ChatGPT 3.5也存在类似的错误。
但有一个AI智能工具例外,文心一言可以准确的告诉我们今天是星期几,并且不受用户言语的影响。(文心一言的这个能力并非源自AI,这是大多数家用电脑都具备的功能)
那么,当涉及到数字计算时,AI工具的表现又如何呢?
在图1至图3中,我们可以看到ChatGPT、文心一言和Kimi针对“1000亿除以2.73万亿”这一计算问题分别给出的答案。(1000亿是腾讯2024年预计用来回购股票的金额,2.73万亿是当前腾讯的市值)
- ChatGPT3.5的答案:0.3663
- 文心一言的答案:3.663
- Kimi的答案:0.366
在这一数字计算任务上,Kimi、ChatGPT和文心一言均未能给出完全正确的答案。
为什么普通的计算机能够轻松完成这些计算,而AI却做不到呢?
这并非因为AI的基础不稳固或存在Bug,而是因为AI大模型的数字计算主要依赖于深度学习中的神经网络架构,尤其是Transformer模型。这些模型通过大量数据训练,并在复杂的神经网络结构中进行推理,需要通过大量的数学问题和答案对进行学习。相比之下,电脑中的计算器程序主要基于软件算法和算数逻辑单元(ALU),即CPU,专门设计用语执行四则运算。
至于确定星期几的问题,AI智能工具的大模型通常没有接入实时时钟或日历功能,因此无法感知或跟踪当前日期或时间。文心一言之所以能够提供准确答案,是因为它接入了实时日期信息,这与AI模型的工作原理有本质的不同。
数学包括数字计算是AI发展的基础,是AI未来进一步发展的动力。
“AI无法准确的进行数字计算”反而是一个合乎逻辑的事情,同时也是AI对人类威胁论的一个相反的佐证。

图1:ChatGPT

图2:文心一言

图3:Kimi
如果某天AI真把数学包括数字计算自己融会贯通了,那AI就可能真正把人类甩到一边了。