随着人工智能的迅速发展,聊天工具已经成为人们日常生活中的重要组成部分。在这个领域中,开放AI的ChatGPT引起了广泛关注,它是一种基于GPT-3.5架构的强大语言模型,具备卓越的自然语言处理和生成能力。与此同时,国内一些相关软件也应运而生,如百度的文心一言,阿里的通义千问,以及360的智脑等等,但都需要排队、等候接受邀请方可体验。本人有幸得到360的邀请码,并对这两个聊天工具进行了大量的对比分析。接下来本文将从以下五个方面各通过一个典型的案例对ChatGPT与360智脑进行全面对比,以了解它们的优劣。
一、语言理解(问题理解):
问题: 大大爷带着二大爷到三大爷家说四大爷被五大爷骗到六大爷家偷七大爷放在八大爷柜子里九大爷给十大爷的一千块钱。问题一:谁是小偷? 问题二:谁的钱被偷?
chatGPT ★★★★☆

360智脑 ★☆☆☆☆

ChatGPT对这道题进行了步骤拆分,问题一回答正确;对于问题二,拆分出了九大爷给了十大爷一千块钱,这也没错,但是没拆·分出“十大爷的一千块钱”,所以问题二回答错误。
360智脑,对两道题看起来没有思路,均无得出准确的答案。
总结:ChatGPT在语言理解方面表现出色。它能够分布解析复杂的句子结构和语义含义,并能够理解上下文和推理逻辑,但对于长句子的理解还需要有更多的案例进行训练。相比之下,360智脑在语义理解方面存在局限性,没有分析步骤,也没得到正确的结论。
二、回答准确性:
在这个功能对比上,用一道数学题来对比:
问题: 有30个蓝色气球,10个红色气球,一半的蓝色气球破了,现在还有多少个气球?
chatGPT ★★★★★

360智脑 ★★★☆☆

在这个问题上,360智脑分析到没破时气球的总数,一半的篮球(即15个)也分析出来了。但是,接下来还有6个蓝色气球剩下,这一步就让人费解了,这应该是360的模型出现了问题,最重要的是没有给出这道题的结果。
chatGPT,分析步骤很清新,答案准确。
总结:ChatGPT的回答准确性令人印象深刻。它可以根据提供的信息提供详细、准确的回答,甚至可以给出支持性的证据或。360智脑的回答准确性有所不足,尤其是在需要深入理解问题并提供具体答案的情况下。
三、多领域知识:
针对多领域知识的知识储备方面,本人从科学、历史、文化、技术等多个领域进行了提问。相对来说,ChatGPT可以提供更深入的解释和相关的信息,360智脑相对弱一些,在回答专业问题上回答的不够全面或深入。但也不尽然,在这里举一个古诗词方面的例子:
问题 :“词苑千载,群芳竞秀,盛开一支女儿花“说的是历史上的那位才女?
ChatGPT ★★★☆☆


360智脑 ★★★★☆

针对这道题来讲,360显然有这方面的知识储备,问题回答正确。ChatGPT则不同,没有这方面的知识储备,它更像是一个在思考问题的小同学在推测答案,首先推测是苏东坡的妹妹;我又问了一遍,它又猜是杨玉环。当我把这个问题再次以选择题形式提出时,它给出了正确答案是李清照,并对之前回答的错误表示抱歉,同时感谢纠正。有意思的是,ChatGPT其实并不知道这个选择题的答案,你再问一次它可能又换了其他答案,因为它是推测出的它认为最优的答案,只有你反馈它答对了或答错了,那么这道题它就学习了,并在反馈与学习中获得正确答案。
四、语言表达: 问题: 男生跟你说,你太单纯了,是什么意思?
chatGPT ★★★★☆

360智脑 ★★★☆☆

总结:ChatGPT的语言表达能力出色。它可以生成自然流畅的回答,具有适当的语法和语义结构。此外,ChatGPT还可以模拟不同风格和语气,以满足用户的个性化需求。360智脑在语言表达方面不如ChatGPT,表达生硬或不够自然的表达。
五、人机交互:
在这个测试中,我通过简单的说明。即先是我说一句他们答一句,最后根据问的问题形成一个自我介绍。
问题:
我叫侃神
我是学计算机的
我喜欢编程
我是编程高手哦,别说那些废话了
我还喜欢运动,美食
(以上都是逐条提问的,ChatGPT和360智脑做相应的回答)
请结合上述的问题,帮我做个自我介绍。
chatGPT ★★★★☆




360智脑 ★☆☆☆☆



总结:ChatGPT的人机交互性能值得称赞。它可以与用户进行流畅的对话,并能够理解上下文变化和指代问题,对以上所提问题进行总结。360智脑则是一问一答,有时答非所问,前后问题不能关联,更不会对用户提出的问题进行总结。
结论:
综合以上分析,ChatGPT在语言理解、回答准确性、多领域知识、人机交互和语言表达等方面表现出色,还能够通过适当的提问来澄清用户的意图。360智脑虽然迈出了生成性训练(GPT)这一步,但其语言模型,训练模型还处在初级阶段。由于ChatGPT在国内访问受限,360智脑等类chatGPT工具在某些特定场景或功能上可能具有竞争力,但的确还存在很大的差距。除上述测试案例外,本人还进行了心理学方面的案例(案例内容都500字左右)分析测试,编写长篇科技论文的测试等等。360智脑主要表现为:
1. 知识储备不足。
2. 对用户提出的问题审题不够严格。
3. 回答部分,答题的思路或者说步骤不够明确,直接给出结论,导致结论不正确或出现偏差。
虽然chatGPT胜于360智脑一筹,但也不是尽善尽美,有时还一本正经、理直气壮的出错,但它的推理及纠错模型很值得学习。同时也相信360智脑通过不断归纳、优化模型,通过大量的案例训练模型,也会做的更好。