改写数学问题解决方式:AI像人类一样从错误中学习
研究人员来自微软亚洲研究院、北京大学和西安交通大学,他们开发了一种新技术,以改进大型语言模型(LLMs)解决数学问题的能力,让它们能够从错误中学习,类似于人类的学习方式。
研究人员提出了一种先进的策略,称为“LeMa”(Learning from Mistakes),该策略训练人工智能纠正自己的错误,从而提高推理能力,根据本周发布的研究论文。
研究人员从人类学习过程中汲取灵感,学生从错误中学习以提高未来表现。“考虑一个数学问题做错的学生,他会从自己犯的错误中学习并进行纠正,”作者解释说。然后,他们将这个概念应用于LLMs,利用GPT-4生成的错误纠正数据对其进行微调。
LeMa是如何提升数学推理能力的呢?
研究人员首先让像LLaMA-2这样的模型生成数学文字问题的错误推理路径。然后,GPT-4识别推理中的错误,并解释错误之处,并提供纠正后的推理路径。研究人员使用这些纠正数据来进一步训练原始模型。
这种新方法的结果非常显著。“在五种骨干LLMs和两个数学推理任务中,LeMa相对于仅在CoT数据上进行微调,不断改善了性能,”研究人员解释说。
LeMa在具有挑战性的数据集上取得了令人瞩目的成果
更重要的是,像WizardMath和MetaMath这样专门化的LLMs也受益于LeMa,在GSM8K上实现了85.4%的一次通过率准确度,在MATH上达到了27.1%。这些结果超过了这些具有挑战性任务上非执行开源模型所取得的最先进性能。
这一突破不仅意味着AI模型推理能力的提升,也标志着朝着AI系统能够像人类一样从错误中学习和改进的重要一步。
研究团队的研究成果,包括他们的代码、数据和模型,现在在GitHub上公开。这种开源方法鼓励更广泛的AI社区继续这一领域的探索,可能会引领机器学习的进一步发展。
LeMa的出现标志着人工智能领域的一个重要里程碑,表明机器的学习过程可以更像人类的学习。这一发展可能会在诸如医疗保健、金融和自动驾驶等严重依赖AI的行业中带来革命,其中错误修正和持续学习至关重要。
随着AI领域的迅速发展,像从错误中学习这样的类人学习过程似乎是开发更高效和更有效的AI系统中的一个重要因素。
机器学习的这一突破突显出了人工智能领域未来潜在的激动人心的潜力。随着机器在学习从错误中汲取经验的能力不断增强,我们离一个未来更接近的地步,即机器在复杂问题解决任务中的能力超越人类。
#AI绘画生成新年专属头像# #ai# #高中数学# #美国# #中国产业名片# #数码最前沿# #高科技# #新闻# #头条热搜# #机器人# #自动化# #菜鸟#
