国家级评审揭晓,学而思九章大模型领跑,文心一言与星火紧随其后

随着人工智能技术的快速发展,大模型因其卓越性能逐渐崭露头角,特别是在数学问题解决能力方面,它已成为衡量技术先进性的重要标准。近期,备受瞩目的MathEval权威测评活动吸引了业界的广泛目光。此次测评旨在深入剖析来自30个不同出处的大模型(包括部分模型的多个变种)在数学解题方面的实力,从而为行业描绘出一幅详尽的能力图谱,帮助人们更好地理解和比较各模型的表现。

国家级评审揭晓,学而思九章大模型领跑,文心一言与星火紧随其后

在众多参与测评的模型中,学而思九章、百度文心一言4.0以及讯飞星火V3.5脱颖而出,分别荣登榜单前三名。学而思旗下的九章大模型,不仅在综合能力上展现出显著优势,而且在处理中英文数学题目以及适应不同学段需求方面均表现出色,令人瞩目。九章大模型通过深入剖析和理解数学问题,为学生提供了一个高效、精准的学习辅助工具,有效推动了教育技术的革新与发展。

截至去年10月,我国已成功推出超过200款大型人工智能模型,这些模型在数学领域的应用广泛,包括解题、数据处理、学术研究和辅助教学等。然而,尽管市场上的通用型和专项型大模型均展现出处理数学问题的潜力,其实际性能仍需通过精准评估来确认。当前,虽然模型的通用性、推理能力和自然科学处理能力的评估体系已初具雏形,但专注于数学领域能力的标准化基准和权威评估机制仍待完善。

国家级评审揭晓,学而思九章大模型领跑,文心一言与星火紧随其后

尽管大模型的潜力被广泛认可,但由于缺乏针对性的评估体系,其在数学应用方面的具体能力和应用效果尚缺乏明确的评价标准。因此,建立权威且专业的数学能力评估机构对于推动大模型技术在数学领域的健康发展和应用至关重要。

而MathEval平台的推出填补了行业内的这一长期空白。该平台是由国家级智慧教育人工智能创新开放平台携手暨南大学、北京师范大学、华东师范大学、西安交通大学和香港城市大学等多所国内外著名高校共同发起的项目。MathEval为大型人工智能模型在处理从基础算术到小学、初中、高中乃至部分大学级别的数学问题时的能力,提供一个全面而综合的评价标准。

国家级评审揭晓,学而思九章大模型领跑,文心一言与星火紧随其后

作为全球数学领域的专业领军者,学而思旗下的九章大模型已然成为数学爱好者和科研机构争相追捧的得力助手。这一瞩目成就的取得,离不开公司对九章大模型项目超过10亿元的持续投入与精心打磨。

在此次评测中,学而思旗下的九章大模型展现了其非凡实力,进一步夯实了其在数学教育领域的领军地位。九章大模型的成功研发,不仅彰显了学而思在人工智能技术研发与应用方面的雄厚实力,更为国产大模型的发展树立了一面崭新的旗帜,引领着整个行业不断前行。