新书速递特辑教学视频,新书速递视频教程

新技术可以深刻改变人类的生活和工作方式。在过去，蒸汽机、电力和计算机推动了人类社会的转变，它们加快了生产效率和经济增长，并将就业结构从以农业为主转移到以制造业为主，再到后来的以服务业为主。如今，人工智能的进步正在引领一场广泛而迅猛的变革。不同于过去的技术，人工智能和机器人技术已经可以在更多任务中匹敌甚至超越人类，尤其是在图像和语音识别、预测和模式识别场景中。随着计算能力、存储容量和算法的稳步提升，这一过程将掀起比以往更快的技术进步发展浪潮。

理解人工智能及机器人技术的能力与人类技能的关联，以及二者如何随着时间的推移而发展，对于理解这场进行中的技术变革至关重要。通过与人类比较来了解人工智能的能力，能够帮助我们预测未来几年哪些工作任务可能实现自动化、哪些技能会被淘汰、哪些技能日益重要。这些基本认知有助于政策制定者制定有效的劳动力市场政策，以应对技术变革带来的挑战。此外，也可以帮助政策制定者以最佳的方式重塑教育系统，培养面向未来的学生。

视频加载中...

研究方法：基于国际成人能力评估项目的专家判断

2016年，经合组织开展了一项研究，采用国际成人能力评估项目（PIAAC）评估人工智能在人类核心技能方面的能力。根据专家的评估，在技术条件成熟的环境下，人工智能在阅读理解、数学推理和解决问题方面的能力接近成年人的能力水平2（最低为水平0，最高为水平5）。而在经合组织成员国家和经济体中，平均有超过一半的成年人在这些领域的测试中处于能力水平2或以下，未能“超越”人工智能。这表明，许多人在工作中可能会受到不断演进的计算机能力的影响。

国际成人能力评估项目评估了16—65岁的成年人在技术条件成熟的环境下，在阅读理解、数学推理和问题解决这三种一般认知技能领域的熟练程度。这些技能是个人有效参与劳动力市场、教育和培训活动以及社会和公民生活所需要能力的关键决定因素。例如，较高的阅读水平与更高的薪资、更多地参与志愿活动、更高的社会信任度，以及更好的就业能力和健康状况相关联。因此，各国都有很大的动力来投资于发展公民的这些技能。这些技能表现为更高的生产力和更强的创新能力，往往与经济回报相关。它们还与社会凝聚力和公民参与、政治和社会信任等重要的社会回报有关。

专家对于人工智能在国际成人能力评估项目的阅读和数学测试中的表现的评估也为政策制定者提供了有用的信息。评估人工智能在这些领域的能力，是预测其对人类工作和生活产生影响的指针，因为阅读理解和数学推理能力与大多数社会环境及工作场景都有关联。此外，采用人类测试进行评估，研究者能够比较人工智能与人类的能力，并就人工智能再现人类技能的能力得出结论。

本研究延续2016年的试点研究，旨在通过专家判断人工智能是否可以完成国际成人能力评估项目测试，来评估人工智能的能力。

主要发现

专家期待人工智能在国际成人能力评估项目的阅读和数学测试中取得更佳表现。

●根据专家评价，人工智能能够回答大约80%的国际成人能力评估项目阅读试题。它能够解答大多数简单问题，典型的简单问题包括从短文本中找到信息、认识基本词汇。它还能够掌握很多较困难的问题，即通读大段文本后整合答案。专家对这一评价达成了高度共识。

●根据专家评价，人工智能能够回答大约三分之二的国际成人能力评估项目数学试题。但是，这一结论背后仍有分歧。有的专家认为狭义人工智能（narrow AI）只能解决一部分计算题。而另外一些专家认为通用系统（general systems）能够进行数学推理，并处理与国际成人能力评估项目试题相类似的各种数学题。这导致了评价结果的分化，第二类专家的评分低于第一类专家评分。

人工智能的阅读理解能力自2016年以来增长显著。

●与试评结果的比较表明，人工智能的阅读理解能力自2016年以来取得了相当大的进步。人工智能在阅读测试中的预期正确率提高了25个百分点。这体现了此时期自然语言处理的技术突破，GPT等预训练语言模型的出现也与之有关。

●与专家的探讨指出，人工智能的数学推理能力在2016—2021年可能没有很大变化。虽然计算题背后的规范数*运学**算很容易实现自动化，但是从涉及通用知识且以图文表述的任务中提取规范模型，还没有引起研究者足够的重视。

根据专家评价，到2026年，人工智能将能够应对这一整套阅读和数学测试。

●根据目前的技术进展，以及对自然语言处理的重金投入和研究，专家们断言，人工智能的阅读理解能力还会继续增强。

●最近，大语言模型经过微调（fine-tuned），被应用于解决数学问题。在这一领域中，出现了重要的基准测试和在测试中表现良好的若干个系统。这些趋势使得专家们期待人工智能在未来几年取得数学题上的重大进步。

人工智能可能超过了大多数人的阅读理解和数学推理能力。

●国际成人能力评估项目评价的是从低至高的多个水平（水平1及以下为低，水平4至5为高）的阅读理解和数学推理能力。根据专家的评价，人工智能的阅读表现已接近成年人的水平3。在参与国际成人能力评估项目的经合组织成员中，平均有90%的成年人处于水平3及以下，只有10%的人表现出高于水平3的能力。

●根据专家评价，在回答国际成人能力评估项目的中低难度题目时，人工智能的数学表现接近成年人的能力水平2，而在回答较难的题目时，人工智能接近成年人的水平3。在数据可得的经合组织成员国家和经济体中，平均有57%的成年人处于计算能力的水平2及以下，88%处于水平3及以下。

本研究尽管仍有局限性， 但已表明人工智能在阅读理解和数学推理上的能力进步会对就业和教育产生深远影响。 大多数劳动者每天运用这些技能完成工作。与此同时，在过去几十年里，这些技能水平在大多数国家并没有得到提升。相比之下，人工智能的阅读理解和数学推理能力发展迅速。

●在参与国际成人能力评估项目的国家中，平均有59%的劳动者每天使用的阅读技能水平与计算机水平相当，甚至低于计算机水平。27%—44%的劳动者每天使用的计算技能水平不超过人工智能水平。人工智能将会对这些劳动者的阅读和计算工作造成影响。

●即使在当前排名最高的国家，阅读和数学技能超过人工智能的劳动力也没有超过四分之一。有鉴于此，教育的重点应该转向教学生使用人工智能系统，从而更加高效地驾驭阅读和数学任务。

本文内容节选自《智慧竞逐：技术进步与教育未来》的概要和第一章，对原文进行了重新编辑。教育科学出版社2023年10月出版。

新书速递特辑教学视频 (新书速递视频教程)

研究方法：基于国际成人能力评估项目的专家判断

主要发现