GMAT™考试是如何使用人工智能的？

2022年01月20日 | MBA.COM团队

自自1953年以来，GMAT考试一直被专门用于商科研究生项目招生，它是全球首批使用计算机自适应考试形式和基于人工智能（AI）的论文评分方法的考试项目之一。

作为GMAC考试开发与计量心理学部门的高级总监，Chris Han一直在这一领域提供专业的指导性意见，即如何在测试的基础上使用开创性的数据科学技术，这一技术已历经了近70年的发展变迁。

在这篇专访中，他解释了GMAT考试如何能够作为标准化测试的领导者并经受住时间的考验，此外，他还分享了他对未来使用人工智能技术的见解。一起来看看吧。

GMAT考试中主要使用了哪些人工智能技术？

Chris Han：GMAT考试通过几种不同的方式使用人工智能。首先，它采用自动化的考试项目校准流程来准确分析考试项目（例如：试题）的特点。它还使用计算机自适应测试（CAT）算法来最大限度地提高测试效率，使考试分数能在有限的考试时间内最精准可靠地评估并反映考生的能力。此外，自然语言处理（NLP）也被纳入机器评分算法，用于对分析性写作（AWA）部分的论文进行评分。

一些人认为标准化考试助长了学校招生中对本就名额不足的少数族裔的歧视。在您的观念和实践中，人工智能如何帮助消除这方面的偏见并挑选出那些特别适合商学院的人才？

Chris Han： 专门研究测试数据的数据科学领域被称为心理测量学。我和GMAC这些世界级的心理测量师们一起设计和开发测量工具，以衡量那些在不断变化的商业世界中取得成功所需的新技能。GMAC的心理测量师应用各种数据科学技术来完善考试的测试结构，以消除不同族裔之间的测量偏差。同时，GMAC一直致力于确保全球GMAT考生参加GMAT考试的质量和公正，例如在应用于实际考试之前，我们对每个可能在考试中出现的潜在问题都进行严格的七步开发和审查程序。

作为教育考试行业的领导者，GMAC也不断地为这一领域带来各种创新和前沿技术。例如，最新一代GMAT和Executive Assessment（GMAC旗下的另一项考试）是基于两种不同的美国专利技术进行设计和操作的，以此最大限度地提高自适应测试算法的测量效率并优化项目使用率。此外，近期我们还开发了一种突破性的差异试题功能（DIF）检测方法，该方法让我们更好地保证少数族裔参加GMAT考试的公平性。2021年夏天，我们已开始在测试产品中引入此项新技术。

有人会担心人工智能将取代标准化考试去评估学生的天赋，您对此有何看法？

Chris Han： 过去的几年里，许多学习类应用程序的AI开发都呈增长趋势。其中，大多数都专注于从过程数据中收集学生学习行为的相关信息。也已有一些成功的案例，通过让AI处理大数据对学生的学习成果进行有意义的解读和预测。这种基于人工智能的技术确实具有一定的潜力，可以通过近乎实时的“诊断”信息来优化、增强整个学习过程。

然而问题仍然存在：人工智能最终会取代大学录取所需的标准化考试吗？机器将（能够）决定谁将被高等教育录取或拒之门外吗？这些想法或将引发一场关于这个议题本质性的哲学辩论。除此之外，如果我们只关注技术本身，一些新兴的人工智能技术如神经网络（也称为深度学习）确实展示了其独特的优势。例如，深度学习人工智能不需要人类建立任何模型来连接数据点和人类的预测，机器就可以根据它们经历的训练做出自己的推理，甚至能包含一些人类无法理解的结构化和非结构化数据。因此，在一些专业应用程序中，基于深度学习的AI往往会有胜过人类专家的表现。

然而，当我们考虑将AI深度学习方法用于教育评估，甚至是招生决策时，就出现了三个关键问题。首先，个体大数据的可用性往往因人而异，一些拥有丰富IT设备的学生可能会通过笔记本电脑、平板电脑、智能手机、健身追踪器、室内摄像头将他们的生活轨迹转化成大量数据（这当然也存在隐私问题），但是其他没有这些IT设备和工具的学生就无法被AI正确识别，这将导致教育评估系统中出现一种新的公平性的问题。其次，基于深度学习的人工智能被使用于决策过程时，不会提供任何可供人类理解的内部决策过程或基本原理解释，从而导致我们得出的结论存在盲目性，这也会成为一个争议点。最后，机器只能根据它们从过去收集到的测试数据做出决定，而不知道如何应对它们没有经历过的情况。换句话说，机器总是在回顾性思考，而不是前瞻性思考。

认识到基于深度学习的AI的局限性之后，我相信AI并不能完全取代标准化测试。然而，我们确实看到了它的优势，并正在积极利用各种人工智能技术来完善GMAT考试的设计，以便它能够帮助激发人的才能，从而协助商学院招生做出明智而全面的决定。

GMAT™考试是如何使用人工智能的？

相关推荐

备战26fall——为什么一定要尽早报名GMAT考试？

接受新版GMAT成绩的10所欧洲顶尖商学院

GMAC团队关于考试安全的问答