氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

ChatGPT 进课堂将重塑教育 精选

已有 4228 次阅读 2023-11-16 08:27 |系统分类:海外观察

上个月,教育心理学家罗纳德·贝盖托(Ronald Beghetto)邀请了一群研究生和教学专业人士以一种不同寻常的方式讨论他们的工作。除了相互交谈外,他们还与Beghetto设计的一系列以创造力为重点的聊天机器人进行了交谈,这些聊天机器人将很快托管在他的研究所亚利桑那州立大学(ASU)运营的平台上。

A teacher writes on a chalkboard during a lecture with students

这些机器人基于相同的人工智能 AI) 技术,该技术为著名且对话流畅的 ChatGPT 提供动力Beghetto 促使机器人扮演各种角色来鼓励创造力——例如,故意挑战某人的假设。一名学生与聊天机器人讨论了各种论文主题。讲师们谈到了如何设计课程。这些机器人帮助参与者产生了比他们想象的更多的可能性。

许多教育工作者担心,ChatGPT的兴起将使学生更容易在作业中作弊。然而,位于坦佩的 Beghetto 和其他人正在探索大型语言模型 (LLM) 的潜力,例如 ChatGPT,作为增强教育的工具。

使用LLM来阅读和总结大段文本可以节省学生和教师的时间,并帮助他们专注于讨论和学习。ChatGPT 能够清晰地讨论几乎任何主题,这增加了使用 LLM 创建个性化、对话式教育体验的前景。一些教育工作者将他们视为潜在的思想伙伴其成本可能低于人类导师,而且与人不同,他们总是随叫随到。

一对一辅导是最有效的教学干预措施,但它非常昂贵且不可扩展,伊利诺伊州香槟市科技公司Wolfram Research的联合创始人Theodore Gray说。人们尝试过软件,但通常效果不佳。现在,人们确实有可能制作出有效的教育软件。Gray 告诉 NatureWolfram Research 目前正在研究一位基于 LLM 的导师,但没有提供任何细节。

这些人工智能合作伙伴可以用来引导学生一步一步地解决问题,激发批判性思维,或者像Beghetto的实验一样,增强用户的创造力,扩大正在考虑的可能性。田纳西州纳什维尔范德比尔特大学学习和生成式人工智能未来倡议主任朱尔斯·怀特(Jules White)称ChatGPT心灵的外骨骼

风险是真实存在的

自加州公司 OpenAI 2022 11 月推出 ChatGPT 以来,关于其在教育中的应用的大部分关注都是负面的LLM 的工作原理是从包含数十亿个示例的训练数据中学习单词和短语之间的相互关系。然后,根据用户提示,他们生成句子,包括作业问题的答案,甚至整篇文章。

与以前的人工智能系统不同,ChatGPT 的答案通常写得很好,而且似乎经过了充分的研究。这引发了人们的担忧,即学生将能够简单地 ChatGPT 为他们做功课,或者至少他们可能会依赖聊天机器人来快速获得答案,而不了解其基本原理。

ChatGPT 也可能让学生误入歧途。尽管在许多商业、法律和学术考试中表现出色,该机器人是出了名的脆弱,如果一个问题的措辞略有不同,就会出错,甚至会编造问题,这个问题被称为幻觉。

加州大学洛杉矶分校的计算机科学家王炜(Wei Wang)发现,GPT-3.5GPT-4在测试物理、化学、计算机科学和数学问题时犯了很多错误Wang和同事们尝试了不同的方法来查询这两个GPT机器人。他们发现,最好的方法使用了 GPT-4,并且它的机器人可以以这种方式正确回答大约三分之一的教科书问题,尽管它在一次考试中得分为 80%

隐私是另一个障碍:一旦学生意识到他们输入的所有内容都由 OpenAI 存储并可能用于训练模型,他们可能会被推迟定期使用 LLM

教育应该拥抱 LLM

尽管面临挑战,一些研究人员、教育工作者和公司还是看到了 ChatGPT 及其底层 LLM 技术的巨大潜力。 Beghetto Wolfram Research 一样,他们现在正在试验如何在教育中最好地使用 LLM。一些人使用 ChatGPT 的替代品,一些人想方设法最大限度地减少不准确和幻觉,一些人提高了 LLM 的特定学科知识。

有积极的用途吗?罗利北卡罗来纳州立大学专门研究教育系统的计算机科学家科林·林奇(Collin Lynch)问道。当然可以。有风险吗?存在巨大的风险和担忧。但我认为有一些方法可以缓解这些影响。

社会需要帮助学生了解LLM的优势和风险,而不仅仅是禁止他们使用这项技术,联合国教科文组织(UNESCO)在巴黎的学习和创新未来主任Sobhi Tawil说。9月,联合国教科文组织发布了一份题为《生成式人工智能在教育和研究中的指导意见》的报告。它的主要建议之一是教育机构在使用 ChatGPT 等工具支持学习之前对其进行验证

公司正在营销商业助理,例如 MagicSchool Eduaide,它们基于 OpenAI LLM 技术,帮助学校教师计划课程活动和评估学生的作业。学术界还开发了其他工具,例如 PyrEval4,由宾夕法尼亚州立大学州立大学的计算机科学家Rebecca Passonneau的团队创建,用于阅读论文并提取关键思想

在威斯康星大学麦迪逊分校的教育心理学家Sadhana Puntambekar的帮助下,PyrEval对物理论文进行了评分在过去三年中,每年约有 2,000 名中学生在科学课上撰写。Puntambekar 说,这些论文没有给出常规成绩,但 PyrEval 使教师能够快速检查作业是否包含关键主题,并在课堂上提供反馈,否则这是不可能的。

她说,PyrEval的分数还可以帮助学生反思他们的工作:如果人工智能没有检测到学生认为他们包含的主题,这可能表明这个想法需要更清楚地解释,或者他们犯了一些小的概念或语法错误。该团队现在要求 ChatGPT 和其他 LLM 执行相同的任务,并正在比较结果。

介绍AI导师

其他组织使用人工智能直接帮助学生。这可能是除 ChatGPT 本身之外使用最广泛的基于 LLM 的教育工具的方法人工智能导师和助教 Khanmigo。该工具是 OpenAI 与位于加利福尼亚州山景城的教育非营利组织 Khan Academy 合作的结果。使用 GPT-4Khanmigo 在学生练习时为他们提供提示,从而节省教师的时间。

Khanmigo 的工作方式与 ChatGPT 不同。它以弹出式聊天机器人的形式出现在学生的计算机屏幕上。学生可以讨论他们正在解决的问题。该工具在将学生的查询发送到 GPT-4 之前会自动添加提示,指示机器人不要给出答案,而是提出很多问题。

该学院的首席学习官克里斯汀·迪塞尔博(Kristen DiCerbo)称这一过程为富有成效的斗争。但她承认,Khanmigo仍处于试点阶段,在帮助学习的问题和让学生放弃的困难问题之间有一条微妙的界限。诀窍是弄清楚那条线在哪里,她说。

根据Khan Academy的数据,Khanmigo3月首次推出,本学年有超过28,000名美国中学生和教师正在试用AI助手。用户包括私人订阅者以及 30 多个学区。个人每年支付 99 美元来支付 LLM 的计算费用,学区每年为每位学生支付 60 美元。为了保护学生的隐私,OpenAI 已同意不将 Khanmigo 数据用于培训。

Khanmigo是否能真正彻底改变教育,目前还不清楚。LLM 被训练为只包含句子中下一个最有可能的单词,而不是检查事实。因此,他们有时会犯错DiCerbo 说,为了提高准确性,Khanmigo 发送给 GPT-4 的提示现在包括正确的指导答案。然而,它仍然会犯错误,可汗学院要求用户在犯错时让组织知道。

林奇说,坎米戈似乎做得很好。但他警告说:我还没有看到明确的验证。

更一般地说,林奇强调,至关重要的是,任何用于教育的聊天机器人都必须仔细检查其语气和准确性,并且它不会侮辱或贬低学生,也不会让他们感到迷茫。情感是学习的关键。你可以通过以不好的方式帮助他们来合法地破坏某人的学习兴趣,林奇说。

DiCerbo指出,Khanmigo在每种情况下对每个学生的反应都不同,她希望这使机器人比以前的辅导系统更具吸引力。可汗学院预计将在2024年底或2025年初分享其对Khanmigo疗效的研究。

其他辅导公司正在提供 LLM 作为学生的助手或正在试验它们。位于加利福尼亚州圣克拉拉的教育技术公司Chegg4月份推出了一款基于GPT-4的助手。总部位于北京的中国辅导公司联业教育集团(TAL Education Group)创建了一个名为MathGPTLLM,声称在回答数学特定问题方面比GPT-4更准确。MathGPT 还旨在通过解释如何解决问题来帮助学生。

检索增强

创建人工智能学习伙伴的另一种方法是将LLM与经过严格验证的外部重点知识语料库(例如教科书或一组科学论文)相结合。这种检索增强生成 RAG) 方法的目标是避免验证赋予 LLM 对话能力的数十亿个文本源的不可能性。

纽约市的人工智能公司Merlyn Mind正在其开源语料库QA LLM中使用RAG,该语言旨在教育。与 ChatGPT 一样,Merlyn Mind LLM 最初是在大量与教育无关的文本上训练的——这赋予了它对话能力。

但与 ChatGPT 不同的是,当 LLM 回答查询时,它不仅仅依赖于它在训练中学到的知识。相反,它还指的是一个特定的信息语料库,可以最大限度地减少幻觉和其他错误,该公司首席执行官Satya Nitta说。Merlyn Mind 还对其 LLM 进行了微调,以便在他们没有高质量的反应时坦白,并努力产生更好的答案,从而在许多情况下抵抗幻觉,Nitta 说。

亚利桑那州立大学(ASU)是LLM采用最先进的大学之一,RAG也被亚利桑那州立大学(ASU)使用,纽约市教育技术公司的投资者GSV Ventures的副总裁Claire Zau说。在最初的狭窄测试版本之后,亚利桑那州立大学于 10 月推出了一个工具箱,使其教职员工能够通过 Web 界面在教育中试验 LLM。这包括访问六个 LLM,包括 GPT-3.5GPT-4 Google Bard,以及 RAG 功能。

这些工具将允许更多的研究人员,如Beghetto,为他们的学生构建聊天机器人进行互动。在最初的研讨会之后,Beghetto计划在他正在开发的课程中使用这些机器人。亚利桑那州立大学在其私有云中托管LLM的安全版本,以最大限度地减少隐私问题,亚利桑那州立大学人工智能加速执行董事伊丽莎白·赖利(Elizabeth Reilley)说。

Reilley说,这些机器人已经对亚利桑那州立大学的教育产生了积极影响。例如,她说,为亚利桑那州立大学的化学入门课程创建的机器人使用 RAG GPT-3.5 PDF PowerPoint 课程材料相结合。她举了一个测试的例子,想象一个热爱棒球的学生要求LLM解释基于这项运动的分子中的偶极-偶极相互作用。她说,这个回答是一个准确的解释,它编织了一个棒球隐喻,让它更有意义一点

亚利桑那州立大学坦佩学习工程研究所执行主任丹妮尔·麦克纳马拉(Danielle McNamara)说,将通用LLMRAG相结合与以前的机器学习方法不同,后者试图训练人工智能系统来模拟科学专家。这些工具缺乏通用能力,例如将棒球纳入化学概念的能力,而这些能力可以帮助学生。McNamara和她的同事现在计划研究ASU使用的聊天机器人和LLM工具的有效性。

其他机构也在接受LLM,包括田纳西州纳什维尔的范德比尔特大学,该大学为某些课程的学生提供了付费版本的 ChatGPT,包括使用专门的插件工具。上海华东师范大学的研究人员创建了一个名为EduChat的专门教育LLM,将论文评估、基于对话的辅导和情感支持结合在一个聊天机器人中6.该团队已将该工具作为开源代码共享。尽管 EduChat 仍处于早期阶段,但它是一个专门的教育LLM,而不是对现有的通用模型(如 ChatGPT Bard)的改编。

它会流行起来吗?

围绕人工智能在教育中的应用,一个重要的问题是,谁将获得人工智能,以及Khanmigo等付费服务是否会加剧教育资源中现有的不平等现象。DiCerbo说,可汗学院现在正在寻找慈善家和赠款,以帮助支付计算能力,并为资源不足的学校提供访问,在试点阶段优先考虑这些学校。我们正在努力确保数字鸿沟不会发生,她说。

另一个挑战是如何确保LLM提供的信息没有偏见,并且模型考虑了来自代表性不足的群体的知识和观点。LLM训练的大部分文本中都缺少此类信息。亚利桑那州立大学负责研究技术的副校长肖恩·达德利(Sean Dudley)表示,RAG允许亚利桑那州立大学的LLM平台为用户提供答案的来源。这并不能消除偏见问题,但他希望这至少能为学生提供透明度,并有机会批判性地思考信息的来源。我们任务的一部分是询问谁被排除在外,达德利说。

LLM对教育的承诺最终是否会超过风险,目前尚不清楚。林奇承认它们是强大的工具,但也试图关注它们的缺点。这不像一夜之间我们学会了飞行,他说。

他将他们吸引的注意力比作以前对大规模在线开放课程和被称为元宇宙的 3D 虚拟世界的教育用途的关注。两者都没有一些人曾经预测的变革力量,但两者都有其用途。从某种意义上说,这将是一样的。还不错。这并不完美。这还不是全部。这是一个新事物,他说。

塔维尔在联合国教科文组织从事教育工作二十多年,他说,了解人工智能的局限性至关重要。与此同时,LLM现在与人类的努力紧密相连,他说必须重新思考如何教授和评估学习。它重新定义了是什么让我们成为人类,我们的智力有什么独特之处。

ChatGPT has entered the classroom: how LLMs could transform education (nature.com)



https://wap.sciencenet.cn/blog-41174-1409797.html

上一篇:病原菌在宿主体内建立铁储存系统
下一篇:氢气和氨气绿色能源使用不当也会破坏环境
收藏 IP: 117.135.13.*| 热度|

4 李升伟 郑永军 汪运山 许培扬

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 15:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部