首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >开学选课难?清华联合伯克利用算法帮你荐课,还能提高拿A几率

开学选课难?清华联合伯克利用算法帮你荐课,还能提高拿A几率

作者头像
大数据文摘
发布2020-09-10 15:25:56
发布2020-09-10 15:25:56
9281
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘出品

编译:牛婉杨

又到了开学季,你也会为选课而头疼吗?

别担心,现在有AI来帮你定制适合你的课程啦!清华大学和加州大学伯克利分校的研究者们发表了一篇研究,他们开发了一种循环神经网络(Recurrent Neural Networks) 来帮你推荐课程,而且效果不错哟~

不仅课程通过率高,还能让生物学课程拿A的几率达到75%。

研究人员想要探索在给定足够的约束条件下,机器学习模型是否可以提取出合理的选课建议。他们选择了三种预测验证的方法(成绩预测、先决条件预测和课程选择预测),并用循环神经网络作为这个推荐系统的框架,因为RNN具有强大的表征和时序建模能力。

他们是怎么做到的,来和文摘菌一起看看吧~

建立三个模型帮助课程推荐

研究人员假设课程推荐应该仅限于学生们预期能够顺利通过的课程。这就需要训练一个课程成绩的预测模型,类似于应用于辅导系统的深度知识追踪神经框架。另一个假设是,这样的课程表现模型能够推断出可用于随后推荐课程的先决信息,从而为目标课程做适当的准备。

为了验证这一假设,研究人员使用大学现有的先决课程列表,并测试成绩预测模型推断这些现有依赖关系的能力。最后,他们假设,在目标课程中取得优异成绩的学生应该比成绩不理想的学生更遵循该模型生成的推荐。而这个假设还要在满足第三个验证的情况下才成立:在下学期开设一门历史上难度较大的课程之前,需要先预测前一学期的课程注册人数。

而且,该系统还很人性化,避免把比较难的课程推荐给成绩一般的学生。此外,研究人员根据课程编号所示的三个划分级别(即低年级、高年级和研究生),将推荐结果限制在不高于目标课程级别的课程。

研究人员建立了三个模型。

典型RNN将向量序列x1...xT作为输入,映射到矢量y1...yT的预测输出序列。这是通过计算一系列“隐藏”状态h1...hT来实现的。

模型1:简单的课程成绩预测模型

这可以被看作是对过去观测中相关信息的连续编码,对未来的预测是有用的。

研究人员使用一种流行的神经网络变体,叫做长短期记忆(LSTM),它通过增加几个可以保留和遗忘选择信息的门来帮助神经网络学习时间依赖性。

直观地说,一个简单的LSTM可以应用于成绩预测,其中每个学期的输出是一个向量,表示在下一个学期中每个课程获得某个成绩的概率,如模型1所示。

然而,最近的研究结果表明,不仅学生前几个学期的成绩会影响他们本学期的成绩,而且本学期的课程注册情况也会影响他们的成绩。模型2可以改善这一点。

模型2:将前一学期的课程成绩和本学期课程注册情况相结合作为隐含层的输入

研究人员提出了简单的LSTM变体,它将本学期共同注册的多个热门课程t+1(不包括分数)结合到前一个学期的课程分数作为输入,旨在预测t + 1学期的分数。如模型2所示。

模型3:将上学期的课程成绩、报考的专业,以及本学期课程注册情况相结合作为输出层的直接输入

此外,研究人员假设学生的专业可能会影响课程的预期成绩分布。例如,可以期望学生在他们专业以外的课程上取得更高或更低的成绩。因此,他们又提出了LSTM的另一种变体,它在学期中中将专业和年级连接起来。研究人员将共同注册的多个热门课程输入到与隐藏层连接的线性层中。这意味着t+1学期的课程共同注册信息只会影响该学期,不会影响接下来时间片中的所有隐藏状态和输出。如模型3所示。

480万人次的课程注册信息帮助预测学生成绩

接下来,一起看看研究人员是如何训练上述提出的3种预测课程成绩的模型的吧。

该研究使用了从加州大学伯克利分校收集到的数据集,其中包含了2008年秋季至2017年春季的匿名处理后的学生课程注册人数。数据集包含 164,196 名学生(包括本科生和研究生)每学期、总计480万人次的课程注册信息。研究人员根据数据集的顺序,将数据集按时间分为三部分进行评估,即2008年秋季至2015年秋季的数据为训练集,2016年春季的数据为验证集,2017年春季的数据为测试集。

课程注册意味着该学生在学期结束时仍在处于该课程的在读状态。学生们在活跃学期的课程负荷中位数为 4。数据集中共包含 10,430 门特色课程,其中 9,714 门特色初级讲座课程,这些课程来自124个系的197门学科,分布于6所学院的17个不同的学部。在本文的所有分析中,研究人员只考虑了初级课程(讲座)和在10年内至少有20人注册的课程。

表1:数据集中学生注册信息示例

表2:学生课程成绩预测的评价。“letter grade”一栏表示字母等级类型的“高于或等于等级门槛”的分类精度,“pass”一栏表示通过/不通过等级类型的通过等级的分类精度。

表3:来自先决条件对集的数据样本

表4:预修课程评价预测

图 7:基于目标的推荐系统的模型评价结果(成绩阈值:A)

图 8:基于目标的推荐系统的模型评价结果(成绩阈值:B)

在两种阈值模型的情况下,本学期招生情况信息都是有用的(模型2与模型1)。与无阈值模型(模型2)相比,主阈值模型(模型3)在等级为A或B的阈值模型中都没有用。原因可能在于学生专业之间的差异可能已经嵌入到他们不同的入学模式中,这意味着专业信息不能进一步增强该模型在成绩预测中的辨别能力。

虽然B阈值模型在准确性方面表现更好,但它们也更接近多数类基线的表现(88.05对85.46)。如果这种与基线性能的紧密接近阻止了模型在其课程嵌入中包含有效的先决关系,那么将在下一节中对其进行测试。在F-score(60.24对42.01)和基线增益方面,等级为A的目标阈值模型比B表现更好。在A模型中,主要信息能够提高对及格分数的预测,而在B模型中,考虑到大多数班级,专业可能导致了过度拟合。

未来可能会在RNN模型中加入对于职业规划等长远目标的评估

研究人员介绍了一种基于递归神经网络自适应的个性化课程预设推理的新方法,并针对代表成绩预测、先决条件推理和准备学期课程选择任务的测试集验证了几个模型变量。

由于这是一个因果推理问题,而且研究人员只能通过观测数据来训练模型,所以他们使用这三个来源来验证一个根据预测成绩训练的模型,以帮助评估模型在现实世界中的表现是否合理。在等级预测任务中,目标阈值模型的得分略高于基线,在二分类任务中达到了88%的高准确率,而阈值为A的模型的准确率得分较低,为75%,但大大超过了表现较差的准确率为 50% 的多数类别的对比基线。

观察数据的固有局限性存在于所有希望推断因果关系的应用中。推荐选课这个项目的成本是十分高昂的,因为需要两个学期的积累才能向学生提出选课建议,或者作为一种建议工具,然后观察学生在目标课程上的表现。此外,研究人员还表示,未来可能会在RNN模型中加入对于职业规划等长远目标的评估,并考虑其他可能的数据来帮助学生进行选课决策。

最后,文摘菌给出论文链接,更多论证详情可以参见论文~

论文链接:

https://arxiv.org/pdf/1812.10078.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-09-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 建立三个模型帮助课程推荐
  • 480万人次的课程注册信息帮助预测学生成绩
  • 未来可能会在RNN模型中加入对于职业规划等长远目标的评估
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档