大数据在教育领域的运用主要通过教育数据挖掘和学习分析两种路径与方式。美国STEM教育监测指标体系通过立足于大规模数据调查和统计、构建指标的数据层次类别模型、建立健全指标的数据收集机制等方式,实现了对指标相关数据的收集、获得和分析处理,为成功将大数据应用于STEM教育监测指标体系的构建与完善奠定了基础。我国可借鉴其成功做法,基于大数据构建和完善教育监测指标体系;建立健全大数据应用于教育的相关技术平台和体制机制。请看菲尔麦德教育科技中心的分析文章。
近年来, 大数据 (BigData) 俨然成为了一种潮流和趋势, 英国学者维克托·迈尔—舍恩伯格 (ViktorMayer-Schonberger) 在《大数据时代》一书中预言:2013年是大数据时代的元年, 标志着信息技术进入了新的发展时代。
美国麦肯锡咨询公司 (Mckinsey) 的报告《大数据:创新、竞争和生产力的下一个前沿》认为, 大数据是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集, 具有数据量大、数据多样和数据产生速度快三大特征。
舍恩伯格则认为:“大数据是人们在大规模数据的基础上可以做到的事情, 而这些事情在小规模数据的基础上是无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构, 以及政府与公民关系的方法。”
维基百科对大数据的定义是:数据量规模巨大到无法通过目前主流的软件工具来获取、管理、处理、整理以帮助企业经营决策, 达成更积极目标的那些信息。
国际数据公司 (IDC) 认为, 大数据是符合4V特征的数据集, 即海量的数据规模 (Volume) 、快速的数据流转和动态的数据体系 (Velocity) 、多样的数据类型 (Variety) 、巨大的数据价值 (Value) 。
可见, 大数据更多地可以被认为是以数据为研究和实践对象, 从而带来的一种新的思维方式和路径、研究范式和方法、实践工具和手段。
目前, 大数据在计算机软件科学、商业、政务管理等领域的应用已经相对广泛且卓有成效, 然而, 大数据与教育有什么关系呢?大数据是如何应用于教育, 应用的方式和路径是怎样的呢?
美国最新的STEM教育监测指标体系或可在大数据在教育中的作用路径和方式上,提供一些有效经验, 供我国的教育教学改革鉴。
1
大数据在教育领域的应用方式和路径
美国最近一份关于如何运用大数据来促进教育发展的报告《通过教育数据挖掘和学习分析促进教与学》 (以下简称《报告》) 提出:目前教育领域中大数据的应用主要有教育数据挖掘和学习分析两大方向, 两个应用和研究方向虽然同源, 却在研究目的、研究对象和研究方法等方面截然不同。
教育数据挖掘是综合运用数学统计、机器学习和数据挖掘的技术与方法, 对教育大数据进行处理和分析, 通过数据建模, 发现学习者学习结果与学习内容、学习资源和教学行为等变量的相关关系, 来预测学习者未来的学习趋势。
《报告》通过对教育数据挖掘领域专家进行访谈, 列出了教育数据挖掘的四个研究目标:
通过整合学习者知识、动机、元认知和态度等详细信息进行学习者模型的构建, 预测学习者未来学习的发展趋势;
探索和改进包含最佳教学内容和教学顺序的领域模型;
研究各种学习软件所提供的教学支持的有效性;
通过构建包含学习者模型、领域模型和教育软件教学策略的数据计算模型, 促进学习者有效学习的发生。
学习分析是近年来大数据在教育领域较为典型的应用, 首届“学习分析技术与知识国际会议”, 将学习分析定义为“测量、收集、分析和报告有关学习者及其学习情景的数据集, 以理解和优化学习及其发生情景”。
《报告》认为, 学习分析是综合运用信息科学、社会学、计算机科学、心理学和学习科学的理论和方法, 通过对广义教育大数据的处理和分析, 利用已知模型和方法去解释影响学习者学习的重大问题, 评估学习者的学习行为, 并为学习者提供人为的适应性反馈。例如, 教师和学校根据学习分析的结果, 调整教学内容、对有学习失败风险的学生进行干预, 等等。学习分析一般包括数据采集、数据存储、数据分析、数据表示和应用服务五个环节。
2
美国 STEM 教育监测指标体系中的大数据应用
2.1
大规模数据调查和统计
美国STEM教育监测指标体系的研制开发是建立在诸如美国教育部国家教育统计中心 (National Center for Education Statistics, 简称NCES) 、学校和师资调查统计 (NCES Schools andStaffing Survey, 简称SASS) 、美国劳工部调查统计 (The Bureau of Labor Statistics, 简称BLS) 等全国范围内大规模调查统计的基础之上的, 立足于已经构建和划分好的指标维度和框架, 将每项指标具体化、量化、操作化, 通过分析这些调查统计得到的数据, 找到并追踪每一项指标的数据情况。
当然, 现有的一些数据调查和统计只能反映和得到监测指标的部分或者某些方面和层次的数据情况, 要想更加全面和深入地掌握和分析监测指标的数据情况, 还需要构建更多更大更全面的数据调查和统计平台, 或者通过修改和完善现有的一些数据调查来再次统计监测指标的具体数据。
2.2
指标的数据层次类别模型
该指标体系对所有STEM教育监测指标需要的数据进行了具体分析和分类。每一项指标的数据情况都从整体上分为两大类:一类是当前和潜在可利用的数据, 也就是当前可以从现有的数据库或者统计数据结果直接提出数据, 或者对之前所进行的一些调查和数据统计进行修改和完善, 使之可以为STEM教育监测所利用;另一类是当前没有的数据, 也没有相关的调查和统计, 需要重新建立调查统计系统并实施, 以收集这些指标所需数据。
具体而言, 所有的指标在数据情况上又分为四个类别。每一种数据类别都说明和体现了与之相应指标的数据现状, 以及需要进一步做哪些努力来收集更多更全面的数据、更充分地开发和完善这些指标, 因为有些指标相关的数据情况是属于多个数据类别的。
具体每一种类别的数据所表示的指标数据现状和涵义是:
第一个类别, 这个类别层面的数据在目前至少有一部分是可以从美国教育部以及其他大规模的调查结果中获得的, 需要进一步的发展来更加充分地开发这些指标。
第二个类别, 这个类别层面的数据能够通过修改和完善现有的教育部的调查和统计来收集, 需要概念性和经验性的工作来开发有效、可靠的调查项目。
第三个类别, 需要新的调查来收集合适的数据。
第四个类别, 需要概念和经验的发展来开始指标的阐释以及数据收集。
2.3
指标的数据收集机制
对于属于第一个类别层面的指标所需要的数据, 可以直接从美国教育部国家教育统计中心、学校和师资调查统计等全国范围内的大规模的调查统计的结果中获得。
对于属于第二个类别层面的指标所需要的数据, 可以通过修改和完善现有的各种层次类别和范围的调查和统计来进行数据收集。比如, 可以修改教育部国家教育统计中心所进行的调查中的一部分问卷或者访谈, 用来专门收集STEM教育监测与评估所需要的数据和信息。
对于属于第三个类别层面的指标所需要的数据, 则需要重新设计和进行专门针对STEM教育监测与评估指标数据收集的调查和统计。
对于属于第四个类别层面的指标所需要的数据, 则需要对STEM教育监测与评估指标和数据的概念进行阐释, 并将调查统计可操作化。
对于既属于第一类别又属于其他类别的指标, 现有的数据或许可以提供部分有用的信息, 但是修改现有的调查能够产生更多的与指标相关的信息。在这种情况下, 需要概念和实证研究来更充分开发调查项目或说明初始数据收集的指标。
对于跨所有四个类别的指标, 修改现有的调查可能在短期内是有用的, 但从长远来看, 为了充分开发所有指标, 其他类型的数据收集或许更合适, 可能需要更多的工作。
从第一到第四类别, 随着类别的提高, 与之相关的用来充分收集和开发指标监测与评估的相关数据所需要的资源也相应地增加。比如, 比起编译现有的数据, 重新建立一个系统的调查及其发展就更加耗费时间和精力。同样, 修改现有的调查中的问题就比重新建立一个完整的新的调查耗费更少的资源。
3
结论与启示
不管我们是积极认同大数据的作用和功效,还是质疑大数据的价值,不管我们是否愿意和已经做好准备, 大数据时代已经向我们走来。客观地分析大数据在教育领域中可能的作用路径和方式, 有利于我们更加清晰和客观地认知大数据, 并在大数据时代立足于教育研究和实践去思考和运用大数据。
通过对大数据应用于教育的方式和路径框架的分析——主要以数据挖掘和学习分析两个方面为主, 我们可以得知, 无论是数据挖掘还是学习分析, 大数据对于教育的作用和影响都是建立在数据收集获得和处理分析的基础之上的。
美国最新的STEM教育监测指标体系, 运用大数据的相关思路和方法, 基于大规模的数据调查和数据库, 构建了指标的数据层次类别模型, 分析了指标的数据收集机制, 对指标体系的各项指标的数据收集和获得, 以及数据的层次类别进行了全面系统的分析和构建, 对于我国教育改革发展中充分利用大数据这种新的思维方式和路径、研究范式和方法、实践工具和手段具有很大的借鉴意义。
3.1
立足于教育学立场
将大数据视为一种新的思维方式和路径
教育学以及教育研究和实践活动注定拥有充满价值性、复杂性、创造性和不确定性等特征。在教育研究和实践活动中, 数据科学或者说大数据虽然可以通过数据告诉人们教育中的某些现象和问题是什么, 教育的现状和状态怎么样, 但是无法解释“为什么会这样”等价值性问题, 也没办法依据教育学以及教育实践的特点和发展规律, 提出“怎么办”等对策和建议。此外, 教育研究和实践有其自身的特点, 并非所有的教育研究和实践中的问题都能通过数据来解决。
因此, 我们应该立足于教育学立场, 将大数据视为一种新的思维方式和路径、研究范式和方法、实践工具和手段, 促进教育的研究实践和改革发展。
3.2
大数据在教育中的应用应该科学、合理和客观
大数据在教育中的应用带来了新的机遇和研究范式, 甚至有人将大数据作为科学研究的“第四种范式”, 但是, 对于大数据在教育中的应用, 我们要持理性和谨慎的态度。大数据是教育或社会科学研究所面临的一个新的境遇和背景, 但它同时还面临大数据的低密度价值、研究伦理问题、个人隐私和数据安全等挑战和不足, 在看到大数据巨大价值的同时我们还应该看到其缺点和局限。
所以, 在教育研究和实践中要科学、合理和客观地应用大数据。一方面, 要分析大数据在教育中的应用路径和方式框架及其具体体现和要求。教育等社会科学研究与自然科学以及计算机工程等领域的科学研究各有特点, 各不相同, 所以, 我们应该有区分地、理性科学地进行分析, 并根据不同的情景和需求运用不同的方式框架。另一方面, 还要结合大数据应用与教育的路径构建相关的保障性体制和机制。美国STEM教育监测指标体系就比较合理地考虑了各监测指标的实际情况和特点, 很好地对各指标的数据情况进行了具体分类, 并建立了相应的收集机制, 这些环节都值得我们进一步学习和借鉴。
3.3
教育监测指标体系的构建和完善要基于大数据
教育政策的顺利实施, 有赖于一个完善的数据收集管理系统, 以达到通过有规律地提供关于政策或项目执行情况的信息反馈来监测政策或项目过程的目的。因此, 数据对于教育政策的监测和评估至关重要。
《国家中长期教育改革和发展规划纲要 (2010-2020年) 》指出:“要构建国家教育管理信息系统, 推进政府教育管理信息化, 积累基础资料, 掌握总体状况, 加强动态监测, 提高管理效率, 为宏观决策提供科学依据。”
可见, 当前我国对于教育数据和信息建设工作非常重视。“对每一个监测指标而言, 都需要有清楚的、确定的数据来源。通常来说, 数据信息采集是官方统计机构数据库、政策执行部门日常管理数据库以及实地调查数据库的有机结合。”
因此, 通过充分借鉴美国STEM教育监测指标体系的大数据应用路径和方式, 我国应该加强教育监测与督导评估中的数据信息建设和分析, 加紧建设国家教育大数据信息中心或者数据库, 对我国当前各级各类教育数据和信息进行分门别类, 完善各级教育监测指标体系相关数据的收集、分析、处理, 构建我国的教育大数据收集机制。
3.4
建立健全大数据应用于教育的相关技术平台和体制机制
尽管近几年来人们对大数据的作用和应用很热衷, 也很重视, 但是, 由于大数据的应用特别是在教育中的应用历史比较短暂, 所以, 大数据应用与教育相关的各项体制和机制不是很健全, 对教育中大数据相关研究的支持力度和资源配置也有待加强。
首先, 相关技术和平台建设方面。与美国等发达国家大数据相关技术成熟和数据调查统计平台的完善相比, 我国当前的教育数据信息系统和平台构建还不是很完善, 各类大型的教育数据调查和统计较少。“
大数据相关的技术资源也比较薄弱, 区域间技术资源分布不均, 很多地方教育机构缺乏必要的大数据应用的基础设施建设。例如, 某些学校没有学生、信息系统、在线教育平台, 也就无法为教育数据挖掘和学习分析提供基础数据。”
因此, 一方面, 我们要利用诸如云计算和虚拟化等先进的信息技术, 实现与大数据应用相关的技术资源获得和提升;另一方面, 要实施各类大型教育数据调查和统计, 构建比较全面和系统的教育数据库, 为大数据在教育中的应用奠定技术和平台基础。
其次, 管理体制和法律制度方面。为了管理和规范大数据在教育中的相关应用和实施, 国家和地方各个层面应该制定大数据教育应用的远景规划, 还要尽快出台实施细则, 以指导各级各类教育机构推进大数据教育应用。“另外, 在进行大数据教育应用规划时, 应该充分考虑到所需采集数据涉及的个人隐私问题, 以及由大数据应用造成学生活动透明化所带来的伦理道德问题, 制定和完善相应的法律法规及具体制度。”
最后, 相关资源和政策支持方面。在教育研究相关项目立项规划和资源配置方面, 应该考虑专门设立大数据在教育中应用的相关项目和课题。比如, 有学者建议:“启动中国大数据科学与工程研究计划, 从宏观上对我国的大数据产学研用做出系统全面的短期与长期规划。此外, 国家在大数据平台的构建、典型行业的应用以及研发人才的培养等方面应提供相应的财力、物力与人力支持。”同时, 对教育实践和学校教育教学一线中应用大数据推进教育改革的各种实践探索, 国家应该给予政策鼓励和支持。
领取专属 10元无门槛券
私享最新 技术干货