摘要
学科评价是高等教育评价的重要内容,是高校学科建设的重要组成部分。在智能化时代,利用人工智能、大数据技术对学科数据进行深度挖掘和科学分析,可以将学科评价从基于小样本或不完整信息的评价转化为基于整体信息的多元化科学化评价。本文通过应用聚类、神经网络分析、关联规则分析等数据挖掘方法对学科数据进行建模分析的思考,对智能化时代高校学科评价进行探索。
关键词:智能化;数据挖掘;人工智能;大数据;学科评价
年,中共中央、国务院印发了《深化新时代教育评价改革总体方案》(以下简称《总体方案》),文件明确了教育评价的目标要求和重点任务,同时指出要加强专业化建设,提到了创新评价工具,利用人工智能、大数据等现代信息技术。
在智能化时代,随着高新技术的快速发展,新一代信息技术在教育评价领域的应用蓬勃兴起,人工智能、大数据技术等推动着教育评价思维方式和评价模式的不断改革和创新,从传统的数据采集、档案建立、专家评分到数据挖掘和学习分析等教育评价方法和手段的转变。智能化时代,合理应用人工智能、大数据技术的方法,科学化学科评价的评价分析工具,构建多维评估模型、增值评估模型、分类评估模型、关联规则模型等,可将学科评价从基于小样本或不完整信息的评价转化为基于整体信息的多元化科学化评价。客观的、科学的、有效的学科评价有利于学校更好地认清学科发展状况,规划学科发展方向,从而提高学科建设整体水平。
一
智能化时代教育评估的相关工作
智能化时代教育的研究可以追溯到年,Robertson发表了《教育中的人工智能》,从理论上探讨了人工智能在人际交往和教育教学中的应用。[1]互联网技术、大数据技术、人工智能的发展。进一步推动了智能化教育的快速发展。年乌镇智库、网易科技、网易智能联合发布了《乌镇指数:全球人工智能发展报告》,指出智能大教育主要体现在智能评测、个性化辅导、儿童陪伴等。[2]年联合国教科文组织在北京召开了以“规划人工智能时代的教育:引领与跨越”为主题的人工智能与教育大会。会议围绕*策制定、教育管理、教学与教师、学习与评价、价值观与能力培养、研究与监测等议题规划人工智能时代的教育。[3]智能化时代,对教育变化形式和特点的研究分析越来越多,但教育评价理论体系尚未形成。目前的研究主要集中在两方面。一是对智能化时代教育评价的宏观思考,如人工智能驱动教育评估的智能化运行,促进教育评估的现代化、专业化。[4]二是对智能化时代教学技术评价的探索,如基于智能技术的自动评价方法探究。[5]但是以上的研究都未涉及高等教育中学科评价的范畴。
本文主要介绍大数据技术、人工智能技术在高等教育学科评价中的应用,构建数据模型,将评价方法与智能化时代新技术深度融合,进行持续发展的智慧评价。
二
学科评价的智能化分析
学科评价要贯彻落实国家关于教育评价的最新改革要求。《总体方案》中提出要“推进高校分类评价,引导不同类型高校科学定位,办出特色和水平”。学科评估在坚持多元评价的同时,可有意识地引导高校的合理定位。目前常用的学科评价指标体系往往将学科按照学科门类划分后进行评价。若引入高校的特色和定位,避免一把尺子量到底,将更有利于学科的发展,为国家社会提供更优质的服务。若从学科门类和高校分类两个维度进行分类,将导致大量类别的产生,不适合目前的学科评价。考虑当前学科评价的实际情况,可采用聚类方法,对不同门类的学科进行预处理。根据高校的特色和水平,将相似的记录聚类到相似的簇中,差异较大的记录被划分到不同的簇中。得到簇以后,将簇作为进一步输入,采用神经网络方法产生连续输出,对学科进行深入评价和预测发展。评价的结果可以使高校和学科更清晰地了解自身定位,找准发展方向。
在学科建设中,一个学科的发展需要一个地区多个学科的协同支持。应发挥地区的资源集聚优势,形成更大的建设合力。在对学科进行科学评价的同时,可有引导性地探索跨学科、跨领域、可进行协同创新的学科。可采用关联规则方法挖掘隐藏于特定数据集中的关联信息。在学科评价过程中,各个学科的评价属性数量相当大,需预防多重共线性,即评价属性间的相互关联,过于强调某些特定属性会导致评价结果不客观。可利用主成分分析法减少变量的个数,确保主成分变量的相互独立性。
01
学科评价的聚类方法
聚类方法将数据对象分成多个簇,在同一个簇中的对象之间具有较高的相似性,而不同簇中的对象差别较大。[6]常用的聚类方法有划分方法、层次方法、基于密度的方法、基于网格的方法、基于模型的方法等。
学科评价过程中,将学科的属性数据进行预处理,表示成向量的形式。例如[X1...Xf...Xp]用表示一个含有p个评价属性的学科。这些属性可以是师资队伍质量、师资数量、课程教学质量、学生国际交流、学位论文质量、学术论文质量、出版专著教材、科研获奖、科研项目等,这些属性都是用数量来表征的。那么n个学科就可用下列矩阵表达。
使用相异度矩阵(dissimilaritymatrix)D来描述不同学科两两间的近似性,其中d(i,j)是学科i和学科j之间相异度的量化表示。当学科i和学科j之间越相似,其值越接近于0,反之,两门学科间相异度值越大。D是主对线上为0的对称矩阵。
不同的计量单位会产生不同的聚类结构,直接影响聚类分析的结果。因此,为了避免对度量单位选择的依赖,可先将学科数据标准化。[7]
以划分方法中最常用的K-均值法生成学科聚类的簇为例,应用SASEnterpriseMiner中的K-均值法进行分析。流程描述如表1所示。同一个学科簇中的学科在门类、所属高校特色和定位等方面是相似的,不同簇中的学科在各方面是相异的。
由于K-均值法需指定结果簇的数目K,可应用无需指定簇数目的BIRCH法,通过构造聚类特征树(CF树)进行层次聚类。
在学科聚类后,可邀请专家对生成的簇进行判断,是否与实际情况基本相符。
02
学科评价的神经网络方法
采用聚类方法得到学科簇以后,再采用神经网络方法,可将学科簇作为输入,对学科进行进一步评价,并预测发展。神经网络是一组连接的输入/输出单元,其中每个连接都与一个权值连接而成。[8]在学习阶段,可自动调整神经网络中权值等各种参数,使其能预测输入学科所属的类别,例如顶尖学科、优势学科、特色学科、普通学科、潜力学科等。
首先,确定神经网络的拓扑结构,根据学科评价属性的个数确定输入层的单元数、隐藏层数,每一隐藏层的单元数以及输出单元数。学科的评价类别数可作为输出单元数。隐藏层数、隐藏层每层单元数需要事先确定,而权值等通过训练自动产生。以前馈网络的后向传播方法为例,对学科进行评价,如图1所示。每个前馈网络的单元有一个偏置,用于改变单元的活性。隐藏层和输出层的每个单元取净输入,将一个激励函数作用于它,表示神经元活性。神经网络学科评价方法的流程描述如表2所示。
用训练好的神经网络对学科簇进行评价时,在输入学科的各评价属性后,神经网络可识别学科的类别,分辨出属于哪类学科等。
03
学科评价的关联规则方法
当前学科技术发展日新月异,学科间相互渗透、相互融合。学科建设中,一个学科的发展需要多个学科的协同支持。对学科进行科学评价的同时,也可有引导性地探索跨学科、跨领域可进行协同创新的学科。
在学科申报文本、学科论文、专利文献中存储着海量信息。对这些文本特征进行有效选择,选取最具代表性的特征项进行描述后,使用关联规则Apriori方法挖掘特征项间的频繁模式,发现隐藏的各高校学科间的潜在的相互联系和关联规则。
进行关联规则挖掘。首先,将非结构化的文本进行预处理,抽取高校学科的重要特征词,过滤冗余值。然后,选择文本中最具代表性的特征值,表示为XML形式,将文本转化为适合处理的中间结果。接着,利用频繁项集向下具有封闭性的原理,应用Apriori方法通过连接、剪枝从频繁1-项学科集递归发现频繁k-项学科集。最后,根据频繁学科集导出各高校学科间的相关性。Apriori学科评价方法的流程描述如表3所示。
频繁学科集中的各门学科之间具有相互联系,可互相扶持、相互融合,逐渐形成一批学科群落。其中有参天大树、中流砥柱的主干学科,亦有灌木丛林的辅助学科,能维持良好的学科发展生态。随着新技术、新思想的融合,学科群落中会产生更多新的研究方法和研究热点。有助于我们了解当前科学发展的趋势,便于开展研究,迅速占领新科技领域的前沿阵地。
04
学科评价的主成分分析方法
上述聚类方法、神经网络方法、关联规则方法都涉及学科以及其评价属性。智能化学科评价过程中可能涉及数万条学科记录以及数千个评价属性,数量巨大。我们注意到并非所有的属性都相互独立,需预防多重共线性,即评价属性间的相互关联。这些属性被重复计算,无意中被过于强调,从而导致评价结果不客观。利用主成分分析法减少变量的个数,可确保主成分变量的相互独立性。主成分分析法将多个变量通过线形组合,选出小部分重要变量集合来描述相关结构。[9]首先,对学科评价属性值进行标准化处理,然后,构建学科评价属性的相关系数矩阵,接着,计算相关系数矩阵的特征根和特征向量,随后,使用置信度法等,确定学科评价属性的主成分数量,最后,合成主成分。由于在计算过程中,主成分属性与原始属性的相互联系是一一对应的,因此,最后可以利用训练集进行验证分析。主成分分析法和聚类方法、神经网络方法、关联规则方法相结合后,以最小的信息丢失为前提,利用降维思想消除评价指标之间相关的影响,使学科评价结果更加合理。同时,降维作用很大程度上降低了学科评价工作的复杂度。
三
结论与展望
在智能化时代,教育评价秉承海量计算、精准分析的原则,广泛采集评价对象的全样本数据,深度挖掘数据之间纵横交错的复杂关系。基于人工智能、大数据技术,如聚类方法、神经网络方法、关联规则方法等,极大地提高学科评价的信度,真正做到智能评价、智慧预测。学科评价中应用的新技术、新方法有助于科学地揭示高校学科当前的情况和将来的发展趋势,为高校制定新一轮的学科发展战略提供基本依据,从而提高学科建设整体水平。在未来工作中,希望智能技术能融入学科评估的各方面。在数据采集阶段,能全时空全方位采集学科数据;在信息处理阶段,能快速实时集成数据;在评价分析阶段,能采用更多更先进的智能预测技术;在评价结论反馈阶段,能利用可视化技术,个性化精准化输出各高校学科的发展情况和趋势。正如《总体方案》中所提到的,“提高教育治理能力和水平,加快推进教育现代化”,在智能化时代,希望学科评价能在新技术驱动下不断走向现代化和专业化。
参考文献(向上滑动阅览)
[1]RobertsonM.ArtificialIntelligenceinEducation[J].Nature,,():-.[2]乌镇智库,网易科技,网易智能.乌镇指数:全球人工智能发展报告()[EB/OL].(-10-10).