全球最佳大学排行榜指标体系和计算方法简介
贺飞 北京大学
摘要:本文介绍了《美国新闻与世界报道》(U.S. News & World Report)2014年10月公布的全球最佳大学排行榜(Best Global Universities)基于学术研究和声誉的指标体系、数据收集方法、学科分类标准以及排名计算方法。
1 前言
2014年10月28日,在全球院校研究和大学排名中享有盛誉的《美国新闻与世界报道》(U.S. News & World Report)在其网站(usnews.com)上公布了其首个全球最佳大学排行榜(Best Global Universities)。这一排行榜总体上包括49个国家和地区的500所大学。从进入排名的500所院校看,美国大学从数量上在这一榜单中占据主导地位,哈佛大学、麻省理工学院、加州大学伯克利分校和斯坦福大学位列前四。英国牛津大学和剑桥大学位列四、五位。500所院校中有134所来自美国,42所来自德国,38所来自英国。中国内地高校也取得了不俗的表现,有27所入围前500强。
《美国新闻与世界报道》的这一排行榜是基于学校学术研究和声誉的一项排名,学生可以通过其比较全球大学。除全球排名外,该排行榜还包括4个地区、11个国家以及21个学科领域的大学排名。
全球最佳大学排行榜是根据汤森路透InCites研究分析解决方案提供的数据和指标得出的,侧重于评估全球大学的综合科研实力,是美国新闻与世界报道首次对全球大学学术研究和学术声誉进行的最全面的评估。该机构利用调查数据、文献计量学数据和部分公开数据开发出独立的一套测度学术研究和声誉的指标体系,其中部分指标首次应用于全球大学排名。本文将对全球最佳大学排行榜基于学术研究和声誉的指标体系和排名计算方法进行详细介绍。
2 总体全球最佳大学排行榜[1]
2.1 指标体系
全球最佳大学排行榜总体上包括全球49个国家的500家机构。排名的第一步,就是利用汤森路透InCites研究分析解决方案,分析了750家大学然后排出前500名。为了进入这750个候选名单,一家机构必须在最近5年发表最多论文数量,并且位于汤森路透全球声誉调查中排名前200位。由于这样的标准,许多独立的研究生院(如纽约洛克菲勒大学和加州大学旧金山分校),也符合条件并包含在排名结果中。第二步是利用美国新闻与世界报道所选择的测度全球大学研究绩效的10个指标和和权重来计算排名(表1),相关指标分成声誉指标、文献计量学指标和学校层面指标等三大类。
表 1 美国新闻与世界报道总体全球最佳大学排行榜的指标体系
排名指标 | 权重 |
学术声誉指标 | 25% |
全球研究声誉 | 12.50% |
地区研究声誉 | 12.50% |
文献计量学指标 | 65% |
论文数 | 12.50% |
归一引用影响 | 10% |
总引用 | 10% |
高被引论文数 | 12.50% |
高被引论文百分比 | 10% |
国际合作 | 10% |
学校层面指标 | 10% |
授予博士学位数 | 5% |
平均每一学术人员授予博士学位数 | 5% |
2.1.1 声誉指标(25%)
美国新闻与世界报道利用来自汤森路透学术声誉调查(Academic Reputation Survey)的结果, 生成两项声誉指标用于排名分析。汤森路透学术声誉调查旨在收集学术界对全球大学的一个可以比较的看法,被调查者就其所熟悉的学科领域发表对大学该学科领域的看法。被调查者对大学进行学科层次和和系级层次排名,而非大学层次的排名,这一方法可以说是对大学整体声誉更加特定和准确的测度。为了更好地代表所有地区,汤森路透采取多项措施克服语言偏差、不同的回应率以及研究者地区分布等问题。这些措施包括:基于所估计的全球学术和研究人员的地区分布比例发送一份仅为受邀的调查给选自汤森路透数据库发表研究成果的学术人员;调查问卷使用10种语言;基于研究人员的地理分布对调查最终结果进行再平衡,以克服各地区的不同回应率问题。调查结果用于以下两项独立的排名指标:
全球研究声誉(12.5%): 这一指标反映最近5年的学术声誉调查结果中全球最好大学的研究的整体情况。
地区研究声誉(12.5%): 这一指标反映最近5年的学术声誉调查结果中某一地区全球最好大学的研究的整体情况;地区的确定基于联合国的定义(参加附录)。这一指标极大地提升了排名地区的国际多样性,因为其关注在同一地区内测度学术界对其他大学的看法。这一指标在所有全球排名中是首次应用。
2.1.2 文献计量学指标(65%)
排名分析中所使用的文献计量学指标是基于2008到2012年5年期的Web of Sciences数据。Web of Sciences是汤森路透开发的一个基于网络的研究平台,涵盖全球超过12,000种最有影响和权威的科学、社科和人文学术期刊。
论文数(12.5%): 这是一个测度大学总体研究产出的指标,基于包含一个大学的署名并发表在高质量有影响力的期刊上的学术论文总数(文献类型包括reviews, articles 和notes)。这一指标与大学规模密切相关。也受到大学所重点关注的学科影响,例如部分学科,特别是医学,论文超过其他学科。
归一引用影响(NCI)(10%): 总引用数除以论文总数代表大学研究的总体影响,并且不依赖于大学的规模和年龄;对结果进行归一化是为了克服研究领域、论文发表年份以及文献类型的差别。归一引用影响被认为是测度研究绩效的核心指标之一,已被全球许多研究评估机构广泛使用。用于分析的学科领域来自汤森路透的InCitesTM 工具,该工具能帮助不同机构评估其研究产出、绩效和趋势;了解机构的学术贡献范围;并且清楚地展示研究重点。InCites也是利用来自Web of Sciences的论文和引用数据。
总引用数(10%): 这一指标测度大学如何对全球研究共同体的影响。计算方法是将论文数排名因子乘以归一引用影响因子。总引用数也已归一化,旨在消除研究领域、论文发表年份以及文献类型的差别。
高被引论文数(12.5%): 这一指标反映在相关领域位于全球前10% 高被引论文的论文总数。每一篇论文被赋予一个百分位数代表其所处位置,就引用排序而言是与类似论文进行对比(同一发表年份、学科和文献类型)。由于高被引论文数不依赖于学校规模,这一指标能被认为是一项能很好描述大学产出优秀科研成果的数量。
高被引论文百分比(10%): 这一指标是指位于全球前10%高被引论文(每一领域以及每一发表年份)的论文总数占大学论文总数的百分比。它是一个不依赖于大学规模的测度大学优秀研究成果总量的指标。
国际合作(10%): 这一指标是指一所大学国际合著论文占大学总论文数比例除以大学所在国家国际合著论文比例。它显示国际研究论文如何同机构所在国家比较。国际合作论文被认为是一个质量指标,因为只有最好的研究才能吸引国际合作者。
2.1.3 学校层面的指标(10%)
学校层面的指标是利用公开来源的数据建立的,包括授予博士学位数和平均每一学术人员授予博士学位数两个指标。
授予博士学位数(5%): 这一指标反映2012年授予的博士学位总数。博士学位授予能被认为是研究产出的替代指标,同体量有关。
平均每一学术人员授予博士学位数(5%):这是指2012年平均每一名学术faculty成员所授予的博士学位数量。 这是一项测度大学培养环境的与规模无关的指标。
2.2 总分和名次计算方法
为了获得学校排名,学校总分的计算方法是对用于大学排名的10项指标中的每一个结合权重和z-分数进行计算。在统计学上,z-分数也叫标准分数,是一个数与平均数的差再除以标准差的过程。当结合多种不同信息到单一排名时,这一数据转换是必需的,因为它可以在不同类型数据间进行公平比较。
几个指标高度偏向,因此对原始值取对数。这些指标是:论文数、总引用数、高被引论文数、授予博士学位数、全球研究声誉以及地区研究声誉等六项指标。这一取对数操作重新调整数据,允许更加规范和统一的展开每一指标。在对这六个指标规范化处理后,计算出每一指标的z-分数,将不同类型的数据标准化到同一尺度。
为了计算学校的全球总分,对10项指标的每一指标所计算的z-分数再利用先前所分配的权重进行计算。美国新闻与世界报道所确定的权重是根据其排名因子相对重要性的判断并通过咨询文献计量专家。每一大学的全球总分通过加和每一指标的加权值得出。750家大学的中最低分数从每一个分数中扣除,以便得出最低分为零分。然后重新调整分数,通过将每一大学的总体绩效分占最高分的比率乘以100得出最终分数。这些分数都落在0-100区间,并且全球最高得分为100分。然后对750所大学的前500所大学按照这一加权的再调整的全球总分递减进行数字排序出1到500名。每一大学的全球总分取1位小数,以便提高分数差异使并列排名数最小。
此外,对750所大学的每一排名指标进行数字排名,如论文总数、总引用数和全球学术声誉等,基于指标的z-分数。每一指标中的最高分数的大学排名第1,最低分的排名第750。允许并列排名。正如先前所说,10项指标的每一指标排名在前500的学校公布在usnews.com 网站。这意味着,部分学校在前500名的学科排名可能在501-750。每一排名指标的名次仅被用来确定每一学校在每一指标的相对位置。需要说明的是指标的名次不用来计算全球总分。
2.3 数据收集和缺失数据
用于排名的数据和指标由汤森路透InCitesTM 研究分析解决方案提供。文献计量数据基于Web of Sciences。论文总数限定于2008到2012年间发表的论文。然而,对这些论文的引用来自截止最近的所有论文对其的引用。对于2014年公布的2015 版的美新全球最佳大学,这一截断大约是2014年4月。有必要利用稍微更长一点的出版窗口,以便引用累计并提供统计上的相关结果。用于分析的学科领域来自汤森路透的InCitesTM 分类,不包括艺术和人文期刊,因此将其从引用有关的指标中排除,但是艺术和人文期刊的论文包含在论文总数指标中。艺术和人文期刊累计很少的引用,并且引用分析鲁棒性小,因此,有意排除艺术和人文提高了结果的鲁棒性。
当数据缺失时,如授予博士学位数,z-分数为0,就是说对大学既不加分也不扣分(即认为其等于所有其他大学的平均分数)。当数值为0从而不能计算log值时,从而使用替代值。替代值为其他所有机构最小值的十分之一。在文献计量和声誉调查中没有数据缺失。
2.4 地区大学排名
在整体前500名排名计算后,美国新闻与世界报道在此基础上产生其他排名,排出包含进入全球排名的大学最多的四个地区的大学排名。这四个地区分别是亚洲、澳大利亚/新西兰、欧洲、拉丁美洲。为了确定哪一个国家在那一地区,排行榜采用联合国的地区定义。地区排名的方法完全基于总体上全球前500所大学的排名。大学在其地区基于其在全球500强的名次进行排名。例如,在欧洲,在500强中排名最高的是英国的牛津大学,位于全球第5,因此其排名欧洲第1。同样,在500强中排名第6剑桥的排名欧洲第2。
2.5 国家大学排名
美国新闻与世界报道按国家的全球大学排名选择进入前500强的机构数排在前11位的11个国家,分别是加拿大、中国、法国、德国、意大利、日本、荷兰、韩国、西班牙、瑞典和英国等。国家排名的方法也完全基于总体上全球前500所大学的排名情况。大学在其国家的排名基于其总体排名。例如,在加拿大,在500强中排名最高的是多伦多大学,排第14位。这意味着其在加拿大排名第一。加拿大排名第2的是不列颠哥伦比亚大学,全球第30,在加拿大排名第2。
3 全球学科排名[2]
除了全球500强大学按总体、地区和国家排名外,所公布的美新世界大学排名还包括主要学科领域的排名情况。美新使用单独方法公布了21个学科领域的全球排名前100的大学。学科排名根据汤森路透的InCites研究分析平台解决方案计算。这些学科领域的排名是基于这些领域的学术研究绩效,不是指大学的专业、系所或特定学院,如商学院或医学院。排名使用包括论文数和引用总数等许多文献计量指标,以及特定学科的全球和地区学术声誉的指标。
3.1 指标体系
文献计量指标基于来自Web of Sciences的2008到2012年的数据。Web of Sciences是一个基于网络的研究平台,涵盖全球超过12,000种最有影响和权威的科学、社科和人文学术期刊。21个学科领域分类使用汤森路透InCites分类框架,利用来自Web of Sciences的论文和引用数据。
学科排名的第一步是建立大学系列来决定每一领域的前100名。2008到2012年在该领域发文数排在前250名的大学被用于每一领域的前100名排名计算。结果是,有许多情况是当一个机构高度关注某一特定学科时其排名该领域前100名,但在整体前500强排名中没有该机构。总体上,有59所大学和一个国家(罗马尼亚),在学科排名中出现但没有在总体前500强排名中。
第二步是使用美国新闻与世界报道选择的8项排名指标来分别计算21个学科的排名。用于学科排名的每一指标都基于为特定学科收集的文献计量数据以及全球及地区学术声誉调查数据。例如,对全球最佳临床医学的大学排名,8项指标中用于计算的每一指标均基于临床医学的数据和论文。
学科排名方法在许多方面同总体500强大学排名不同。首先,美国新闻与世界报道在学科排名时精心考虑了软科学和数学以及硬科学的不同发表特点。软科学是计算机科学、经济学和商学、工程以及社会科学和公共卫生。硬科学是指其余的16个学科。其次,学校层面的数据如博士学位授予和专任教师数在学科层面缺失,因而不包括在学科排名方法中。
在硬科学使用引文分析很明确。然而在软科学中论文引用同绩效之间的关系较不清晰。这有几个原因。首先,不同于硬科学,软科学的期刊文章通常不是科研交流的主要方法,并且论文的引用率可能很低。其次,在社会科学以及经济学和商学中,学者引用其他工作通常是争论或讨论。这与硬科学不同,硬科学引用其他工作的原因通常是其有用或有影响。在数学中,尽管期刊论文是主要交流方法,但其引用较其他领域需要花更长的时间累积,并且数学论文的总体引用率很低。但这些原因并不能否定在研究评估中使用引文分析,只是减小了结果鲁棒性的信心。因此,美国新闻与世界报道降低这些软科学引用指标的权重以反映较低的信心。
表2列出用于计算21个学科领域的指标及其权重。关于每一排名指标的详细解释请参见前文。
表 2美国新闻与世界报道总体全球最佳大学排行榜的学科排名指标体系
排名指标 | 用于软科学的权重 | 用于硬科学的权重 |
全球研究声誉 | 12.50% | 12.50% |
地区研究声誉 | 12.50% | 12.50% |
论文数 | 17.50% | 15% |
归一引用影响 | 7.50% | 10% |
总引用数 | 12.50% | 15% |
高被引论文数 | 17.50% | 15% |
高被引论文百分比 | 10% | 10% |
国际合作 | 10% | 10% |
3.2 学科分类
所涵盖的21个学科领域分别是:农学、生物与生化、化学、临床医学、计算机科学、经济学与商学、工程、环境/生态、地球科学、免疫学、材料科学、数学、微生物学、分子生物学与遗传学、神经科学与行为学、药学与毒理学、物理、动植物科学、精神病学/心理学、社会科学与公共卫生以及空间科学。下文是汤森路透如何分配某一期刊到其所排名的21个学科领域的某一学科的概述。关于每一学科领域所涵盖范围的详细描述,请参见InCites所提供的注释。
农学: 期刊关注的主题包括农艺、土壤科学和食品化学。从提高农业产量和减小作物和动物的病虫害到畜牧业、遗传和营养学研究,这一分类的论文涉及农业所需的工具、方法和技术。
生物学和生物化学: 这一目录包括大范围生命科学相关主题。从荷尔蒙调节和内分泌系统研究到污染修复和废物处理,论文涉及细胞、生物分子和活生物体的组成。
化学: 包括理论和应用研究。这些期刊包括的主题从原子、有机和物理化学,以及分析化学和分离技术,以及临床有意义分子的分析等。
临床医学: 包括的期刊关注大范围医学和生物医学主题。从麻醉、外科和心血管医学到护理、产科和再生医学,论文涉及医学领域的研究和进展。
计算机科学: 研究涉及创造,操作和管理计算机软硬件。从计算机系统机构和计算方法到信息处理、存贮,管理和分发,论文关注计算的科学和实践方法。
经济学和商学: 包括的期刊涉及商品和服务的生产、分配和消费。这些论文涵盖理论、政治、农业和发展经济学,以及简历和维持成功商业的战略规划,决策和财政方法。
工程: 包括的论文涵盖许多工程学科。从航空, 力学, 电子和土木工程到原子能,引用人工智能和机器人,论文关注涉及、制造和使用结构,机器和系统。
环境/生态: 包括纯粹和应用生态学研究。期刊的主题涵盖生态毒理学,环境技术和生态模型,以及环境健康和气候变化的研究。
地球科学: 研究我们所处世界的结构,演化和动力学。从地质学,地球化学和地球物理到地质、石油和采矿工程,论文关注地球的物理研究。
免疫学: 研究涉及细胞和分子水平的免疫。这些期刊关注传染病,自身免疫和过敏,还包括诸如免疫病理学等主题的临床研究和免疫制剂的实验治疗应用。
材料科学: 包括的期刊涉及材料的发现和设计。这些论文包括的主题有纺织、生物材料、超导和半导体,以及化学和物理在材料设计和测试中的应用。
数学: 期刊涉及统计学、概率以及纯粹和应用数学。从算法矩阵和图论到密码学和最优化,论文关注数量的学科。
微生物学: 包括的研究涉及原生动物和微生物的生物学和生物化学。从生物体致病的医学到微生物的生物技术的基础科学和临床应用,论文关注微小有机体的研究。
分子生物学与遗传学: 论文关注遗传学的基础和应用研究。这些期刊涉及的主题有受体生物学,信号传导和形态发生,以及遗传原因和遗传疾病的治疗。
神经科学与行为学: 包括的论文涵盖神经系统的细胞和行为构成。这些期刊的研究包括分子神经科学、神经元发育和精神病理学,以及基础和临床神经学。
药学与毒理学: 主题涉及药物的正负效应。从制药,药物设计和代谢,到职业暴露和物质对细胞的有害效应,论文关注人造和天然化学品对有机体的效应。
物理: 包括的期刊涉及这一学科的经典和现代理论。从伽利略相对性的经典研究,热力学和牛顿运动定理到量子力学和爱因斯坦相对论的现代研究,论文涉及物质和能量的性质和相互作用。
动植物科学: 包括一个大范围的主题,从地区植物、水生毒理和植物营养的研究到关注动物行为、兽医和演化生物学的研究,论文关注动植物研究的非农业特性。
精神病学/心理学: 所有涉及精神的客观和科学的研究。这些期刊包括主题从特定领域,如应用,生物,临床,发展,教育,数学,组织,个人和社会心理学,以及精神病的分类、诊断和治疗等。
社会科学和公共卫生: 社会和卫生科学主题包含在这一学科领域。这些期刊包括社会建设的研究,如社会政策,政治学,教育学,人口统计学,法学以及公共卫生和行政,以及涉及伦理和健康社会规范和成瘾等研究。
空间科学: 期刊关注宇宙的研究。从天文学和天体物理到天体和空间探索,以及关于外太空的所有研究论文。
3.3 学科分数和排名计算方法
为了获得学校在21个学科的每一个的排名,学科得分的计算方法是对用于学科排名的8项指标中的每一个结合权重和z-分数进行计算。在统计学上,z-分数也叫标准分数,是一个数与平均数的差再除以标准差的过程。当结合多种不同信息到单一排名时,这一数据转换是必需的,因为它可以在不同类型数据间进行公平比较。
有五个指标高度偏向,因此对原始值取对数。它们是:论文数、总引用数、高被引论文数、全球研究声誉、地区研究声誉等。这一取对数操作重新调整数据,允许更加规范和统一的展开每一指标。在对指标规范化处理后,计算出每一指标的z-分数,将不同类型的数据标准化到同一尺度。为了计算一所学校的学科分数,为8个指标的每一个计算得出的z-分数按照前文的权重进行加权。美国新闻与世界报道所确定的权重是根据其排名因子相对重要性的判断并通过咨询文献计量专家。
学科得分通过加和该学校的该学科8个指标的加权值求出。250家大学的中最低分数从每一个分数中扣除,以便得出最低分为零分。然后重新调整分数,通过将每一大学在某一学科的总体绩效分占该学科的最高分大学的比率乘以100得出最终分数。这些分数都落在0-100区间,并且全球最高得分为100分。然后对21个学科的每一学科的250所大学按其学科加权分降序排序出1到250名。每一大学的学科得分取1位小数,以便提高分数差异并将并使并列排名数最小。美新自每一学科领域公布排名前100名的大学。
此外,在每一学科领域,对这250所大学的8项指标的每一个排名指标进行排名,如论文数,总引用数和全球学术声誉,基于该指标的z-分数。8项指标的每一指标中的最高分数的大学排名第1,最低分的排名第250。允许并列排名。21个学科领域的8项指标的每一指标排名的每一学校公布在usnews.com 网站。这意味着,部分学校在前100名的学科其这项指标排名可能在101-250。每一排名指标的名次仅被用来确定每一学校在每一指标的在1到250的相对位置。指标名次不用来计算学科得分。
3.4 数据收集
用于排名的数据和指标由汤森路透InCites研究分析解决方案提供。文献计量数据基于Web of Sciences,论文总数限定于2008到2012年间发表的论文。然而,对这些论文的引用来自截止最近的所有论文对其的引用。对于2014年公布的2015 版的美新全球最佳大学,这一截断大约是2014年4月。今后有必要利用稍长的出版窗口,以便引用累计并提供统计上的相关结果。
用于分析的学科领域来自汤森路透的InCitesTM 分类,不包括艺术和人文期刊,因此将其从引用有关的指标中排除,但是艺术和人文期刊的论文包含在论文总数指标中。艺术和人文期刊累计很少的引用,并且引用分析鲁棒性小,因此,有意排除艺术和人文提高了结果的鲁棒性。
4 结语
《美国新闻与世界报道》最新开发全球最佳大学排行榜,可以为比较全球大学特别是其研究绩效和学术声誉提供借鉴,帮助学生准确地比较世界各地的学校,学生可以利用这一排名进行超越其国界限制的高等教育选择并比较各大学研究的主要特性。伴随着高等教育国际化的深入发展,计划去国外就读大学的学生数量迅速增长,这一旨在关注大学的总体学术研究和声誉,而不是其独立的本科或研究生计划的排行榜能帮助那些学生全面而又准确地比较全球大学,为其选择理想大学就读提供帮助。此外,全球最佳大学排行榜还提供了各国大学在全球的排名地位的相关信息,学生还可以利用它来选择就读的大学。所有大学可以利用这一排行榜将其同本国和本地区其他大学进行比较,从而找出差距,不断提升其在世界舞台的显示度,并据此寻找其他国家的科研合作伙伴。
参考文献
[1] Robert Morse and Melinda Foster. How U.S. News Calculated the Best Global Universities Rankings. http://www.usnews.com/education/best-global-universities/articles/methodology015.
[2] Robert Morse and Melinda Foster. How U.S. News Calculated the Best Global Universities Subject Rankings.http://www.usnews.com/education/best-global-universities/articles/subject-rankings-methodology
转载本文请联系原作者获取授权,同时请注明本文来自贺飞科学网博客。
链接地址:https://wap.sciencenet.cn/blog-1015-902245.html?mobile=1
收藏