英语测试效度研究综述
▍广西英华国际职业学院 黎珍珠
度的研究一直热度不减,较为成熟,而对结构效度的研究正在逐步发展。
2008年以来的10年,英语测试研究进入发展期,2005—2014年每年都有20篇以上论文成果,而在2008—2012年期间,国内几种外语核心期刊以英语测试作为研究对象的文章共计126篇。文章内容主要涉及反拨作用和后效研究、信度与效度、受试者语言能力变量、计算机化语言测试等方面,研究内容较广,研究水平更高。
2013年之后,四六级的效度研究热度不及高考,近年来更是呈减退趋势。与此同时,硕士入学考试、专四、专八、全国会计师统一考试、高中学业水平测试以及网络考试方面的研究渐渐增多,研究范围更加广阔。经过梳理分析,本文从以下几大方面对国内测试研究进行阐述。
效度指的是考试在多大程度上测出预期要测量的东西,或者说考试在多大程度上完成了预期的测量任务,达到了预期的测试目标。语言测试的主要目的是对被试者的语言能力做出准确、公正的测量。杨惠中教授指出信度(reliability)、效度(validity)和可行性(feasibility)是语言测试的三个根本问题,其中效度最为重要,因为效度是语言测试的基本出发点,是语言测试评估中最重要的指标。效度就是一项测试是否真正测量了所想要考查的东西。测试应该努力提高内容效度,更好地测试出学生的语言水平。
20世纪60年代,外语测试作为一门新的学科从外语教学中独立出来,之后受到越来越多的语言学家的关注。最近几十年,大批的国外语言学家在语言测试领域取得了显著的成绩。英语测试方面的研究也正逐步跟进与完善,并在语言测试的各个环节(试题开发、组织考试、评分、反馈)发挥着重要作用。笔者通过对知网的数据进行检索,发现近10年我国诸多重要期刊上关于测试的文章较多,而分析高职英语测试有效性的文章却极少。我们需要更多关注高职院校英语测试的效度。
二、英语测试效度研究内容分析
效度研究状况。
根据所检索到的326篇论文,笔者从研究对象、学科专
业测试选题、研究内容、研究方法与工具角度分析英语测试(一)从研究对象的角度
从研究对象的细分来看,具体到语音、写作、口语、改错、
完形填空、快速阅读、复述等题型的研究;对口语、阅读、写作、翻译等角度的研究较多,且越来越多;而以地域划分进行测试的研究也渐渐增加,分别有重庆、西藏、福建、北京、浙江、济南、吉林、海口、厦门、深圳等省、市的中考或高考英语测试效度研究。
表2:英语测试研究对象情况一、英语测试效度研究数据分析
近年来,测试研究对效度的关注度很高,研究成果层出
不穷。目前国外对语言测试效度的研究较为成熟,相比而言,国内对此的研究正处在不断发展的过程中。在中国知网,以“英语测试”为主题并含“效度”为词频进行查找,检索到326篇相关论文成果。
表1:“英语测试效度”研究论文年度分布(二)从学科专业测试选题角度研究视角翻译写作口语改错完形填空阅读复述论文篇数1967108815394比例(%)5.8220.5533.132.454.6011.961.23其他6620.25从学科专业测试选题来看,秘书专业、民航专业、医学专
发19872000表之
——201020112012201320142015201620172018合计
年前
19992009份期刊
0101572130272023151166326篇数比03.0648.166.449.208.286.137.064.603.371.841.84100例业、师范专业以及船舶英语等方向的英语测试研究不少,借鉴美国托福考试,本着以信度为主的测试要求,来逐步丰富测试的语言内容,强化创建语言等级的量度标准,专业视角(三)从研究内容角度更细化,也更多样化。
从研究内容来看,对测试题的内容效度进行研究的文章
偏多,对地方中考、高考模拟测试的预测效度的研究略有几项。廖春丽研究福建省中考英语试卷的预测效度,闪豆豆分析高考英语模拟考试的预测效度。而整体效度、考点效度、结构效度、关联效度方面展开研究的文章却相当少,仅两三篇。安婧毓研究了美国托业考试的信度,郑砚通过回顾整体概念及其验证模式的构建过程研究反拨效应与测试主体多
2005年之后对英语测试效度的研究数量开始增加。
2005年之前多数为测试中的问题与思考,或者测试理论的解读,多数为思辨性的研究。
2005年开始,高考英语的效度研究成为相对的热点,研究数量最多,而研究的重点开始转向整体效度,但对内容效
124教育教研┆教育探索试的效度研究。例如,从传统的注重学生知识能力到注重学生的语言运用能力的考核,引导学生关注实际语境;从各独立题型测试过渡到多种题型考核内容有内在联系的、有交际性的、考核学生综合技能的题型。(3)当前高职院校的期末测试中,英语期末测试多以学业测试为主,试卷结构几乎都是语法、词汇、阅读、写作、翻译五大题型,以课本知识为主,听说能力的检测为零,应用能力检测极少。(4)更新研究方法与工具,基于语料数据分析、运用计算机软件统计分析的实证研究以及对比研究。
总体来说,各类英语教学朝向综合运用能力培养目标,考查学生英语知识的综合运用能力、检测语言行为的综合性和实际交际能力的测试将成为主流。英语测试对分析、转换信息等语言应用能力的考查内容也将增加,高职院校大学英语应用能力考试研究在今后10年会受到更多的关注,与高考、英语量化考试一样成为热点,构念效度、关联效度也将成为焦点研究视角。先进的计算机信息技术也将应用于语言测试研究中,借用语料库工具进行语言测试研究将成为今后的趋势。参考文献:
ASIA-PACIFICEDUCATION(四)从研究方法与工具角度层次动态关系。从研究方法与工具来看,思辨性的文章较之于研究初期慢慢减少,而实证研究、对比研究渐渐增多。邱劲通过语篇变量研究建立了一套高考英语阅读测试的效度验证标准, 对2009年高考英语重庆卷阅读测试部分进行效度检验;邓赛娇则是通过冗余信息理论研究完形填空效度验证方法;华立群、熊丽君以复杂理论为指导研究大学英语测试理论;穆惠峰运用自建语料库、中国学生英语口笔语语料库(SWECCL)、布朗语料库(BROWN)和英语国家语料库(BNC),以大学英语四级考试的完形填空测试项目为研究对象,对基于测试内容的效度证据进行实证研究。本文将研究方法分为两大类:一是实证性研究(empirical research),以下简称“方法1”;二是非实证性研究(nonempirical research),以下简称“方法2”。如表3、表4中数据显示,该主题的实证性研究比非实证性方面的研究论文要少很多,2010年之后有改善,特别是最近几年出现更多的实证性研究。
类别特点1.实证性研究重视研究的第一手资料,运用实验方法获取真实数(empirical 据,有鲜明的直接经验特征。通过可控制的实验去research)验证已有的假设,信度高。对某研究方法的实施过程进行详细的描述,结合自2.非实证性研究
身经历、经验进行总结,有明显的个人对于某问题
(nonempirical 的看法。依赖定性数据,描述性的、探索性的,用于
research)
发现规律与模式。表3:语言测试论文研究方法分类[1]舒运祥.外语测试的理论与方法[M].上海:世界图书出版社,2001.
[2]杨惠中.大学英语四、六级考试效度研究[M].上海:上海外语教育出版社,1998.
[3]张安.国内主要英语测试的效度研究综述[J].鸡西大学学报,2016(07):94-96.
[4]王秀琴.国内英语测试研究评介与展望[J].新乡学院学报(社会科学版),2013(6):142-144.
[5]廖春丽.福建省中考英语试卷的预测效度研究——以泉州市德化八中为个案分析[D].福州:福建师范大学,2013.
[6]闪豆豆.高考英语模拟考试的预测效度分析[D].南京:南京师范大学,2011.
[7]安婧毓.美国托业考试的信度分析及启示[J].黑河学院学报,2017,8(12).
[8]郑砚.整体效度视野下的反拨效应与测试伦理——英语测试主体关系的重构[J].北方民族大学学报(哲学社会科学版),2018(04).
[9]邱劲.从语篇变量看高考英语阅读测试的效度[J].重庆邮电大学学报(社会科学版),2010,22(3):153-156.(一)结论
三、结论与展望
综上分析得知,英语测试研究的对象与内容一开始大多基于高考与四六级考试、整体效度层面,近10年来对不同效度分类的分析有所增加,但不够全面;四六级、大学英语考试效度的研究均具体到各个题型,视角更具体,但中考、高考的效度研究以阅读题型居多;高职院校的大学英语测试效度的研究还是个位数。国家大力推崇职业教育,在职业教育注重语言应用能力的大背景下,对高职英语测试的研究尤为可贵。
(二)展望
展观未来,笔者认为,高职英语测试研究可以从以下视
角进行拓展:(1)拓展对高职学生英语测试表现影响因素的研究,比如多媒体视角下影响大学生英语期末测试成绩原因的调查与分析。(2)开发、设计新题型,注重整合性英语测方法12篇数年份百分比百分比篇数1987—199922088026.7573.251152000—200942表4:英语测试效度研究使用的研究方法情况201038.0961.901382011309201237.035.21102013408201439.1360.861492015406096201636.3663.63742017505033201866.6733.3324217062.961260
因篇幅问题不能全部显示,请点此查看更多更全内容