第21卷第3期 电 脑 与 信 息 技 术 V0l_21 No.3 2 0 1 3年6月 Computer and Information Technology Jun.2013 文章编号:1005—1228(2013)03—0025—04 智能化题库管理系统的研究与设计 黄建强 (广东省湛江市第二技工学校,广东湛江524001) 摘要:文章提出智能化题库管理系统,以改进传统的考试与评价方式。文章提出基于Bloom Filter的试卷自动生成方法, 借助方法可以有效地自动生成考点均衡的,难度均衡的试卷。实验结果表示,文章提出的方法可以有效地实现试卷的自动 生成功能,并能满足用户设定的各项参数要求。 关键词:智能题库;Bloom Filter;关联矩阵;考点均衡;难度均衡 中图分类号:TP391 文献标识码:A Research and Design ofIntelligent Management System in Question Database HUANG Jian—qiang (The Technical Schoo ̄of Zhanjiang in Guangdong,Zhanjiang 524001,China) Abstract:This paper proposes a intelligent quesiton database system,in order to improve the traditional evaluation and examination.In this paper,an automatic method of generating test paper based on Bloom Filter is present.With this method,test papem can be efifciently generated automatically,and this method balances the difficulty and the concepts of quesitons.The experiment results show that,the method in this paper can generate a good paper which is satisifed the requirement of user. Key words:intelligent question database;Bloom Filter;association matrix;balance of concepts in examination;balance of diifculW 随着信息技术的发展,计算机技术已经广泛地应 效的借鉴作用。 用于教育领域,并且不断深人地影响着传统教学系统。 计算机辅助的信息自动化测试系统f3】是众多教育 近年来,国内外研究者相继各种基于计算机技术的教 应用平台的一种,它有效地解决人工测试系统中存在 育应用平台,例如虚拟图书馆【1],虚拟教室,远程教育系 的不足。自动化测试系统帮助考核人员管理题库,生成 统[21,这些先进的研究成果为传统教育带来了极大的便 测试题目,评价和分析测试结果,它可以高效快速地考 利,使得现代教育变得越来越丰富多彩,效率越来越 核学员或被考核人员的知识技能。 高。如今,教育工作者足不出户就可以方便高效地完成 本文研究智能化的题库 管理系统,并基于Bloom 教育过程。 Filte一5提出了一种有效的自动生成试卷的方法。 测试教育过程中不可缺少的一个环节,它可以考 察学生对所学知识和技能的掌握程度。传统的测试环 1 相关概念 节中,需要教师或考核人员花费大量的时间去编写考 研究智能化的试题库管理系统为了更加科学和高 卷,并且在编写考卷过程中,还要考虑各种题型的难易 效地管理题库,更好地评测学生的学习效果,因此,题 程度,考卷包括的考点,学生完成考卷的时间估计等 库中所有储备的题目应是有意义的题目,即具备一定 等,测试完毕后,又要花费大量时间批改。在这些冗长 评测能力、符合一定的参考指标系统设计。为了便于分 的环节中,有一个致命的缺点就是,人工的测试操作极 析题目的作用和意义,引进并介绍题库中各题目的一 容易造成出错,而且考试的结果不能有效地反馈到试 些内在属性。 题中,这些结果不能有效地为下一次编写考卷提供有 定义1标识符(i)题库中每个题目都有唯一的 收稿日期:2013—02—21 作者简介:黄建强(1972--),男,广东湛江人,本科,讲师,主要研究方向:计算机教学改革,数据挖掘,网络安全。 ・26・ 电 脑 与 信 息 技 术 题目标识符,用以唯一标识一个题目。 定义2难度系数(d)衡量题库中任一题目的 难易程序。一个题目的难度系数可以通过以下公式求 得: ∑vi . d= 』 (1) 其中,K为参加测试的总人数,Vj为第i个被考核 人完成该题目的得分,V为该题目的分值。 定义3完成时间(t)一个题目的完成时间t是 衡量被考核人完成该题目所需要的时间。 定义4试卷完成时间(T)试卷的完成时间为 试卷上所有题目的完成时间之和,即 T=22ti (2) 其中,ti为第i个题目的完成时间,N为试卷的总 题目数。 定义5考点(C)指一个题目中考查的概念或 知识点。通常一个题目具有多个考点,因此一个题目的 考点是一个多值詹I生。本文约定,考点为题目中出现过 的概念或者运用的方法。 定义6类型(S)题目的类型包括选择题,填空 题,判断题,简答题,计算题,写作题等等,不同的科目 具有不同的题目类型。 2智能化题库的特点 一个好的题库管理系统应该具备以下几个特点: 自适应性:即题库管理系统应该具备考后分析和 评估能力,能根据反馈的考核结果,分析被考核人答卷 结果,评估被考核人掌握知识的程度,并根据被考核人 的答卷情况不断更新和调整考题的难度系数、完成时 间等属性。 考点均衡:一份好的试卷应该能从全方位地考查 被考核人对一个阶段所学习的知识的掌握程度,被考 核人在一个阶段里学习的知识点的数目应该比较大, 试卷的作用是尽可能考查被考核人对尽可能多的知识 的掌握程度,所以由题库自动生成的试卷所考查的考 点应该分布均衡,并能保证考点覆盖面的广度,还要避 免考题和考点的重复。 难度均衡:由于被考核人的学习能力各不相同,对 知识的掌握程度也参差不齐,因此考核的其中一个作 用是尽可能体现出每个被考核人的差异程度,要达到 这个目的,就要保证考题的难度系统要均衡,保证试卷 的题目有难有易,以便更好地区分学生的掌握程度的 差异性。 及时更新:对于题库中难度系数过高和难度系数 过低的考题应及时作淘汰处理,因为难度过大,或过低 的题目对区分被考核人的掌握程度没有贡献。另外,完 成时间太长的题目会占用被考核人太多的时间,但其 考点有限,且会影响考生完成其他题目的时间,因此完 成时间太长的题目也不适用于一般的考试,也应该作 淘汰处理。 3系统设计 本文设计的智能化题库管理系统分为四大模块, 分别为题库管理模块,试卷生成模块,测试模块,考卷 分析模块。系统的框架图如图1所示。 图1 智能化题库管理系统框架图 3.1 测试模块 用户是被考核人,通过该模块可以浏览系统自动 生成的试卷,用户可以借助该模块进行答题、提交答卷 等。 3.2考卷分析模块 对测试模块的用户提交的答卷进行分析处理,其 功能包括对答卷评分,分析被考查人对所考点的掌握 程度,将考生的成绩发布到教务数据库中等。教务数据 库中有考生的详细资料。 考卷分析模块还负责将答卷分析的结果返回给题 库管理模块,返回数据包括考生完成各题的时间,各题 目的得分情况等。 3.3题库管理模块 智能化题库管理系统的管理界面,其功能包括向 试卷生成模块传递生成试卷的各种参数,根据考卷分 析模块分析得到的结果对题库进行更新,根据题目的 属性对题库的题目进行删减,更改题目的属性,添加新 的题目等等。 第21卷第3期 黄建强等:智能化题库管理系统的研究与设计 借助题库管理模块,用户可以为生成试卷模块提 供一系列参数,例如需要采用哪些题目类型,各类型分 值所占比例,期望试卷的难度系数,所涉及的考点及各 考点的比例等。数据设置的一个例子见表1。除了表格 用户设定的参数要求外,还要满足考点均衡、难度均衡 等要求。本模块是本文研究的重点。 对用户提供的参数d,T,Psi,生成的试卷应该满足 以下条件: 中的参数之外,还可以设置。 表1题目类型的参数设置 注:Ps。为题型S,的分值占全卷分数的比例 vs;为题型si的每小题的分值 题库管理模块要实现的一个重要的功能是根据考 生答卷更新题库题目的属.1生,包括难度系数、完成时间 等。 假设考生总人数为K,则在一次考试中,根据定义 2,题目i的难度系数为 a;= (3) Vi 其中,v 。为第k个被考核人完成题目i的得分,Vi 为题目i的分值。 定义难度更新系数 ,通过以下公式更新题库中 相应题目的难度系统: di=Otdi+(1一o【)d (4) 在一次考试中,题目i的平均完成时间为: i= 1∑t 。 (5) 其中t i为第k个考生完成题目i所用时间。 定义完成时间更新系数B,通过以下公式更新题 库中相应的题目的完成时间: ti=p ti+(1一p)ti (6) 3.4试卷生成模块 根据用户提供的各项参数从题库中自动抽取试题 生成满足用户要求的的试卷。自动生成的试卷在满足 ≤d (7) ∑tj< ̄T 、 (8) ∑ ≤Psi (9) j E s 其中, 为题目J的分值。 考虑到考点均衡,本文引入Bloom Fiher[81对已选 择的题目的考点和难度系统进行计数。 首先引入考点~考题M,M的每行表示一个考点, 每列表示一个题目,M是一个I*J维的矩阵,I表示考 点的总个数,J表示题目的总数,llli_|_1表示第J题包含 考点i,否则m =0。 创建一个Bloom FiherB ,B 的长度为I,其中I为 考点的总个数。当考点i出现在已被选中的题目时,设 置B [i]=l。 创建一个Bloom Filter Bd,Bd的长度为Lsi,Lsi的值 与应该抽取的类型Si的题目的数目相等,以表1的参 数为例,S。的比例为20%,每一小题的分值为2%,因此 总共需要抽取10题S 类型的题目。因此在抽取S 类 型的题目时,Ls 应该设为10。然后将区间【O,1】投映到 上。在此例子中,投映的结果是,B [1】与[0,0.1)对应, Bd『i1与[(i一1)/10,i/10]对应,其中i=l,2,3,…,10。当某 选择的题目的难度系数在区间『(i一1)/10,ill0]上时,则 设置Bd[i]=l。 基于Bloom Filter的考卷自动生成的方法如下: (1)随机选择一道题目j作为被选的第一个题目, 然后根据题目 所对应的考点将Bc对应的位置1,表 示对应的考点已出现过;根据题目j的难度系数,将Bd 对应的位置1,表示对应的难度系数的题目已经出现。 (2)从剩下的题目中随机选择一个题目,首先检测 其难度系数在B 上对应的位是否为l,如果为1表示 这个难度系统已经出现,所以应该放弃该题目,并重复 第2步骤;如果Bd上对应的位为0,表示这个难度系 数的题尚未出现,则跳到第3步骤。 (3)将计算BTM“.i的值,如果其结果中1的个数 比MH.i中1的个数的50%还小,则认为题目i中的考 点极少在已经选择的题目中出现过,所以题目i可以 成为被选择的对象,因此,将B 与M i做或操作,结果 保存在B 中,并将题目J的难度系数所对应的B 位置 ・28・ 电 脑 与 信 息 技 术 设为1。如果被选择的题目数据已经达到Lsi,则停止, 否则跳转到步骤2。 基于Bloom Filter的方法自动抽取出来的试卷已 簸 群丑蛭 0 经满足了难度均衡和考点均衡的要求,但是还尚保证 满足试卷完成时间的保证。因此,通过计算已经题目的 完成时间之和T,如果T满足参数要求,则表明考卷有 效,否则应该找出完成时间最大的题目,将之替换成难 度系数相似、考点相似的同种类型的题目,直到所有题 目的完成时间满足用户要求为止。 4仿真结果 在仿真实验中,题库中类型的题目数目为1000。 输人的参数见表1。从仿真的结果可以看出,基于本文 提出的方法,可以自动生成考点均衡、难度均衡的,满 足用户参数要求的试卷。自动生成的试卷中被选择的 题目的考点的分布曲线如图2所示。自动生成的试卷 中l0个选择题的难度系数的分布图如图3所示。 图3难度系数分布 5总结 本文研究和分析了智能化题库管理系统的方法, 并设计了系统的框架图。本文提出了更新题库中题目 的属性的方法,并提出了一种基于Bloom Filter的保证 考点均衡、难度均衡的自动生成试卷的方法,实验结果 表明,借助本文提出的方法,可以有效地生成满足用户 要求的、保证考点均衡、难度均衡的试卷。 参考文献: [1] M.M.Albu,K.E.Holbert,G.T.Heydt,et a1.Embedding remote experimentation in power engineering eduemion【JJ.IEEE Trans,20 4, 19(1):139-143. [2]G.一J.Hwang.A mtoring strategy supporting system for distance learning on computer networks[J].IEEE Trans,1998,41(4):343-361. [3]C.Chou.Constructing a computer-assisted testing nd aevaluation system 鸯点序号 on the wodd wide web—_The CATES experience[J].IEEE Trans.2000.43 图2考点分布 (3):266-272. [4]董敏,齐德昱,王晓蒲.IRT题库系统的分布式体系结构研究[J1_计 算机工程,2005,31(21):212—213. [5]高家利,廖晓峰.Bloom搜索过滤器的优化设计与实现『J1_计算机工 程,2009,35(07):264—266.