时间:2023-03-15 15:06:10
序论:在您撰写数据挖掘课程设计论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
国外很多大学都开设了数据挖掘类课程,波士顿大学的“数据管理与商务智能”课程主要包括基础、核心技术、应用三部分。授课方式包括理论内容讲授、案例教学,以及学生以团队合作方式完成项目并进行课堂演讲。从麻省理工学院开放性课程资料(斯隆管理学院)中可以看出,在每章讲解一种算法之后都尽可能地安排了商务实例的分析,并在课程后期安排了客座讲座的形式。国内对于数据挖掘的教学类研究成果也很多,主要集中在三类问题的研究上,较为普遍的是根据专业建立大纲的研究,例如针对电子商务专业进行大纲设计;另外也有专注研究某一种或多种适合数据挖掘或商务智能的教学方法,如专题研讨法;还有的讨论算法理解与程序设计、软件应用的关系。
2、基于模块化方法的课程内容分析
模块化教学模式是按照程序模块化的构想和原则来设计教学内容的一整套教学体系,它是在既定的培养目标指导下,将全部教学内容按照一定标准或规则进行分解,使其成为多个相对独立的教学模块,且各教学模块之间可以按照一定的规则有选择性的重新组合。该方法在20世纪70年代,由国际劳工组织引入教学之中,开发出以现场教学为主,以技能培训为核心的模块化教学模式,在很多国家得到广泛应用。由于该教学法具有针对性、灵活性、现实性等特点,越来越受到教育界的关注。模块化教学本质上是以知识点与实践的细化为出发点研究,本课程的知识点细化分为两个层次:一是从宏观角度,参考ACM的SIGKDD的数据挖掘课程建设建议,设计课程的基础内容模块和高级主题模块;二是从微观角度,针对较为复杂的算法进行的知识点划分。课程内容的一至五章属于基础内容模块,介绍本课程的基础理论和入门的数据挖掘技术;六至第八章介于基础内容与高级主题之间,介绍数据挖掘的核心算法,可以根据学生情况进行灵活处理,可强调应用,也可深化算法介绍;第九、十章为高级主题模块,可以作为扩展材料介绍应用,或为感兴趣同学提供算法介绍;课程实践模块包含数据仓库建设与数据挖掘算法的应用,难度居中,可以在引导学生思考的前提下给出实验步骤,并引导学生使用类似的方法处理不同的数据。
3、基于模块化方法进行重要知识点的模块化分析
重要知识点内涵较为丰富,一般体现在经典数据挖掘算法上,通常一大类算法下还分有多个算法,不同算法的在难度上有渐进层次,同一种算法也有很大改进研究空间,讲授弹性比较大。因此,适合使用模块化方法进行处理,并且需要在课程设计中明确一定课时量所要达到的内容和难度。基础部分为必选内容,介绍基本概念和基本原理;决策树作为数据挖掘分类算法的最基础算法也是必选内容,决策树算法有多种分类,需要进行按照难易程度进行选择;最后要根据难度选择其他分类算法进行介绍。
4、结论
关键词:医学院校;目标驱动;课程设计;毕业论文
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2012)12-0218-02
一、背景
“数据仓库与数据挖掘”是国内外高等院校一门重要的课程,是国家基础教育较为重视的一门学科,受到不同专业学生的喜爱。其教学目标是提高学生的数据分析水平和能力,除了教授学生数据分析的常见方法之外,还将引导学生如何对实际的问题进行建模,如何对模型进行简化和求解。利用实例教学等方法,可以很好地将数据挖掘中的抽象概念、模型、公式等阐述清楚,让学生易于理解和接受。近年来,数据挖掘技术在医学领域中的应用越来越广泛。在疾病诊断、治疗、器官移植、基因研究、图像分析、康复、药物开发、科学研究等方面都获得了可喜的成果。运用各种数据挖掘技术了解各种疾病之间的相互关系、各种疾病的发展规律,总结各种治疗方案的治疗效果,以及对疾病的诊断、治疗和医学研究都是非常有价值的。因此,我们学院也把这门课程作为计算机专业及信息管理与信息系统专业的必修课。把计算机与医学结合,使得学生的培养方案全面包括了计算机与医学的知识点。由于该课程原本属于研究生阶段开设的专业课程,教材也大多侧重于介绍体系结构、算法原理、效率分析与改进等理论知识,其中所涉及的内容大多比较深,许多知识都超出了本科生的接受范围,此外,教材对相关理论在实际应用方面的说明也比较少,不利于安排实验教学。因此要实现“数据仓库与数据挖掘”课程的教学目标,必须在理论教学和实验教学环节综合考虑学时多少、教学条件以及学生的接受情况等因素,灵活地加以选择安排。
二、存在的问题
主要包括以下几方面:①课堂上以教师讲、学生听的教学形式为主,学生学习处于被动状态,他们的创造性因此被严重扼杀;②教师对专业课程体系和学生的知识体系不够重视,对课程体系的讲解不到位,造成学生在学习时课程之间联系不上,知识衔接不好,对知识的运用和融会贯通比较差;③实验与理论脱节。“数据仓库与数据挖掘”课程理论讲授的算法与实验软件中的算法有很大差距,使得学生难以理解。比如对于理论上讲授的关联规则算法,实验中使用SQL SERVER 2005中的商务智能工具做实验,学生发现有很多参数与理论上讲授的有很大不同;④医学院校的学生对纯粹计算机理论知识接受困难。由于该门课程是交叉学科,涉及计算机、数学、统计学等知识,如果学生的其他学科学得不好,就会对该课程的学习产生障碍;⑤教师讲授没有把理论课程结合到实际应用中。有很多学生不知道学习这门课的意义,老师没有很好引导学生,激活他们的学习热情。
三、目标驱动的教学框架
对于以上问题,本文提出了一个新的教学体系,设计了一套基于目标驱动的教学框架,把教师与学生紧密联系起来,从教学大纲的设置,教材的选择,理论教学,实验教学,课程设计及毕业论文,全面引导学生从初步了解到深入学习的过程。对于我们学校的实际情况,有两个专业的学生要学习这门课程。一个是计算机科学与技术专业,一个是信息管理与信息系统专业。对于两个不同的专业,我们设置不同的教学大纲。比如对于计算机专业的学生,数据仓库和数据挖掘教学总时数为72学时,其中理论为54学时,实验为36学时。
1.理论教学。对于信息管理与信息系统专业的学生,我们可以设置如下的教学计划,可分为三个主要部分。我们教材选择韩家炜的《数据挖掘概念与技术》,第一部分:第一至四章为数据挖掘的基础知识,包括数据仓库和数据挖掘的基本概念和相关知识介绍;第二部分:第五、六章介绍了数据挖掘的算法和工具;第三部分:第七章是数据挖掘的聚类分析的实际应用。本课程是信息管理与信息系统专业本科生专业必修课。通过该课程的学习,要求学生掌握数据仓库和数据挖掘的基本概念,了解基本方法和应用背景。掌握数据仓库的设计和建立,掌握数据挖掘的主要步骤和实现方法,数据挖掘的常用算法,实现数据挖掘的具体操作。理论学时的安排,第一章绪论(6学时);第二章数据仓库(4学时);第三章数据预处理(8学时);第四章数据挖掘发现知识的类型(8学时);第五章数据挖掘中常用算法(12学时);第六章数据挖掘的工具及其应用(8学时);第七章数据挖掘应用实例(8学时)。
2.实验教学。本课程配合理论教学,通过系统的实践教学锻炼,着重培养学生的独立分析问题和解决问题的能力,熟练掌握数据仓库的设计和建立以及各类数据挖掘方法,使学生具有一定的数据分析和挖掘能力,能在认识基础上,提出有效的数据挖掘方法,依据实际例子,写出解决方案。学生应在实验课前明确实验的目的和要求,然后针对相关问题写出解决方案。实验时对实际方案的运行结果应能进行分析并提出改进方法,最终写出实验报告。通过实验教学应达到以下基本要求:①理解数据仓库的工作机理及其构建过程;②掌握典型的数据仓库系统及其开发工具的使用;③理解数据挖掘技术的工作原理与流程;④掌握典型数据挖掘工具的使用;⑤掌握几种典型的数据挖掘算法;⑥掌握使用SQL SERVER 2000和SPSS工具解决实际问题。实验成绩包括:实验教学过程成绩、实验报告成绩,各占50%。实验过程表现成绩包括:学习态度是否认真、实验操作是否正确规范、基本技能掌握程度是否具有创新意识等方面。实验报告成绩包括:实验报告格式是否正确、原理是否论述清楚、实验结果分析讨论是否符合逻辑,报告字迹是否清楚等方面。
3.课程设计。理论课和实验课接近结束时,我们把最后三周作为本门课程的课程设计。课程设计的目的是让学生进一步深刻理解所学知识。由于本门课程很多算法不容易理解,如何让学生把所学知识结合到医学应用中是课程设计的关键。比如我们对信息管理与信息系统专业的学生课程设计,要求学生每人选择一个老师给定的题目,课程设计有详细的要求,比如题目“数据挖掘在医学诊断中的应用”要求学生能把本门课程相关的算法结合使用,最后给出详细的分析。通过课程设计,我们发现,学生对本门课程更有兴趣。
4.毕业论文。我们把课程一般开设在大三的下学期,也就是说学生学完这门课程后,就做了该门课的课程设计,使得学生对数据挖掘相关知识有了比较深刻的认识。这样,我们可以引导学生毕业论文的选择。毕业论文毕竟是反映学生大学四年所学知识,也对他们将来就业起到提前培训的作用。把理论结合实践,老师对学生的引导也十分重要。
我们根据医学院校的特征,提出了一套目标驱动的教学理念,从学生认识这门课程到学生理论课的学习,实验课的学习,课程设计及毕业论文的完成,在老师的指导下,使用我们的考核体系,可提高学生对所学课程的兴趣。
参考文献:
1研究现状
在网络资源课程建设上,很多教育工作者都做了有益的尝试。例如,文献[1]建议基于学生网络学习行为的特征来开发课程;文献[2]建议基于数据挖掘知识体系运用模块化方式组织数据挖掘课程内容;文献[3]则认为数据挖掘教学内容的组织应注重培养数据意识和深入科学研究;文献[4]认为将数据挖掘的内容贯穿于应用实例中易于传授,或者设计合适案例来推进教学;[5]也有研究者认为直接带领学生参与项目,通过项目开发重新组合课程内容,[6]能够起到更加明确的效果。笔者认为将项目融合到教学中,往往受到众多资源的限制,在教学层面难以有效拓展。本文将在深入学习已有研究成果的基础上,探索适合职业院校学生的数据挖掘网络资源建设模式和考核方式。
2金融数据挖掘课程实施方案设计实例
2.1设计理念在深入分析当前职业院校学生学习模式、兴趣特点、课程特点的基础上,拟按以下理念设计网络课程内容。第一,采用“问题牵引、比较说明,解决问题,项目驱动”的教学方法。在教学中,首先说明开设内容的理由和方法,使学生对概念有充分的理解;更多地考虑到学习者的兴趣和接受方式;教学中既正面阐述什么是正确的,也注重反面说明什么是错误的;用通俗的语言、具体实例阐述基本理论,突出重点,讲透“难点”。采用“任务驱动模式”取代“顺序教学模式”,以实际的项目开发任务为引导,进行示范性教学,让学生在实践、模仿、实践中提高。第二,启发式教学。数据挖掘是一门实践性很强的科学,讲解重点时注意对实验方法要详细介绍,这样学生对教学重点就记得牢,并能以同理推演。实践教学注意加强对学生发现、分析和解决问题能力的培养。第三,改革考核方式,采用多元评价方式考核实验成绩。为了提高学生的学习兴趣,培养学生问题求解和创新能力,考核方式很有必要改革。针对数据挖掘这门课程,实验成绩和课程论文成绩采用多元评价方式考核。经过三年的改革教学实践,我们收到很好的教学效果,学生在独立分析、解决问题和提供整体解决方案上的能力都获得不同程度的提高。第四,加强实践教学环节,注重学生综合能力的培养。课内教师根据教材精心设计课程实验教学和课程设计内容,注重实践与理论相结合,突出产学结合特色。第五,在线答疑。教师充分利用网络,建立在线讨论栏目,就教学难点开展讨论,并引入已毕业学生的社会资源进行拓展。第六,提供多种教学资源,引导学生自己解决学习问题。教学网站提供大量的教学资源,鼓励学生自己在网上查找资料解决问题。实践表明,这有助于激发学生的学习兴趣,训练学生的思辨能力。第七,多维实验教学模式。金融数据挖掘的实践教学分为三层教学体系,即验证性实验(基础层)、设计型实验(中间层)、综合性实验或课程论文(核心层)。在此基础上,以任务驱动方式,构建实践维三级目标体系,强化实践技能操作,提高实践教学质量。基础层,占总实验学时的30%,主要包括验证操作与验证型实验。学生直接操作验证的内容与被列为实验项目的基础实验,如数据预处理、数据可视化等。中间层,占总实验学时的40%。例如,CRM操作实例、欺诈检测等。核心层,占总实验学时的30%。综合设计型实验,按照跨行业数据挖掘标准流程,完成商业理解、数据理解、数据准备、建模、评估、部署。
2.2内容设计金融数据挖掘网络课程主要栏目包括:教师信息、课程介绍、指定教材信息、考核方法、学习方法指导、教学大纲、教学计划、课件、案例、课程实验、操作指引、数据挖掘实训、课程论文、常用资源、他山之石等16个栏目,各栏目建设现已完成并应用于课程教学。金融数据挖掘网络课程资源建设主要包括4个模块:(1)教学文件模块。该模块主要栏目有教师信息、课程简介、教学大纲、教学计划,提供有关的课程教学指导性文件和教学进程安排,供教师和学生参考。(2)课程学习模块。该模块主要栏目有学习方法指导、授课课件、参考课件、课程实验、课程论文等,主要向学生提供有关课程的学习和实验指导。(3)教学资源模块。该模块主要向学生提供教学资源,作为课外教学的延伸。(4)课外互动模块。该模块主要通过网络互动向学生提供课外答疑辅导环节。
2.3改革方案实施效果该课程改革方案的实施是基于BB(Blackboard)在线网络平台。由于本学期开始时,网络课程平台出现故障,数据挖掘网络课程平台正式使用时本学期已接近中段。使用综合情况如图1-3所示。结果显示内容区、公告区、讨论区获得较高点击量,其他模块由于用户体验比其他平台差,故暂无使用。图2、图3说明用户的访问还是与课程关联比较大,即上课时段前后,学生访问量增大,其他时段访问量急剧下降。但是相比于笔者所教的其他课程,学生对该课程的兴趣还是提升了许多。
3结论
一 课程体系设计和实践实训设计整体思路
1.遵照教育部对经济统计学专业的要求
严格遵照教育部对经济统计学专业的要求。主干学科为理论经济学、应用经济学、统计学,其中核心课程为西方经济学(微观经济学、宏观经济学),计量经济学,财政学,货币金融学,会计学,经济统计学,国民经济统计学,概率论与数理统计,抽样技术与应用,应用时间序列分析。实践性教学环节包括实验课程(含基本统计分析软件应用、统计实务模拟等),社会实践(含经济社会统计调查、统计工作实习等),科研和论文写作(含毕业论文、学年论文、科研实践等)。专业实验包括计算机基本技能实验、统计分析应用软件实验、经济计量分析软件实验、数据挖掘技术与应用实验。
2.参照其他院校的培养方案和课程设置
它山之石,可以攻玉。我们选择了部分具有代表性的财经院校(如上海财经大学、中央财经大学、东北财经大学、西南财经大学、中南财经政法大学、北京工商大学、上海金融学院、 河南财经大学、浙江财经学院和山东工商学院)和综合类院校(如浙江大学、吉林大学、南京大学和云南大学)以及师范类院校(如北京师范大学、华东师范大学、东北师范大学、南京师范大学)作为参照院校。通过比较分析得出,在统计学经济统计、商务统计、金融统计方向中,财经类院校主要突出经济学课程,招生偏重理科生。综合性院校和师范类院校主要课程为理学类,招生偏重理科生。
综上所述,经济统计学专业应培养适应信息化社会需要,熟练掌握现代统计理论和经济数量分析方法,具有扎实的统计学、经济学和金融学基础,能熟练应用计算机软件处理统计数据的复合型高素质经济管理统计人才。学生毕业后可在政府部门、金融机构、外资企业和大中型公司等从事经济统计分析、管理咨询、市场调研和商务数据分析等管理工作。
3.与学院培养方案形式统一
新制订的培养方案和整个学院的形式保持了统一,以便于教务人员管理工作的开展。
二 经济统计学培养方案专业课的设置
经济统计学的培养目标与基本规格和招收对象为理科生,设置了保险精算、金融统计和商务统计三个方向。学生修满培养方案规定的学分并达到学位授予要求者,授予经济学学士学位。
由于经济统计学对统计学和经济学知识的要求较高,我们提高了课程总学分和总学时,注重主干学科和专业课程的开课顺序和教学周学时分配,强化实训实践课程,实行理论和实践并行。
培养方案确定了5门学科基础课程,分别为宏观经济学、微观经济学、C语言程序设计、概率论与数理统计、管理学。确定了5门专业基础课程,分别为基础会计学、经济统计学、货币金融学、财政学、计量经济学。确定了9门专业核心课程,分别为国民经济统计学、多元统计分析、统计预测与决策、抽样技术与应用、应用时间序列分析、金融统计学、市场调查与分析、投资学、数据挖掘。
分设了三个专业方向,分别为保险精算(开设保险学、保险统计学、利息理论、寿险精算、非寿险精算5门课程)、金融统计(开设商业银行经营管理、金融市场、金融资产评估、金融工具与金融风险管理、投资组合分析 5门课程)和商务统计(开设信息检索与利用、企业经营统计学、投入产出分析、项目管理、质量控制统计方法5门课程)方向。
【关键词】经济统计学专业 培养方案 设计
【中图分类号】G642 【文献标识码】A 【文章编号】1674-4810(2013)32-0060-01
经济统计学专业是统计学在经济领域中的应用学科,是以经济数据为研究对象,包括经济数据的采集、生成和传输,用统计方法分析经济数据背后的经济现象以及复杂经济系统的规律,从而为经济和管理决策服务。2013年,我国首次设置经济统计学专业。作为地方二本师范院校的经济统计学培养方案设计,没有任何成功经验可以借鉴。因此,我们在按照教育部要求,根据经济形势发展情况,借鉴财经类、综合类和师范类院校的统计学专业经济统计方向的课程设计,结合院校实际,依托学校建设应用型教学的平台,来确定经济统计学专业的培养理念并建立课程和实训设计体系,进行经济统计学的培养方案设计。
一 课程体系设计和实践实训设计整体思路
1.遵照教育部对经济统计学专业的要求
严格遵照教育部对经济统计学专业的要求。主干学科为理论经济学、应用经济学、统计学,其中核心课程为西方经济学(微观经济学、宏观经济学),计量经济学,财政学,货币金融学,会计学,经济统计学,国民经济统计学,概率论与数理统计,抽样技术与应用,应用时间序列分析。实践性教学环节包括实验课程(含基本统计分析软件应用、统计实务模拟等),社会实践(含经济社会统计调查、统计工作实习等),科研和论文写作(含毕业论文、学年论文、科研实践等)。专业实验包括计算机基本技能实验、统计分析应用软件实验、经济计量分析软件实验、数据挖掘技术与应用实验。
2.参照其他院校的培养方案和课程设置
它山之石,可以攻玉。我们选择了部分具有代表性的财经院校(如上海财经大学、中央财经大学、东北财经大学、西南财经大学、中南财经政法大学、北京工商大学、上海金融学院、 河南财经大学、浙江财经学院和山东工商学院)和综合类院校(如浙江大学、吉林大学、南京大学和云南大学)以及师范类院校(如北京师范大学、华东师范大学、东北师范大学、南京师范大学)作为参照院校。通过比较分析得出,在统计学经济统计、商务统计、金融统计方向中,财经类院校主要突出经济学课程,招生偏重理科生。综合性院校和师范类院校主要课程为理学类,招生偏重理科生。
综上所述,经济统计学专业应培养适应信息化社会需要,熟练掌握现代统计理论和经济数量分析方法,具有扎实的统计学、经济学和金融学基础,能熟练应用计算机软件处理统计数据的复合型高素质经济管理统计人才。学生毕业后可在政府部门、金融机构、外资企业和大中型公司等从事经济统计分析、管理咨询、市场调研和商务数据分析等管理工作。
3.与学院培养方案形式统一
新制订的培养方案和整个学院的形式保持了统一,以便于教务人员管理工作的开展。
二 经济统计学培养方案专业课的设置
经济统计学的培养目标与基本规格和招收对象为理科生,设置了保险精算、金融统计和商务统计三个方向。学生修满培养方案规定的学分并达到学位授予要求者,授予经济学学士学位。
由于经济统计学对统计学和经济学知识的要求较高,我们提高了课程总学分和总学时,注重主干学科和专业课程的开课顺序和教学周学时分配,强化实训实践课程,实行理论和实践并行。
培养方案确定了5门学科基础课程,分别为宏观经济学、微观经济学、C语言程序设计、概率论与数理统计、管理学。确定了5门专业基础课程,分别为基础会计学、经济统计学、货币金融学、财政学、计量经济学。确定了9门专业核心课程,分别为国民经济统计学、多元统计分析、统计预测与决策、抽样技术与应用、应用时间序列分析、金融统计学、市场调查与分析、投资学、数据挖掘。
分设了三个专业方向,分别为保险精算(开设保险学、保险统计学、利息理论、寿险精算、非寿险精算5门课程)、金融统计(开设商业银行经营管理、金融市场、金融资产评估、金融工具与金融风险管理、投资组合分析 5门课程)和商务统计(开设信息检索与利用、企业经营统计学、投入产出分析、项目管理、质量控制统计方法5门课程)方向。
关键词:实验平台;教学管理;数据仓库;数据挖掘
中图分类号:G642 文献标志码:B 文章编号:1674-9324(2013)09-0253-03
一、引言
21世纪是国家全面推进学生素质培养的时期,计算机专业课既具有较强的理论性,又具有较深的实践性。目前,计算机专业的教学过程中往往理论教育与实际脱节,很多学生通过了专业理论课的考试,却不能将理论付诸于实践,学生对课程知识并没有深刻的理解和消化,对课程理论的实际应用没有感观上的体验。经调查显示,60%以上的学生认为在校期间的计算机理论课的学习对就业和实际工作帮助不大,这给学生学习计算机理论的积极性带来了消极的影响,更有很多学生热衷于参加社会上的计算机培训机构,放弃在高校的课程学习。因此,在培养学生的理论创新能力的同时,提高学生的动手操作能力,加强学生理论联系实际的能力是计算机教学十分紧迫和必要的任务。
随着信息技术和网络技术的快速发展,在短短几年内数据仓库和数据挖掘就已经成为IT信息领域广泛应用和热点研究的领域。该领域主要是研究如何从浩如烟海的海量数据中有效地提取并挖掘知识,对其进行自动分析和汇总,是计算机行业中最热门、最有前景的领域之一[1]。数据仓库与数据挖掘课程也顺应计算机发展的需要,进入到高校计算机教育的专业课课程列表中。
本论文在深入研究了数据仓库和数据挖掘课程的内容和特点的基础上,采用B/S(Browser/Server)架构,即浏览器/服务器架构,开发了web课程教学实验平台。
二、数据仓库与数据挖掘学科教学现状
随着数据仓库与数据挖掘课程在各大高校成功试教后,近年来各大高校都为计算机专业都设立了数据仓库和数据挖掘课程,时至今日,其课堂理论教学已经比较成熟。然而,绝大多数学生在经过该课程的学习后,普遍反映虽然基本了解了数据仓库和数据挖掘相关理论知识,却缺乏感性认识和实践应用能力。这主要是因为该课程的实验教学较难开展,缺乏一个符合以下特点的教学实验平台。
市场中通用数据仓库和数据挖掘软件昂贵且难以使用,大量的专业术语、专业业务理论、数学知识和挖掘模型让人无从下手。因此我们需要的仅仅是一个实验平台,并非大型企业应用软件,只要学生能通过它更简易地完成该课程的实验环节即可。
1.可视化、易操作。可视化和易操作可以提高学生的学习兴趣,让学生更直观的参与到教学活动中来,而不是苦恼于如何使用该平成实验。
2.交互性。一个好的教学平台不仅是一个可以提供给学生传授知识的平台,还应该是一个可以和学生及老师有交互性的平台,并且使学生和学生有交互性,老师和学生有交互性[2]。
3.教学与实验相结合。我们需要不仅仅是一个数据仓库与数据挖掘实验软件,而是综合课程教学和课程实验的平台。教学与实验相结合、理论与实践并重,这才是计算机专业教育的核心。
4.拥有合理和充足的实验数据。对于一个实验平台来说,数据的缺乏将使得实验无法进行。尤其是对于数据仓库与数据挖掘这个特殊的领域,数据不仅要足够的多而且要合理,否则会严重影响实验结果和教学效果。
三、数据仓库与数据挖掘学科教学实验平台的构建
为适应教育发展需要,秉承深化教学改革的方针,改革数据仓库和数据挖掘课程原有的普通教学模式,启动了“数据挖掘课程设计平台建设”教学改革项目。该平台依托我校电信学院985平台的优良硬件环境,由远程开放实验平台服务器和终端PC机组成,其成本低廉、维护方便、部署容易。该实验平台服务器直接部署于本校的学院985实验基地,具有操作稳定性、鲁棒性和容错性。通过该实验教学平台,学生对该课程的学习过程将不受场地限制,只要通过网络就可以登录该平台。该平台主要框架如图1所示。
1.用户管理模块实现了对不同用户的权限设置、登录和注册等功能,超级管理员可以为普通学生用户分配权限。
2.实验平台模块给学生提供了算法模拟和试验的平台,主要分为以下两个部分。
(1)数据仓库的维度建模设计模块。雪花模型设计案例;星型模型设计案例;ETL抽取操作平台。
(2)数据挖掘算法实验模块。数据预处理程序实现算法平台;Apriori算法实验平台;ID3算法实验平台;BP算法实验平台;K-Mean和K-Medoid算法实验平台;C4.5算法和决策树算法实验平台;KNN算法实验平台;贝叶斯算法实验平台。
维度建模设计平台和数据挖掘算法实验平台模块是该平台的核心模块。
3.实验课程模块主要向学生介绍该实验课程的相关内容、教学大纲和教学任务,也包含数据仓库环境的具体安装和配置视频演示。
4.作业提交模块更是改变了传统的提交纸质作业的模式,让学生将动手完成的实验和相关作业通过该平台提交,一个学生一个账户,避免了作业抄袭和拷贝。学生提交的作业只要运行正确,按题目要求编程,不论采用何种语言或者何种算法都是可以的,并没有唯一性的标准答案。当实验课程考核的时候,学生能够通过作业提交系统向服务器提交指定课程内容的作业,供教师在线评阅和打分。
5.教学资源下载提供给学生自学的资料,给感兴趣的学生提供了进一步学习的捷径。
6.当有学生对实验环节和该课程有任何疑问,都可以登录在线答疑系统,给授课老师留言,这些信息都会以邮件的形式发送到授课老师的收件箱,从而实现即时的答复,让学生在第一时间接受老师的指导。当有问题重复出现三次以上,系统就会自动识别,将问题和答复展示在FAQ中,提供给更多的学生共享该问题和该问题的解答,避免重复提问,也给还未遇到该问题的学生共享和学习。在线答疑给学生和教师提供了交互、交流和学习的平台。
7.数据挖掘实验平台的在线代码编译环境主要采用gcc编译器,能够对学生提交的各种代码进行实时编译,给用户的感觉就像是在本地执行一样。它能够支持的在线运行编程语言包括java、C和C++等,给学生提供多样化的语言实现方式,体现了非机械化的计算机应试理念。
四、数据仓库与数据挖掘学科教学实验平台的教学效果
在数据仓库和数据挖掘课程中使用该教学实验平台,具有教育的先进性和优越性。
(一)建设了数据仓库和数据挖掘课程的实验教学体系
1.数据仓库和数据挖掘模型。本平台可以培养学生自己动手创建多维星型模型、多维雪花模型、缓慢变化维、ETL模型、数据立方体模型及其实例等,还可以增加学生对各类重要挖掘算法的特点和应用场景的理解,让学生在实验平台上体验基于数据仓库的主要数据挖掘算法。
2.模型评估。当学生创建完毕自己的数据仓库和数据挖掘模型后,可以通过调整不同的参数值和更改数据集来检验算法的输出结果,并通过记录在不同的应用场景下的参数值和结果值得到最优值。
3.优化创建模型和算法的性能。学生通过使用计算机领域中的一些经典优化技术,如创建位图索引、哈希索引、S-tree索引等来优化模型和算法的性能,并记录和比较不同优化技术对模型和算法的效率和响应时间的影响。
4.定期对学生所学实验内容进行测试,根据学生的实验测试结果对平台的远程实验操作功能进行改进和完善。
(二)部署和实施了基于网络的数据仓库和数据挖掘课程远程实验教学环境
本项目通过构建基于网络技术的远程实验教学平台,不仅给学生和教师提供这样一个教学实验平台,而且还实现了实验教学的网上开放式管理,改革原有相对封闭的实验教学模式为开放的实验教学模式,构建了一个符合实践教学环节需求、虚拟和真实环境相结合、基于Web的多应用场景的远程开放实验平台。
(三)基于采样评估证明了远程网络实验教学的可行性和优越性
根据采样评估结果,该系统体现了远程网络实验的可行性和优越性。在该平台真正投入使用之前,我们将一批学生分为两个组进行数据仓库和数据挖掘课程的学习,A组学生使用现有的课程教学方法,而B组学生使用该平台的远程实验教学环境。具体教学内容为多维数据模型和数据立方体的概念以及k-means聚类和Apriori关联分析算法。两组学生通过不同的教学方式学习后,对他们进行了问卷调查和统计,结果如图2所示。
从图2的数据结果可以看到,无论是从学生兴趣程度、作业完成度还是考试成绩的角度对两组学生的学习效果进行评估,使用该数据仓库与数据挖掘课程教学实验平台的教学方式都具有明显的优势。在实验过程中学生是主体,用所学知识发挥创造性思维进行实践。当实验取得结果时,不论结果成功与否,都能带给学生一定的鼓励,从而在某种程度上激发学生的创造力和积极性,真正加速问题解决和理论创新。因此,我们有理由相信该平台的使用可以极大地提高学生的学习兴趣,促进教学目标的实现。
五、结论
在计算机专业的教学中,如何提高学生的实践能力和独立解决问题的能力是当前高等教育发展的新形势下所面临的主要问题。本文首先介绍了基于数据仓库和数据挖掘课程的实验平台的整体架构,展示了该平台的优点,证明了该平台可以将课堂学习和课后练习、理论教育与工程实践有机结合,为实施更加行之有效的教学组织和教学管理模式提供了可能。只有教育者和学生充分认识到计算机课程中实验环节的重要性,更有效地利用现有的社会资源和计算机技术为我们的教育服务,专业学科教学模式和方法才能不断推陈出新,不断进步和发展。
参考文献:
[1]Jiawei Han,Micheline Kamber.Data Mining Concept and Technology[M].Beijing:China Machine Press,2007:10-12
[2]李旭晴.学科教学网站设计的应用探讨[J].计算机教育,2009,(02):1-2.
1 统计学介绍
统计学是认识现象规律的一种方法,它的特点是揭示现象量变到质变的规律,具有普适性。对于高校学科体系来说,统计学已经从经济学和数学中独立出来作为一级学科,足以表明统计学在理论研究与实际应用中的巨大作用。随着数据时代到来,统计学作为一门工具学科,越来越广地应用到生物、医药、物理、水利、工程技术、人文社科等其他学科的研究中,统计学专业课程设置向多样性发展,以期培养出能为社会所用的人才。
高校统计一般分为数理统计和经济统计两个方向,部分高校在理学院和经管学院分别设置统计学专业,比如:暨南大学经济学院的统计学专业学生获得的是经济学学位,信息科学技术学院的应用统计专业学生获得的是理学学位。虽然分为不同学院,设置的专业基础课程却有很大部分重叠。本文着重讨论经济统计专业人才培养现状。
2 人才培养目标
目前统计学人才培养目标是培养具有良好的数学基础和统计学、经济素养,掌握统计学基本理论和方法,能熟练运用统计软件分析数据,能在企事业单位从事统计调查、统计信息管理、数量分析等开发、应用与管理工作,或在金融、贸易等领域从事统计分析工作的复合应用型人才。
3 课程设置
高校统计学课程分为理论课程和实践教学课程。理论课程包括思想道德修养、中国近代历史、大学英语等通识课程,高等数学、概率论与数理统计、西方经济学等学科基础必修课程,财务管理、国际金融等基础选修课程,统计学、计量经济学、抽样调查、时间序列分析等专业必修课程,博弈论、非参数统计、数据挖掘、市场调研等专业选修课程。实践教学课程包括实习、学术活动和课程设计等。其中理论课程学分占总学分的80%左右,实践教学课程占总学分的20%左右。理论课程中通识课程和基础课程一般安排在大一和大二上学期;大二到大三主修专业必修课程和选修课程,专业课程大部分是理论课和实验课相结合,理论课主要讲授模型方法论,通过设计实验课,学习统计分析软件,并实现模型案例实证分析;大四理论课程基本结束,主修教学实习和课程设计。
高等学校核心课程体系尚属完善,大多数课程偏重理论教学,忽视实践教学,人才培养计划中未设置实践教学环节或者实践教学课时偏少。实践教学是以实践性知识为课程内容,以生成实践性知识为目标的课程。以实践过程和实践性知识的掌握为课程结构展开的起点,让学生在一定程度实践的基础上建构所需的理论知识,以教学实践任务为中心来组织课程内容,所需要的理论知识也围绕实践过程来选择、组织和学习,以实践过程作为学生学习的主要形式,并通过实践报告、实践表现等来评价学生的学习结果。实践课缩短了从理论向实践转化的时空上的滞后,比如市场调查分析,通过学生亲手设计调查问卷、选取合适的抽样方法展开问卷调查、后期问卷数据汇总分析,最终生成调查分析报告,在实践课程中加深统计专业知识的掌握和综合运用。因此,应适当提高实践教学课时比例。课程设置上,专业选修课程安排相对独立,忽视了与其他学科的交叉融合学习,可适当增加交叉学科基础知识的课程设置。
4 理论教学分析
教学方式上,大部分教师采取传统的课堂面对面教学,仍停留在传统统计专业教学模式。互联网时代,随着互联网+教育的兴起,由于网络课程的低成本和便利性,其在大学教育中占据越来越大的比重。微课、慕课等互联网教学模式,通过科学的设计将课程重点知识碎片化、网络化,便于更多学生随时随地进行学习,而现今大部分高校形式上鲜有统计学的慕课、微课等网络课程教学。教学手段上都是以理论讲解为主,专业知识枯燥无味,不能最大程度激发学生的学习兴趣,缺乏探讨式、研究式、报告式等多样化教学研讨形式。
课程设计是教师形成具体教学方案的过程,特别是对于统计学这门应用性、实践性都很强的课程,不仅要求学生能够熟悉和掌握统计学基本理论知识及常用的统计分析方法,更要求能够结合实际问题,应用最合适的统计方法,借助统计软件,完成对问题的研究分析,真正达到学以致用的目的。统计学课程的教学设计尤为重要。课程设计需要综合考虑教师自身教学技能、知识结构和教学经验,学生的知识储备情况和学习能力,课程本身所承载的信息技能。课程设计联系经济生活中的实际问题,有助于开拓学生的思维空间,学以致用、触类旁通,作为理论知识到实际应用的桥梁工程,合理规范的课程设计起到将抽象理论具化到应用的纽带作用。
教学内容上,统计软件应用教学大部分限于Excel、SPSS、Eviews等传统老旧的软件,以致大部分学生的毕业论文或者课程设计都是对照陈旧的教材生搬硬套,用SPSS或Eviews做一个简单的因子分析、主成分分析或者多元回归模型,而SAS、R语言、Python等功能强大兼具实用性的潮流软件学习课程欠缺。使用的教材着重对统计基础知识的讲解,对于变量选取、文本分析、随机森林等实用性强的模型讲解欠缺。
考核形式上,课程大部分以闭卷、开卷形式考核,造成学生只会死读书、读死书的弊病,灵活跳跃的逻辑思维能力和分析表述能力都是卷面考试考查不到而对于统计分析人员至关重要的能力。课程考核模式方面可以考虑加入分组开展调研、总结报告等开放式考核形式,变革考核情境,激发学生主动学习的积极性,在考核过程中塑造学生的统计思想。
5 实践教学分析
大学生实践学习分为实习和参加学术科研活动两方面。大学生实习课程一方面从传统意义上提高实践技能,另一方面转变为寻找就业的试水,本科生实习已经从过去的专业实践直接指向就业,学生可以在实习过程中对所学专业有客观实际的认识,不再局限于书本上教条案例,有助于学生拓展眼界,找到自身发展的兴趣点。对于应用性较强的统计专业,实习课程的开展、实习基地的选择、实习任务与时间的安排等都起到很重要的作用。实习基地的建设使学生在政府部门、企事业单位中了解部门统计、不同行业工作的内容和特点,拓宽学生的就业渠道。
高校学生实习有两种形式。一种是院系组织,建立校企合作实习基地,定期输送学生到实习岗位实践学习。大学中实习基地挂牌很多,但是限于学生和企业之间关于交通、住宿、实习时间等问题难以协调,或者受其他因素影响,实习基地能够提供给学生的实习机会较少。有待加强学校与企事业单位合作,建立友好长期的合作实习基地,为学生提供高质量的实习机会。另一种是学生自主寻找兴趣相关的实习机会,这一类实习需要付出较多的时间成本,很难找到专业对口的实习岗位,学生实习期间的安全问题也难以得到保障。校方应做好留底审核实习协议资料等工作,实时掌握校外实习的学生动向,确保实习的合法合规。
高校大学生参加实践竞赛等科研活动是培养创新型人才的有效途径。本科生参加实践竞赛有利于培养团队协作精神和创新精神,了解学科前沿动态,了解国家产业政策及区域社会经济发展问题,提高创新实践综合素质。另一方面也弥补了教师科研人员不足的问题。构建基于实践竞赛等科研活动的教学体系,对于学生明确学习目标、提升自主学习热情、培养科研兴趣具有积极推动作用。
科研竞赛方面,学校会给参加科研竞赛的学生学分奖励,提升学生在学术竞赛和科研活动上的积极性。目前各种国家级、省级科研竞赛有大创项目、挑战杯、数学建模竞赛、统计建模竞赛、数据挖掘竞赛、SAS数据分析大赛、市场调查大赛等。学生初期报名热情高涨,但常常由于指导教师欠缺、教学软件资源不足等原因,培训指导不能满足学生参加竞赛的知识需求,学生大部分是靠自学获取相关知识,竞赛结果不尽如人意。实践竞赛项目报名、培训、参赛等组织过程起着重要辅助作用,实践类竞赛项目的组织迫在眉睫。
6 总结
统计学的产生发展来源于实践,依赖于应用,并在应用过程中发展壮大,统计学的生命力就在于其能不断满足社会应用的需要。我国设有统计学及相关专业的高校数量也在明显增多。近些年来,随着信息产业发展,大数据环境对统计学专业的教学理念和教学模式产生变革性影响,统计基础的数据分析人才将是社会最需要的人才。针对当前统计学教学中存在的问题,以及统计学与其他学科的交叉融合这一事实,培养统计人才需要对高校统计学教学进行改革。
随着知识经济和信息时代的到来,信息量越来越大,统计工具越来越多地渗入其他学科的研究,信息处理技术愈加复杂。大数据时代的来临和大数据处理技术的发展,深深影响着统计学的发展。如何改革统计学专业课程设置?能否利用传统的统计理论和统计方法对海量数据做出快速、精准的处理?如何在大数据时代背景下培养符合市场需求的统计分析师或数据分析师?如何实现统计学基础方法论和数据挖掘的深度结合?如何将大数据处理技术融入相关统计学课程教学,探索统计工具和不同学科的融合,培养出创新型人才,以促进数据处理与分析技术的发展?这些都是在当前大数据背景下,统计教育工作者必须认真思考的问题。高校应从课程设计的开展及考核方式、实践性质类课程选择、实习课程调研、实践竞赛组织等方面改革完善统计学专业培养模式,做到与时俱进,合理设置专业课结构,平衡理论课与实践课的时间,拓宽实习面,完善竞赛组织工作,培养出创新型统计人才。