时间:2023-01-24 23:04:56
序论:在您撰写生物信息学论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。
一、生物信息学的产生
21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。
二、生物信息学研究内容
(一)序列比对
比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。
(二)结构比对
比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。
(三)蛋白质结构预测
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。
(四)计算机辅助基因识别
给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。
(五)非编码区分析和DNA语言研究
在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。
三、生物信息学的新技术
(一)Lipshutz(Affymetrix,Santaclara,CA,USA)
描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。(二)基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。
(三)新的数据工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。
参考文献:
一、正在出现的技术
Klingler(Lncytepharmaceuticals,PaloAlto,CA,USA)强调基因组学正推动制药业进入信息时代。随着不断增加的序列、表达和作图数据的产生,描述和开发这些数据的信息工具变得对实现基因组研究的任务至关重要。他谈到了Incytepharmaceuticals对大规模基因组数据和生物信息学的贡献。
Lipshutz(Affymetrix,Santaclara,CA,USA)描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。
二、基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务——基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。
Sali(Rockefelleruniversity,NewYork,NY,USA)讨论了同源蛋白质结构模建。比较蛋白质模建(comparativeproteinmodeling)也称为同源模建(homologymodeling),即利用实验确定的蛋白质结构为模式(模型)来预测另一种具有相似氨基酸序列的蛋白质(靶)的构象。此方法现在已经具有了足够的精确性,并且被认为效果良好,因为蛋白质序列的一个微小变化通常仅仅导致其三维结构的细微改变。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。
三、新的数据工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。
Markowitz(LawrenceberkeleyLaboratory,Berkeley,CA,USA)讨论了分布式数据库与局部管理的关系,以及用基于工具的方法开发分子生物学数据库(MDBs)的问题。许多方案当前正在促进搜索多种不同来源MDBs的数据,包括建立数据仓库;这要求对各种MDBs的组合有一种全局观,并从成员MDBs中装填数据入中心数据库。这些方案的主要问题是开发整体视图(globalviews),构建巨大的数据仓库并使集成的数据库与不断发展中的成员MDBs同步化的复杂性。Markowitz还讨论了对象协议模型(objectprotocolmodel,OPM),并介绍了支持以下用途的工具:建立用于文本文件或者关系MDBs的OPM视图;将MDBs作成一个数据库目录,提供MDB名称、定位、主题、获取信息和MDB间链接等信息;说明、处理和解释多数据库查询。Karp(SRIinternational,MenloPark,CA,USA)解释了Ocelot,一种能满足管理生物学信息需求的面向对象知识陈述系统(一种面向对象系统的人工智能版)。Ocelot支持略图展开(schemaevolution)并采用一种新的最优化并行控制机制(同时进行多项访问数据的过程),其略图驱动图形编辑器提供了交互式浏览和编辑功能,其注释系统支持数据库开发者之间的结构通讯。
Riley(MarinebiologicalLaboratory,WoodsHole,MA,USA)在讨论大肠杆菌蛋白质的功能同时,特别提到了GPEC数据库,它包括了由实验确定的所有E.coli基因的功能的信息。该数据库中最大比例的蛋白质是酶,其次则为转运和调控蛋白。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。
Glynais(NetGenics,Cleveland,OH,USA)认为生物信息学中最关键的问题之一是软件工具和数据库缺乏灵活性。但是,软件技术的发展已得到了其它领域如金融业和制造业的发展经验的借鉴,可以使来自不同软件商的运行于各种硬件系统的软件共同工作。这种系统的国际标准是CORBA,一种由250多个主要软件和硬件公司共同合作开发的软件体系。联合使用CORBA和Java可以开发各种通过一个公用用户界面访问任何种类的数据或软件工具的网络应用软件,也包括生物信息学应用软件。Overton不同意Glynias的这种想法,他强调说CORBA仅对软件集成有用,不兼容的数据库软件可能是计算生物学所面临的最困难问题,一些制药公司和数据库仓库最近资助了一项用OCRBA链接不同的数据库的计划[2,3]。
四、制药先导的发现
Burgess(Sturcturalbioinformatics,SanDiego,CA,USA)讨论了填补基因组学和药物设计之间鸿沟的蛋白质结构中的计算问题。在缺乏主要疾病基因或药物靶的精确描述数据的情况下,药物设计者们不得不采用大规模表达蛋白质筛选方法;而结构生物信息学则采用一种更为实用有效的计算方法直接从序列数据中确定靶蛋白质的活性位点的精细结构特征,它利用一种集成专家系统从现实的或虚拟的化学文库中进行迅速的计算筛选,可以达到一个很大的规模。
Elliston(Genelogic,Columbia,MD,USA)讨论了治疗药物开发中发现新的分子靶的过程,着重讨论了基因发现方法。他认为,随着日益临近的人类基因组测序的完成,几乎全部基因的特征将在序列水平得到揭示。但是,对基因的认识将有赖于更多的信息而不仅仅是序列,需要考虑的第一类信息是转录表达水平信息,而Genelogic公司的GeneExpress就是一个由mRNA表达谱、转录因子位点、新基因和表达序列标签组成的数据库。
Liebman(Vysis,Downessgrove,IL,USA)介绍了Vysis公司开发的计算和实验方法,这些主法不仅用于管理序列数据,而且被用于以下用途:分析临床数据库和自然—突变数据库;开发新的算法以建立功能同源性(区别于序列同源性)模拟生物学通路以进行风险评估;药物设计的靶评估;联系复杂的通路特性以便识别副作用;开发疾病发展的定性模型并解释临床后果。
随着发现的新基因的日益增多,这个问题显得格外重要:基因的功能是什么?Escobedo(Chirontechnologies,Emeryville,CA,USA)提出了这个问题的一种方法:将分泌蛋白质的基因的功能克隆与筛选这些克隆(可能的药物靶)结合起来。在这种方法中,在微粒体cDNA文库池中进行体外翻译避免了劳动密集的克隆、表达和纯化步聚,对文库池中的翻译产物在细胞水平进行筛选,测试其在细胞增殖和分化中的作用。例如,在用这种方法识别的111个克隆中,56个属于已知的分泌蛋白质,25个为膜相关蛋白,另外30个功能未知,可能是新的蛋白质。一种相似的方法在转移到小鼠模型系统中的基因传导载体中构建分泌蛋白质的cDNA文库来克隆特定的功能基因。
Ffuchs(Glaxowellcome,ResearchTrianglePark,NC,USA)讨论了生物信息学更为广义的影响:它不仅影响到新药物靶基的发现,还对改善药物开发的临床前期和临床期的现状极具重要性。众所周知,涉汲数以千计病人的临床试验(可能是药物开发最为花钱的部分)的设计不论多么仔细,也不能为正确的药物选择正确的病人。而在基因组水平划分病人群体的方法可以大大改善发现新药的效率。Fuchs介绍了一种将病人的基因型和表型标志结合起来以改善临床前期和临床期药物开发过程的系统GeneticinformationSystem.他强调将遗传学和生物信息学数据同化学、生物化学、药理学和医学数据连接起来的集成信息管理和分析方法是极其重要的。
Green(HumanGenomeSciences,Rockville,MD,USA)介绍了他的测序工作中采用的数据管理工具。基于EST的测序方法所面临的挑战是,在对几百个cDNA克复测序之后,产生的数据堆积如山。由于大多数人类基因都是用这种方法发现并在么有数据库中分类编排的,面临的识别开放读框、重叠序列的重叠图谱、组织特异表达和低丰度mRNA基因的任务是令人生畏的。HumangenomeSciences公司开发了一些可用户化数据库工具,在同一个数据库中可包括以下功能:WWW上访问和检索数据,序列拼接,临视潜在药物靶基因的研究进展等。这些能够管理多项任务——从注释基因序列到成功开发基因产物进入药物发现的流程——的软件工具,极其可望从一种基于基因组知识的药物发现方法中得到新的药物靶。
Summer-Smith(Base4bioinformatics,Mississauga,Ontario,Canada)描述了一种相关的策略。药物发现阶段中所要求的软件工具的任务是多样化的,要能注释基因,并阐明它的生理和病理功能及其商业潜质。对这样多种来源的信息的集成与分析,在派生的、项目取向的数据库(project-specificdatabase,PSD)中可以很好完成。由于项目贯穿于发现到开发全过程,其间又不断加入背景的成员,PSD在项目的管理与发展中成为一种关键性的资源。
按照Smith(Bostonuniversity,Boston,MA,USA)的观点[2],我们并不需要更快捷的计算机或更多的计算机科学家,而是需要更的生物学家和生物化学家来解释序列的功能。这对有些软件或硬件专家来说是个打击,但生物学系统的复杂性是令人生畏的,并且对基因功能的认识可能需要生物学方法和计算方法的结合。探索基因的功能很可能要花费生物学家们数十年的时间,本次会议表明没有任何单一的方法可以得出一个答案;但是,将计算生物学同大规模筛先结合起来识别一种化学靶物(hit)是一种产生化学工具来探索基因功能的方法,这些化学工具接下来就可以用作理解基因功能的“探针”。这种方法在Butt(GeneTranscriptionTechnologies,Philadelphia,PA,USA)的描述中,既是一种检查基因功能的简单方法,也是为潜在的药物靶发现化学先导物的简单方法,他描述了一种可以在酵母中重建人类基因功能的酵母大规模筛选系统。在此系统中,可以迅捷地在一个化学文库中发现配基。这种技术的重要特征是它不仅仅是发现一种药物靶的配基的筛板(screen),相反,由于该系统的高速度,它也是发现先导靶基因的一种筛板。过去,世界上的制药公司通常在某一时间内仅能对有限数目(约20多个)的药物靶基因进行工作,鉴于此,我们需要根本不同的方法如基因组学来打开通向“新”生物学的通路。由于机器人和合成化学的进步,药物发现中最关键的问题不再是得到一种先导化合物(leadcompound),而是得到导向靶基因。此次会议为从计算和实验方法中发展出的新生物学迈出很好的一步。
参考文献
1LimHA,BatttR.TIBTECH,1998;16(3)):104
关键词:推荐系统;生物信息学
推荐系统(RecommenderSystem)[1]是个性化信息服务的主要技术之一,它实现的是“信息找人,按需服务”;通过对用户信息需要、兴趣爱好和访问历史等的收集分析,建立用户模型,并将用户模型应用于网上信息的过滤和排序,从而为用户提供感兴趣的资源和信息。生物信息学(Bioinformatics)[2,3]是由生物学、应用数学和计算机科学相互交叉所形成的一门新型学科;其实质是利用信息科学的方法和技术来解决生物学问题。20世纪末生物信息学迅速发展,在信息的数量和质量上都极大地丰富了生物科学的数据资源,而数据资源的急剧膨胀需要寻求一种科学而有力的工具来组织它们,基于生物信息学的二次数据库[4]能比较好地规范生物数据的分类与组织,但是用户无法从大量的生物数据中寻求自己感兴趣的部分(著名的生物信息学网站NCBI(美国国立生物技术信息中心),仅仅是小孢子虫(Microsporidia)的DNA序列就达3399种),因此在生物二次数据库上建立个性化推荐系统,能使用户快速找到自己感兴趣的生物信息。特别是在当前生物信息数据量急剧增长的情况下,生物信息学推荐系统将发挥强大的优势。
1推荐系统的工作流程
应用在不同领域的推荐系统,其体系结构也不完全相同。一般而言,推荐系统的工作流程[5]如图1所示。
(1)信息获取。推荐系统工作的基础是用户信息。用户信息包括用户输入的关键词、项目的有关属性、用户对项目的文本评价或等级评价及用户的行为特征等,所有这些信息均可以作为形成推荐的依据。信息获取有两种类型[6],即显式获取(Explicit)和隐式获取(Implicit),由于用户的很多行为都能暗示用户的喜好,因此隐式获取信息的准确性比显式高一些。
(2)信息处理。信息获取阶段所获得的用户信息,一般根据推荐技术的不同对信息进行相应的处理。用户信息的存储格式中用得最多的是基于数值的矩阵格式,最常用的是用m×n维的用户—项目矩阵R来表示,矩阵中的每个元素Rij=第i个用户对第j个项目的评价,可以当做数值处理,矩阵R被称为用户—项目矩阵。
(3)个性化推荐。根据形成推荐的方法的不同可以分为三种,即基于规则的系统、基于内容过滤的系统和协同过滤系统。基于规则的推荐系统和基于内容过滤的推荐系统均只能为用户推荐过去喜欢的项目和相似的项目,并不能推荐用户潜在感兴趣的项目。而协同过滤系统能推荐出用户近邻所喜欢的项目,通过用户与近邻之间的“交流”,发现用户潜在的兴趣。因此本文所用的算法是基于协同过滤的推荐算法。
(4)推荐结果。显示的任务是把推荐算法生成的推荐显示给用户,完成对用户的推荐。目前最常用的推荐可视化方法是Top-N列表[7],按照从大到小顺序把推荐分值最高的N个事物或者最权威的N条评价以列表的形式显示给用户。
2生物信息学推荐系统的设计
综合各种推荐技术的性能与优缺点,本文构造的生物信息学推荐系统的总体结构如图2所示。
生物信息学推荐系统实现的主要功能是在用户登录生物信息学网站时,所留下的登录信息通过网站传递到推荐算法部分;推荐算法根据该用户的用户名从数据库提取出推荐列表,并返回到网站的用户界面;用户访问的记录返回到数据库,系统定时调用推荐算法,对数据库中用户访问信息的数据进行分析计算,形成推荐列表。
本系统采用基于近邻的协同过滤推荐算法,其结构可以进一步细化为如图3所示。算法分为邻居形成和推荐形成两大部分,两部分可以独立进行。这是该推荐系统有别于其他系统的优势之一。由于信息获取后的用户—项目矩阵维数较大,使得系统的可扩展性降低。本系统采用SVD矩阵降维方法,减少用户—项目矩阵的维数,在计算用户相似度时大大降低了运算的次数,提高了推荐算法的效率。
(1)信息获取。用户对项目的评价是基于用户对某一个项目(为表示简单,以下提及的项目均指网站上的生物物种)的点击次数来衡量的。当一个用户注册并填写好个人情况以后,系统会自动为该用户创建一个“信息矩阵”,该矩阵保存了所有项目的ID号以及相应的用户评价,保存的格式为:S+编号+用户评价,S用于标记项目,每个项目编号及其评价都以“S”相隔开;编号是唯一的,占5位;用户评价是用户点击该项目的次数,规定其范围是0~100,系统设定当增加到100时不再变化。这样做可防止形成矩阵时矩阵评价相差值过大而使推荐结果不准确。(2)信息处理。信息处理是将所有用户的信息矩阵转换为用户—项目矩阵,使用户信息矩阵数值化,假设系统中有M个用户和N个项目,信息处理的目的就是创建一个M×N的矩阵R,R[I][J]代表用户I对项目J的评价。
(3)矩阵处理。协同过滤技术的用户—项目矩阵的数据表述方法所带来的稀疏性严重制约了推荐效果,而且在系统较大的情况下,它既不能精确地产生推荐集,又忽视了数据之间潜在的关系,发现不了用户潜在的兴趣,而且庞大的矩阵增加了计算的复杂度,因此有必要对该矩阵的表述方式做优化,进行矩阵处理。维数简化是一种较好的方法,本文提出的算法应用单值分解(SingularValueDecomposition,SVD)技术[8],对用户—项目矩阵进行维数简化。
(4)相似度计算。得到降维以后的用户矩阵US,就可以寻找每个用户的近邻。近邻的确定是通过两个用户的相似度来度量的。本文采用Pearson相关度因子[9]求相似度。(5)计算用户邻居。该方法有两种[10],即基于中心的邻居(Center-BasedNeighbor)和集合邻居(AggregateNeighbor)。本系统采用了第一种方法,直接找出与用户相似度最高的前N个用户作为邻居,邻居个数N由系统设定,比如规定N=5。
(6)推荐形成。推荐形成的前提是把当前用户的邻居ID号及其与当前用户的相似度保存到数据库中,而在前面的工作中已找出各用户的邻居以及与用户的相似度,推荐形成部分只需要对当前登录用户进行计算。推荐策略是:对当前用户已经访问过的项目不再进行推荐,推荐的范围是用户没有访问的项目,其目的是推荐用户潜在感兴趣的项目;考虑到系统的项目比较多,用户交互项目的数量很大,所以只筛选出推荐度最大的N个项目,形成Top-N推荐集,设定N=5。
3生物信息学推荐系统的实现
生物信息学推荐系统的实现可以用图4来表示。数据库部分主要存储用户信息和项目信息,用SQLServer2000实现。
数据访问层实现了与用户交互必需的存储过程以及触发器,也使用SQLServer2000,主要完成以下功能:初始化新用户信息矩阵;插入新项目时更新所有用户的信息矩阵;用户点击项目时更新该用户对项目的评价;删除项目时更新所有用户的信息矩阵。用户访问层主要涉及网页与用户的交互和调用数据访问层的存储过程,在这里不做详细的介绍。
推荐算法完成整个个性化推荐的任务,用Java实现。(1)数据连接类DataCon。该类完成与SQLServer2000数据库的连接,在连接之前必须要下载三个与SQLServer连接相关的包,即msutil.jar、msbase.jar和mssqlserver.jar。
(2)数据操作类DataControl。该类负责推荐算法与数据库的数据交换,静态成员Con调用DataCon.getcon()获得数据库连接,然后对数据库进行各种操作。把所有方法编写成静态,便于推荐算法中不创建对象就可以直接调用。
(3)RecmmendSource与CurrentUserNeighbor。这两个类作为FCRecommand类的内部类,RecmmendSource用于保存当前用户的推荐列表,包括推荐项目号和推荐度;CurrentUserNeighbor用于保存邻居信息,包括邻居ID号、相似度及其访问信息。
(4)协同过滤推荐算法FCRecommand。该类实现了整个推荐算法,主要分为邻居形成方法FCArithmetic和推荐形成方法GenerateRecommend。
下面给出方法FCArithmetic的关键代码:
Matrixuser_item=this.User_Item_Arry();//获取用户—项目矩阵
user_item=this.SVD_Calculate(user_item);//调用SVD降维方法
Vectorc_uservector=newVector();//当前用户向量
Vectoro_uservector=newVector();//其他用户向量
Vectorc_user_correlate_vector=newVector();
//当前用户与其他用户之间相似度向量
for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));
//1.获得当前用户向量
for(intk=0;ko_uservector.clear();
for(intl=0;lo_uservector.addElement(user_item.get(k,l));
//2.获得其他用户的向量
//3.计算当前用户与其他用户的相似度
usercorrelativity=this.Correlativity(c_uservector,o_uservector);
c_user_correlate_vector.addElement(usercorrelativity);
}
//4.根据当前用户与其他用户的相似度,计算其邻居
this.FindUserNeighbor(i,c_user_correlate_vector);
}
根据邻居形成方法FCArithmetic,可以得到每个用户的邻居。作为测试用例,图6显示用户Jack与系统中一部分用户的相似度,可以看出它与自己的相似度必定最高;并且它与用户Sugx访问了相同的项目,它们之间的相似度也为1,具有极高的相似度。
4结束语
在传统推荐系统的基础上,结合当前生物信息学网站的特点,提出一个基于生物信息平台的推荐系统,解决了传统生物信息网站平台信息迷茫的缺点,为用户推荐其感兴趣物种的DNA或蛋白质序列。
优点在于协同过滤的推荐算法能发现用户潜在的兴趣,能促进生物学家之间的交流;推荐算法的邻居形成与推荐形成两部分可以单独运行,减少了系统的开销。进一步的工作是分析生物数据的特点及生物数据之间的关系,增加用户和项目数量,更好地发挥推荐系统的优势。
参考文献:
[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.
[2]陈新.生物信息学简介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.
[3]林毅申,林丕源.基于WebServices的生物信息解决方案[J].计算机应用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次数据库建立及应用[J].计算机系统应用,2004(11):58-60.
[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.
[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.
[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.
[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.
关键词:医学检验;生物信息学;课程教学
近年来,生物信息学在各医药院校越来越受到重视,多所院校相继在研究生教学中开设了生物信息学课程[1]。而对于医学本科层次是否需要开设生物信息学课程这一问题,虽然目前各方面的观点不一,但是已经有一些院校开始进行尝试。目前医学检验专业(五年制,毕业时授予医学学士学位)已调整为医学检验技术专业(四年制,毕业时授予理学学士学位),而生物信息学作为一门新课程,在医学检验(技术)专业学生培养中的作用正日益受到关注,逐步被某些院校选择作为必修课或者选修课。
一、开设课程的必要性
空前繁荣的生物医学大数据的产出,及其蕴含的重大生命奥秘的揭示,将决定现代生命科技和医药产业研发的高度,决定人们对疾病的认识和掌控能力,也将对主导生物医学大数据存储、管理、注释、分析全过程,解决生命密码的关键手段———现代生物信息学技术的发展带来前所未有的机遇和挑战[2]。对于医学专业学生而言,通过学习生物信息学,从而掌握利用各种网络信息资源来检索和获取生物信息数据,并选择和使用各种生物信息学软件来分析数据。在当今大数据时代,这方面的知识和技能的培养对于医学生今后从事医学科研工作是非常重要的。因此,在医学专业学生中开设生物信息学课程非常必要。我校从2010年开始将生物信息学设置为研究生教学的必修课;从2013年开始在医学检验专业中开设生物信息学选修课,自2015年开始转为医学检验技术专业。在医学检验技术专业中开设生物信息学课程,能够为该专业学生的临床和科研方面的素质积累提供必要的支持,更重要的是增强了在医学和信息科学交叉领域解决问题的技能,其意义几乎等同于在研究生教学中的设课意义。
二、教学内容的安排
医学检验技术专业的教学任务非常紧张,几乎将原来医学检验专业前八个学期(最后两个学期为实习阶段)课程压缩到六个学期来完成,学生学习压力可想而知。我校为了减轻学生负担,各课程的课时数都比医学检验专业有所减少。但生物信息学并未改变,仍然为16学时。为了在较短的学时内实现教学效果的最大化,我们结合该专业学生的特点和需求,将授课内容分为理论课和实践课两部分,实践课不占学时。理论课主要介绍基本的生物信息学理论、资源和数据的获取、分析方法和工具的使用;实践课则通过布置作业,课后上机操作来解决问题。理论课主要内容包括:生物信息学导论、DNA测序技术、序列的获取、双序列比对、多序列比对、蛋白质结构分析和预测共计六个专题。实践课主要内容包括:cDNA及基因组参考序列的获取;常见序列格式的释义与转换;双序列比对(局部比对);多序列比对(全局比对);蛋白质综合信息查询;蛋白质基本性质、疏水区、亚细胞定位、信号肽、跨膜区、模体及结构域分析与二级结构预测;蛋白质三级结构预测。在理论课实施过程中,注重将与生物信息学相关的生命科学和医学前沿的一些最新进展和最新成果引入理论知识讲授中,让学生在有限学时内能够进一步认识生物信息学的内涵和课程的价值,追踪前沿学科的动态,开拓视野。
三、教学方法的设计
生物信息学涉及多个学科领域,交叉性强,在较短的学时内学好这门课程的难度很大。学生的学习兴趣与教学内容和手段关系密切,除了精心选择教学内容外,教学方法上也有很多需要革新乃至创新的地方。在教学过程中,我们形成了颇具特色的教学经验,由授课教师独创的授课———实践———演示(Teaching-Practicing-Showing,TPS)教学模式已应用于教学。TPS教学模式着力于以实际问题为引线,将理论授课与上机实践有机地融为一体,逐步介绍生物数据分析的各项技能,并指导学生将其融会贯通以真正掌握相关的基本方法与常用工具。首先,在教学内容上引入具体实例来进行教学,比如讲解生物信息数据库(Gene、Nucleotide、UniProt、PDB等)时,通过给出检索某个人类疾病基因数据的例子来学习数据库的使用方法。课堂上教学实例的设计需要任课教师在备课时投入大量精力来完成,还需要教师具备多学科交叉的知识。教学实践表明,与医学相关的生物信息学分析实例可以让学生更好地认识该课程的作用,大幅度提高学生的学习兴趣和学习的主动性。此外,课堂教学手段也应该丰富多彩,多媒体教学中可以充分使用图片、动画等元素。其次,举例分析时可以进行一定的现场演示,比如讲解检索Unigene数据库时可以一边上网演示一边解释说明。
四、考核方式的变革
生物信息学作为选修课,既要遵循学校相关的考试制度,也要通过对考试方式的变革来提高考试效果。我们将理论考核与学生的实践能力考核联系起来,结合学生课外实践任务的完成情况和开卷考试成绩进行综合评定。在课程中安排一次课外实践任务,要求每位学生独立完成相关分析并提交书面分析报告,该部分占考核成绩的20%。具体内容为自行选择一个人类细胞外功能蛋白:1.利用ClustalX对各物种参考蛋白序列进行多序列比对(输出PS格式结果);2.分析分子量、等电点、分子式、稳定性、亲疏水性及亚细胞定位;3.预测二级结构并模拟三维结构。课程结束后进行开卷考试,内容包括基础知识和综合分析,尽量采取灵活的出题方式,并控制题量,该部分占考核成绩的80%。近年来的教学实践表明,这种综合评定的方式能够反映学生对该课程的掌握程度,体现学生利用生物信息学知识解决问题的能力。
五、展望
实践表明,生物信息学课程教学能够给学生提供所需要的生物信息学知识和技能,但是在教学内容安排、教学方法设计、教学手段使用和教学效果评价等诸多环节都需要进一步探讨。在这个过程中,我们既需要吸收传统教学模式中的优点和精髓,做到严谨和切合实际,又需要更新教学理念,突出医学特色,大胆尝试新的教学方法和手段,最终形成本课程别具一格的教学特色。
作者:伦永志 单位:大连大学
参考文献
一、引言
随着生物科学的发展,只有定性的结论已不能满足实践的需要,实现生物科学结论定量化是人们长期追求探索的目标;生物统计学是生物学科定量化的重要分析理论与方法,生物统计学是生物学科应具备的基本知识和素质,与生命活动有关的各种现象中普遍存在着随机现象,大到森林陆地生态系统,小至分子水平,均受到许多随机因素的影响,表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生命科学各专业的专业基础课,对后续生命科学课程学习和生物科研有重要作用。
同时,生物统计作为数理统计在生本论文由整理提供物学领域的应用,是教学难度较大的一门课程。因此,在生物统计学精品课程建设过程中,针对各专业培养目标的定位,因材施教,更新教育理念,加强实践训练,在教学方法和教学手段上进行改革和大胆探索。
二、二十一世纪对生物统计学课程的重新定位
(一)新世纪对生物统计学课程提出的新要求。
二十世纪上半叶农业和遗传统计学首先获得了发展,在其基础上发展起来的生物统计学、统计流行病学、随机化临床试验学已经成为攻克人类疾病的一个里程碑。这在过去的半个世纪里显著提高了人类的期望寿命。
21世纪人类基因组,基因芯片等实验科学产生出的巨量数据,需要新工具来组织和提取重要信息。
将数据转化为信息需要统计理论和实践本论文由整理提供方面的洞察力、技术和训练。
未来的生物统计学将会与信息技术密切结合,较少侧重传统数理统计,而会更多注意数据分析,尤其是大型数据库的处理。生物统计学越来越不同于其它数学领域,计算机和信息科学工具至少和概率论一样重要。
(二)生物统计学对大学生素质培养的作用。
生物统计学的一个重要特点就是通过样本来推断和估计总体,这样得到的结论有很大的可靠性但有一定的错误率,这是统计分析的基本特点,因此在生物统计课程的学习中培养了一种新的思维方法———从不肯定性或概率的角度来思考问题和分析科学试验的结果。
生物统计学是通过个别的试验研究得出其一般性结论,属于归纳推理的范畴。但其有别于简单枚举法和科学归纳法,是一种或然性归纳推理或者概率归纳推理。在生命科学的研究中绝大多数涉及到的是随机事件,因此,生物统计学不仅是试验设计与统计方法的教学,更重要的还是大学生思维方式的培养,这对提高大学生的素质很有必要。
生物统计学包括试验设计和统计方法两个有机联系的组成部分。通过试验设计的教学可提高大学生设计研究课题试验方案的能力,使之明确课题的研究目的、试验因素与水平以及试验设计方法等方面的内容。通过统计方法的教学除让学生弄清各种统计方法的内涵外,还需要使学生能够正确地选择最适合的统计方法,以揭示资料潜在的信息,达到研究的最终目的,从而提高大学生科学研究素质。
三、教学方法和教学手段的改革
(一)加强电子课件及网络平台本论文由整理提供建设。
生物统计学是应用概率论和数理统计原理研究生物界数量变化的学科,而概率统计的理论和思维方法对本科生来说有一定的难度,加之课程学时的减少(由原来的60-70学时,降到现在的40学时左右),如何深入浅出地引导学生入门,并使学生在了解概率统计思想的基础上,掌握常用统计分析方法的应用及使用条件是课程的教学难点。为此,我们利用多媒体技术,制作了与教材配套的课件,通过在课堂上把抽象内容形象化与直观化,收到了良好教学效果。建设了一个生物统计学教学网络支撑平台,现有课程简介、教学大纲、师资力量、授课教案、电子版《生物统计学》教材、课程录像、实习指导、在线测试题、参考文献、其它教学资源等栏目,免费向全校师生开放。
(二)将多媒体教学优势与学生的认知规律有机结合,用较少的学时得到良好的教学效果。
多媒体具有信息量大、形象化、直观化的特点。
但是如果不能很好地将多媒体这些特点与学生的认知规律相结合,多媒体教学就可能会带来一些弊端诸如:(1)内容多,幻灯片变换快,由照本宣科变为照屏宣科,为新的“满堂灌”;(2)课件图片多,内容以展示为主,缺乏启发性;(3)教学内容常用满屏的方式显示(即所谓“死屏”),老师照着屏幕上的内容给学生讲解,失去了传统教学方法,老师边讲边板书能给学生留下比较深刻印象的特点,缺乏吸引力。
而多媒体在教学中只能充当工具的角色,在教学过程中必须将多媒体信息量大、形象化、直观化的特点与学生的认知规律紧密结合在一起。在制作课件时,采用启发式教学方式,精炼教学内容,模仿传统教学书写板书的过程,根据教学内容的难易程度,采用逐字、逐句、逐段显示教学内容的动画方式。在课堂教学中,老师仍然保持传统教学方法的教姿教态,在授课的过程中与学生保持互动,根据学生在课堂上接受知识的能力,掌握屏幕上显示内容的速度,必要时辅以板书进行讲解。这样做既发挥了多媒体教学的特点,又充分照顾到学生的认知规律,在内容没本论文由整理提供有缩减,学时减少近三分之一的情况下,仍然取得良好的教学效果。
(三)长期坚持教育教学方法及教学规律的研究。
生物统计学的理论基础是概率论与数理统计,从这个层面上讲,它有非常浓的数学味道,但是它又有别于概率论与数理统计,生物统计学更主要强调的是概率论及数理统计的思想和方法在解决生命科学中一些具体问题的应用。因此在教学过程中就存在一个“度”的把握问题,如果将概率论及数理统计的原理讲得太多,一是学时不允许,二是学生难以消化,得不到好的教学效果;如果只注重方法的讲解,学生知其然不知其所以然,就会误入乱套公式的歧途。经过将教学的重点放在教学中引导学生重点掌握统计方法的功能与用途,方法与步骤,防止各类方法的误用,淡化定理的证明与公式的推导。在教学内容的安排上采用“保干削枝”,即在学时减少很多的情况下,将一些次要的统计方法去掉,也要保证有足够的学时讲授理论分布与抽样分布、统计假设测验等方面的内容,让学生掌握生物统计学中所蕴含的概率论及数理统计的思想精髓,从而避免学生乱套统计公式。
(四)密切跟踪生命科学发展的前沿动向,探索生物统计学解决前沿问题的理论与方法。
统计学在生物学中的应用已有长远的历史,本论文由整理提供许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。现在基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生物科技领域上扮演着不可或缺的角色。
在课程建设中,随时注意纳入生物统计学在前沿领域研究应用的内容,增强课程的活力,提高教师和学生面向生物产业主战场解决实际问题的能力。
四、加强实践教学,注重学生能力培养
生物统计学要不要开实验课,怎样开实验课,一直存在争议,在此认为生物统计学不仅应该开设实验课,而且还要将实践教学的重点放在计算机技术和统计软件的应用上,让学生不仅掌握统计方法,而且加深对原理的认识,获得就业或升学的必备计算机统计技能,提高解决复杂问题的能力。
(一)开展统计软件的实习,扩大学生的视野,提高学生素质。
20世纪20年展起来的多元统计方法虽然对于处理多变量的种类数据问题具有很大的优越性,但由于计算工作量大,使得这些有效的统计分析方法一开始并没有能够在实践中很好推广开来。而电子计算机技术的诞生与发展,使得复杂的数据处理工作变得非常容易,所以充分利用现代计算技术,通过计算机软件将统计方法中复杂难懂的计算过程屏障起来,让用户直接看到统计输出结果与有关解释,从而使统计方法的普及变得非常容易。在课程体系改革中,各课程的教学时数与达到培养目标所需完成的教学内容相比还是不足的。为此,可以通过标准的统计软件的教学实习来达到以点带面,扩大学生视野,提高学生素质。超级秘书网
为此我们建立了一个专用于实习教学的生物统计电脑实验室。现共有50余台电脑,并连接到校园网。实验室配备有指导教师,负责对上机的学生答疑。除按教学计划进行的正常实习教学外,实验室还对优秀学生免费开放,鼓励他们结合教师的科研活动,应用所学生物统计学知识,学习新的生物统计学知识,掌握应用计算机解决生物统计学问题的技能。
(二)全方位、多层次的实践教学。
为了进一步培养学生实际动手能力和科学严谨的治学态度,必须将本课程的实践教学活动延伸到课堂教学外,开展全方位、多层次的实践教学。
在原绵阳农专期间,主要在作物育种、作物本论文由整理提供栽培、动物营养等课程实验与实习中,根据相关内容加入了试验设计方法以及数据统计分析的相关内容。
组建了西南科技大学生命科学与工程学院以后,由原来的单一农科专业变成了理、工、农三大学科均有专业的格局。虽然专业的学科归属不同,但有一点是相通的,其内涵均属于生命科学的范畴。以科学研究的方法进行划分,均属于实验科学。
掌握正确的实验设计方法,从不确定性数据中挖掘事物的客观规律,是实验科学工作者必备的技能。因此,我们将原来只是在农科专业上延伸实践教学的作法推广到全院的所有专业,结合实验课教学的改革,对发酵工艺学实验、植物细胞工程实验、食用菌实验、微生物学实验等课程的内容全部或部分改为用生物统计学指导学生自主进行实验设计,把过去单一的实验流程、样品观察或检测实验改变为试验条件的优化试验,提出在不同条件下对样品测定的比较试验设计、单因素试验设计、多因素试验设计、正交试验设计、均匀试验设计,对试验结果要求学生使用统计学的方法对进行分析和讨论,最后得出最佳试验条件。
这样的实验教学改革起到了一箭双雕的作用,从专业基础课或专业课的角度看,改验证性实验为设计型、综合性实验,增强了学生解决实际问题的能力,培养了学生创新思维的能力;从生物统计学角度看,将课程的教学实践延伸到课程外,弥补了学时的不足,更重要的是学生将自己学到的统计学知识,转化为解决实际问题的能力,知识得到很好的内化。
此外,在学生课外科技活动中指导学生选用正确的实验设计和数据的统计分析方法,提升科技作品的档次;在毕业论文(设计)中要求学生采用恰当的生物统计学方法进行设计与分析,写出高质量的毕业论文(设计)。
通过这样的教学实践,训练了学生的统计思维能力,使学生充分认识到掌握生物统计学这一工具的重要性和必要性,增强了学生学好用好这门工具的信心,提高了学生从复杂的生命现象中挖掘事物客观发展规律的能力。
精品课程是集科学性、先进性、教育性、整体性、有效性和示范性于一身的优秀课程。作为精品课程的载体,应具有一流的教师队伍、一流的教学内容本论文由整理提供、一流的教学方法、一流的教材、一流的教学管理等特点。与之相比,我们在生物统计学精品课程的建设上,才刚刚起步,今后还要在教材建设、师资队伍建设、科学研究等方面加大力度,将生物统计学建设成体现现代教育教学思想、符合现代科学技术和适应社会发展进步的需要、能够促进学生的全面发展而深受学生欢迎的一门课程。
(一)教师应通过积极主动的学习和应用,不断加深对信息技术的认识我认为,要想实现信息技术和生物学科的“整合”,教师首先要对信息技术有一个全面的认识,至少每一位教师要能熟练使用电脑,平时要经常主动上网搜集各种与生物学科相关的信息资料来丰富自己的课堂教学资源,并结合课堂教学内容经常动手制作PPT、FLASH、AUTHWARE等,还要积极学习和掌握电脑的多种应用手段,在不断尝试中将其变成自己生活的一部分。
(二)对信息技术与课堂教学整合的理解“整合”实际上是一种课堂教学中呈现出来的状态,或是效果,每一节课都有具体的任务,都有一定的教学目标。在信息技术的强大功能面前,教学不能退居于后,成为次要部分,无论如何,教学都是首要内容,教学目标的达成,学生获得的学习结果,都是第一位的东西。利用信息技术的强大功能去实现课堂教学的目标是必要的,但信息技术从属于课堂教学的地位也是必然的。若信息技术能在教学过程最需要的时刻发挥作用,非常自然真实地成为教学过程中一个环节、一个步骤、一段过程……,这样状态下的课堂教学,就成为一种整合状态,它所达到的效果是我们所追求的课堂教学效果,此刻很难说是教学还是信息技术在起决定性作用,因为它们之间不分彼此,已经完全融为一体,也就整合在一起了。
(三)信息技术在生物课堂教学中的应用1.将微观世界或宏观现象通过视频、动画、声音、图片等形式展现在学生面前,加强了教学的直观性,激发学生学习的兴趣,有利于揭示事物本质,使抽象事物具体化。同时运用信息技术还可以刺激学生的视、听、看等多种感官,如用形象生动的图像信号吸引学生的视觉,用音响适中、悦耳精炼的语言信号吸引学生的听觉,特别是电教媒体的特技效果突破了信息传递中的时间和空间的限制,使学生能直观地看到宏观世界、微观世界、远方或过去的事物,使信息通道得到了无限的延伸和扩展。2.关注全体、分层教学、因材施教,从而激发学生学习兴趣,改变学生对学习的倦怠心理,提高学习效率。例如:在学生做题时,可以运用PPT打出不同难度的题,教师通过活动让不同层次的学生参与其中,这样既关注了全体,又达到了分层教学,同时也照顾了学困生的自尊心,起到了一举两得的作用。
二、在实践中发现的一些问题
在信息技术与生物学科整合的实践过程中,我有过困惑,总结过经验教训,主要表现在以下几个方面:
(一)在课堂教学中不能盲目突出信息技术在实际教学中,不能片面追求效果的最优化,不分课型、内容,不顾实际教学需要,盲目使用各种媒体。信息技术只是一种教学工具或教学手段,如果利用得当,它就可以推动教学改革,提高教学质量;如果没有正确认识信息技术,那么素材、课件等就会变为教师的“电灌”工具。我们如果片面夸大信息技术的效果,排斥传统的教学手段和方法,如以电子板书替代传统板书,或是本应使用实物、模型、挂图等常规教具的情况下,一味使用多媒体技术,就会搞得学生视觉疲劳,失去了观看的兴趣。长此以往,不但会影响信息技术的使用效果,而且还会事倍功半。因此,我们在使用信息技术时,应注意时间长短适中,信息适量,媒体搭配合理、有序、适当,而且要根据不同年龄特点的学生及教学内容需要选择不同的信息技术手段,内容、设计上不应过于花哨,以免分散学生的注意力。
(二)使用信息技术时,应处理好教师、学生、教材的关系“教师是主导,学生是主体”。我想,不论在传统的教学模式中还是在信息技术环境下,都不能忽视教师的主导作用和学生的主体地位。在新型的课堂教学中学生应在教师的引导下适当地通过各种媒介进行自主探究、合作交流、主动质疑等来提高判断事物、解决问题的能力,培养良好的思维习惯。同时教师也能对课堂收放自如,只有这样才能达到信息技术与课程整合高效性。但大家要注意的是在使用信息技术时不能忽视教材,脱离教材,因为教材承载了当节课的教学内容、学习任务。
要想实现信息技术与生物教学的有效整合,要求教师投入大量的时间和精力挖掘备整合课程资源,这必然会给本来就辛苦备课,疲于奔命批改作业的教师带来更大的压力。同时,学校还必须投入大量的人力、物力、财力,构建校园信息化平台,建设信息技术教师队伍等。教师教得辛苦,教学辅助部门配合得辛苦,学生学的效果也不尽如人意,投入和产出不成比例,往往高投入的背后是很低的收益,这导致许多教师也不愿意进行整合。
二、解决信息技术与生物教学整合问题的办法
1.明确整合的意义,确立正确方向
信息技术与生物教学整合的意义在于利用信息技术把枯燥、复杂、抽象的生物学知识生动、活泼、具体地呈递出来,创造一种新型的教学环境去启发学生的思维,减轻学生的学习负担,提高学生的学习兴趣,从而达到提高教学效率的目的。教师必须明确信息技术与生物教学整合的意义,以确立正确的整合方向。
2.加强理论学习,将整合落实
在信息技术与生物教学的整合过程中,要充分加强教法、教育心理学、教学论等理论的学习指导,把这些教学理论融入信息技术与生物教学的整合过程中,依据建构主义学习理论,结合生物学科的特点,构建易于实现生物教学与信息技术整合的新型教学模式。
3.结合生物学特点,进行科学整合
现行高中生物教材,并不是每一节课的内容都适合用信息技术来完成的。比如“细胞器”“遗传的分子基础”“生态系统”等用实物或投影演示,效果会很好。因此我们应该从具体的教学内容和目标出发,明确信息技术教学用在什么地方,什么时候用,怎么用,期望收到什么效果,以真正达到“信息技术与生物教学的科学整合”。信息技术与生物教学的整合应科学合理,其地位是“辅助”而不是“替代”。
4.建立评价机制,让师生看到整合效益