时间:2022-05-21 05:29:27
序论:在您撰写信息学论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
一、计算机化病历
计算机化病历是医学信息学的一个重要研究方向。它是指存在一个系统中的电子病历,这个系统可支持使用者获得完整、准确的资料;提示和警示医疗人员;给予临床决策服务;连接管理、书刊目录、临床基础知识以及其他设备[2]。电子病历的优点如下:完整的电子病历存储系统支持多个用户同时查看,保证个人医疗信息的共享与交流。通过网络,医师可以在家中或在世界任何一个角落随时获得患者的电子病历。同时可根据不同的用户给予不同的资料查询权限,从而保证了病历的安全性。授权用户在适当时间才能查看合适的病历。
此外,电子病历不再是一个被动的医疗记录。论文通过与图像信息的整合,可提供实时医疗监控,药物剂量查询等多种功能。电子病历已成为新兴信息技术和信息工具的基础。
电子病历目前可大致分为单机电子病历和网上电子病历两种。网上电子病历的优点是采用了ASP服务器提供全球,安全性与数据完整性则由ASP供应商解决;缺点则是数据不在医师所工作的计算机上。
虽然医疗界投入巨资,电子病历仍存在许多问题亟待解决[3]。首先,病历数据的输入界面仍不够简单;其次,电子病历需要统一的医学用语标准。目前,美国国家医学图书馆已制定出统一医学用语系统(unifiedmedicallanguagesystem,UMLS),这一系统包含了近一百万个术语描述医学概念。一旦该系统得以推广,将极大地促进全球医学用语的标准化。
二、医学信息系统
医学信息系统与其他工业系统有很大的不同。毕业论文不同的部门对信息的要求不同,这是对医学信息系统最大的挑战。例如,信息系统用户可分为基本用户和二级用户,基本用户包括医师和其他护理人员;二级用户则包括医疗保险公司、政府医疗保险机构等。不同用户需要的信息不同,导致信息管理的复杂性。同时,如何有效地利用不同的信息系统解决不同的医疗管理也日益成为人们重视的课题。
信息系统包括实验测试系统、医疗设备订购与维护系统及影像图片存储与交换系统等,存储于不同的计算机和不同的信息网络中。对于特定的用户来说,前端界面可能有所不同,但是后端数据必须是一体化和标准化的。
医学信息系统包括企业资源规划系统(ERP)、患者关系管理系统(patientrelationshipmanage—ment,PRM)、数据挖掘及决策支持系统等|4J。ERP技术在商业领域取得巨大成功,近年来,其在医疗机构中也得到广泛应用。其特点是将企业信息整合为一体(整合的数据库),所以各系统都提供一致的数据。一次输入,多次使用,有效地降低了输入费用,并保证各系统得到完整、实时、一致的数据。其次,ERP系统可用来决策医疗设备订购、管理和维护,例如通过一个整合的数据库,根据病床的使用率,ERP系统可自动选择最合适的时间对医疗设备进行维护。PRM是侧重于患者需求的信息管理系统。PRM记录患者生活习惯、个人病史、家庭病史以及过敏反应等,医院从而可提供更加个性化的医疗服务。同时通过PRM,患者也可向医院询问医疗方案。数据挖掘技术在医疗管理上也日益重要,这种技术的主要优点是降低成本,为医师提供最有价值的信息,从而提高医疗诊断的质量。Bresnahan[5]指出,上千种的服务、多种治疗方案以及相互关系使信息系统越来越复杂,而这种复杂性推动了数据挖掘技术在医疗上的使用,已远远超过其在银行业和零售业的应用范围。
三、医疗决策系统
医学实践最重要的是作出正确的医疗诊断,因此医学信息学将研究重点也放在决策系统上。硕士论文决策系统不仅需要先进的信息科学技术和工具,而且需要理解医师如何利用推理知识作出医疗判断。
当前决策系统主要基于两种方法论:着重于统计分析的定量分析法,以及侧重于逻辑推理的专家系统法。定量分析法产生于上世纪50和60年代,主要用于解决心脏疾病和异常疼痛等临床问题。早期系统以概率决策理论为解决问题的依据。最新的此类系统以美国Stanford大学PANDA项目最为著名[6]。PANDA项目使用了决策分析技术,主要应用于胎儿期诊断,根据概率分析方法对胎儿期中的问题作出最有利于患者的选择。专家系统法以逻辑推理为解决问题的核心。最著名的第一代专家系统是MYCIN系统[7]。此系统主要用于对多种传染病的诊断和治疗,其中的医学知识不是包含于工具中,而是存储在规则中。第二代专家系统则以Asgaard系统最为成功[8]。系统大大扩展了MYCIN的功能,并补充了一系列的推理方法,其中包含了所有相关领域中的复杂知识。通过与数据库的连接,系统可自动提取带有时间标志的数据,而这种功能则使系统可针对某个患者作出特定阶段最适合的治疗方式。另外通过反溯法可比较不同的医疗护理,并作出相应的质量报告。
四、影像信息学技术
自上世纪70年代中期,以计算机为基础的医学影像学随着数学、生物物理学和工程模型学蓬勃发展起来。但是由于各类学术会议侧重于影像,而忽视了信息学,导致医学影像信息学科发展缓慢。
直到近年,界面友好的医学影像数据库与二维、三维结构及可视化的结合将医学影像信息学带入了一个崭新的时代。开始于1990年的“可视人”项目提供了大量的人体模拟图像,这一技术的广泛应用带动了各类解剖学教育软件的开发,更为重要的是引发了关于模型、摸拟及大型数字化图像搜索等一系列的信息学问题。同一时间开始的“人类大脑”项目则直接导致了大量关于大脑数据图谱登记、分ShanghaiMedJ,2004,VoI27,No9区等课题的开展。新的信息学、生物计量学、计算图像学的结合,使人们重新认识到影像信息与模拟学的重要性。
现代影像信息学研究的重点包括图像传递标准、传递规则、医学术语、信息压缩、图像数据库索引及图像病例传递安全等。从“虚拟细胞”[9]到“虚拟人”[10],当前影像信息学从分子水平、细胞水平、组织水平到个体都得到广泛的应用。然而,医学信息学面临着更多亟待解决的现实问题。影像信息的完整化需要更深层的科学、技术和医疗实践的结合,包括对二维和三维图像自动分区与注册的新技术;数据抽象与概括;图像数据库中生物多样性来解释群体图像数据和表现型与基因型之间的关系;开发医学信息数据注释语言整合高级图像系统和医院信息系统等。
五、远程医疗与互联网
随着宽带网进入千家万户,远距离传递诊断和患者管理信息成为可能,远程医疗成为新的研究热点。通过网络电视和无线技术,使医师及患者能随时传递相应的医学相关信息,从而为远程医疗开创了更为广阔的应用前景。然而远程医疗昂贵的医疗费用使其现阶段只限于特定的人群。
互联网的出现提供了图片和文字传输的介质,而且为医疗机构提供了海量的信息数据。英语论文在互联网的帮助下,医师不仅可以全球共享医学资源,而且可以针对某一特殊病例进行广泛的交流。例如,美国国家医学图书馆提供医药在线(MEDLINE)数据库,其成员可查看、打印各类文献资料;医学网(CLINICWEB)则提供所有临床信息的索引,是医学界常用的搜索引擎。同时互联网的发展为一些身患相同病症人群的相互交流提供了可能,此类患者交流组织的形成有利于自我寻找最合适的治疗。
六、数据标准的重要性
电子病历和病案的大量应用、医疗设备和仪器的数字化,使得医院数据库的信息容量不断地膨胀。然而简单存储信息只是数据库的低端操作,数据的集成和分析以及医学决策和知识的自动获取才是信息学研究的重点。要对数据进行加工和分析,数据必须以特定的结构方式来存储。数据结构允许计算机轻易地传递符号和像素,并大大提高信息处理的速度。然而,这种数据结构不是仅由输入来决定的,医护人员必须有一约定俗成的数据标准,并为社会所公认。这一数据标准明确了数据库中存储的特殊符号所具有的涵义。其作用正如字典一样,起到咨询和定义的功能。数据标准又可分为文字标准和信息标准。
文字标准是指标准必须以文字形式表示,而不能以图像形式表达,国际上称为医疗数据系统,它包括一系列有特定涵义的单词。意识到标准的重要性,越来越多的医学和信息组织参与到此标准的制订中来。其中最著名的为美国病理协会制订的人类与兽类医学系统术语标准SNOMED和英国健康中心制订的医学系统术语标准ReadCodes。
信息标准则同时定义文字和图像数据。当今最通用的信息标准称为HL7(HealthLevelSeven),也可称为标准卫生信息传输协议,其中又包括医学数字化图像和传递标准(DICOM)。HL7标准确定了数据库系统中信息传递的顺序和格式,涵盖了实验测试术语、药品设备采购术语、收费术语、出院转院术语及电子监护术语等,并提供了一种类似于数据库的结构,利于患者信息在电子病历系统、实验室系统等多种数据系统中传递。
DICOM可明确图像在数据流传递过程中压缩和加密的格式,并确定CT图像或B超图像在数据库中存储的方式。
七、结语
医学信息学是计算机技术、生物物理学、统计学等与现代医疗结合的新兴学科,也是提高医疗服务质量、医院管理水平和降低成本的必然结果。这一学科需要多领域科研人员和医务工作者的大力合作。可以预见,不久的将来医学信息学将在医院管理、教学和科研、疾病的预防、诊断和治疗等方面发挥巨大和不可替代的作用,并将带动整个医学界的革新。
参考文献
1GreenesRA.ShortliffeEH.Medicalinformatics:anemerginga-cademicdisciplineandinstitutionalpriority.JAMA,1990,263:1114—1120.
2SteadWW.HalrlmondWE.Computer-basedmedicalrecords:thecenterpieceofTMRMDComput,1988,5:48—62.
3McDonaldCJThebarrierstoelectronicmedicalrecordsystemsandhowtoovercomethemJAmMedInformAssoc,1997,4:213—221.
4SiauK.Healthcareinformatics.IEEETransInfTechnolBiome-di.2003.7:1-7.
5BresnahanJ.Dataminging:adelicateoperationCIOMag(on-line).1997.
6OwensDK,ShachterRD,NeaseRF.Representationandanaly-sisofmedicaldecisionproblemswithinfluencediagrams.MedDecisiMaking,1997.17:241—262.
7YuVL,FaganLM,WraithSM,eta1.Antimicrobialselectionbyacomputer:Ablindedevaluationbyinfectiousdiseaseexperts.JAMA,1979,242:1279—1282.
8ShaharY,MikschS,JohnsonP.TheAsgaardproject:ataskspecificframeworkfortheapplicationandcritiquingoftime-on-entedclinicalguidelines.ArtifIntellMed.1998.14:29—51.
[论文摘要]生物信息学是80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。
一、生物信息学的产生
21世纪是生命科学的世纪,伴随着人类基因组计划的胜利完成,与此同时,诸如大肠杆菌、结核杆菌、啤酒酵母、线虫、果蝇、小鼠、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。人类基因组以及其它模式生物基因组计划的全面实施,使分子生物数据以爆炸性速度增长。在计算机科学领域,按照摩尔定律飞速前进的计算机硬件,以及逐步受到各国政府重视的信息高速公路计划的实施,为生物信息资源的研究和应用带来了福音。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。
二、生物信息学研究内容
(一)序列比对
比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。
(二)结构比对
比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。
(三)蛋白质结构预测
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。
(四)计算机辅助基因识别
给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。
(五)非编码区分析和DNA语言研究
在人类基因组中,编码部分进展总序列的3-5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。
三、生物信息学的新技术
(一)Lipshutz(Affymetrix,Santaclara,CA,USA)
描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。(二)基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。
(三)新的数据工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。
参考文献:
药学信息学计算机综合实验课程体系建设
(1)重视实用性课程实验的开设是药学信息学课程体系创新与实践的重要特点。药学信息学专业计算机基础课程实验设计的目标是使学生能够达到在药学研究领域掌握计算机应用的专业背景知识及能力。药学信息应用型人才培养体系的药学信息学课程体系的实验内容包括“计算机基础”、“程序设计技术与应用”以及高级课程“计算机在药学中的应用”等三个方面的具体实施项目。(2)根据药学专业对计算机人才的需求及应用,结合计算机基础教学的具体内容及多年的教学实践,将药学信息学课程体系试验设计分为三组典型实验:①计算机基础操作典型实验;②计算机程序设计典型实验;③计算机综合应用典型实验。三组实验的设计与实施具有层次鲜明、条理清晰、结构完善、循序渐进等特点。
构建课程网络教学平台建设
(1)建立了以多元化、交互式学习环境为主要特色的多功能网站,建立完善的多媒体教学资源库,该教学资源库是面向全校学生,集学生自学、师生交流、网络答疑等多功能于一体综合网络教学平台。(2)该教学资源库中包括教师课件、课外阅读资料、相关资料图片,以及教学过程中使用到的软件、教学录像等,并且通过网站平台免费提供药学信息学体系的教学大纲、教材、教学方案、教学课件、实验课程设计、教学资源素材,全面公开并共享教学资源,突破时间和地点的限制,为学生自主学习提供帮助,教学方式由目前的多媒体教学逐步转变为网络化教学。(3)在“构建药学信息学课程体系创新与实践”过程中,制作了系列课程相应的PowerPoint演示文档,并建立的多个相应的实例数据及应用软件用法介绍视频,并提供大量相关多媒体参考、学习资料,方便药学信息学专业的学生快速查找和深入学习各章节的内容,同时也提供了部分可执行的药学信息学应用程序,有助于加深学生对书本知识的理解,而且也为药学信息学实验数据处理及模拟提供了有利帮助。(4)建立并丰富了药学信息学系列课程的测试大型试题库,并开发设计了联网在线机考测评软件,面向全校学生,实现了无纸化考试。通过以下综合实验操作技能的综合测评,如药学常用软件工具练习及开发环境构建、基于Excel和VisualBasic的药学试验设计、基于Matlab和VisualBasic的LD50计算、基于Excel和Matlab的药学实验数据分析等实验检测项目,健全了以检验实际操作能力为核心的考试测评机制、以考促学的积极作用,丰富完善了药学信息学课程体系建设的重要环节。
一、正在出现的技术
Klingler(Lncytepharmaceuticals,PaloAlto,CA,USA)强调基因组学正推动制药业进入信息时代。随着不断增加的序列、表达和作图数据的产生,描述和开发这些数据的信息工具变得对实现基因组研究的任务至关重要。他谈到了Incytepharmaceuticals对大规模基因组数据和生物信息学的贡献。
Lipshutz(Affymetrix,Santaclara,CA,USA)描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测。然后这些阵列就可以直接用于并行DNA杂交分析,以获得序列、表达和基因分型信息。Milosavljevic(CuraGen,Branford,CT,USA)介绍了一种新的基于专用定量表达分析方法的基因表达检测系统,以及一种发现基因的系统GeneScape。为了有效地抽样表达,特意制作片段模式以了解特定基因的子序列的发生和冗余程度。他在酵母差异基因表达的大规模研究中对该技术的性能进行了验证,并论述了技术在基因的表达、生物学功能以及疾病的基础研究中的应用。
二、基因的功能分析
Overton(UniversityofPennsylvaniaSchoolofMedicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务——基因组水平的基因功能分析。这一阶段产生的数据的分析、管理和可视性将毫无疑问地比第一阶段更为复杂。他介绍了一种用于脊椎动物造血系统红系发生的功能分析的原型系统E-poDB,它包括了用于集成数据资源的Kleisli系统和建立internet或intranet上视觉化工具的bioWidget图形用户界面。EpoDB有可能指导实验人员发现不可能用传统实验方法得到的红系发育的新的药物靶,制药业所感兴趣的是全新的药物靶,EpoDB提供了这样一个机会,这可能是它最令人激动的地方。
Sali(Rockefelleruniversity,NewYork,NY,USA)讨论了同源蛋白质结构模建。比较蛋白质模建(comparativeproteinmodeling)也称为同源模建(homologymodeling),即利用实验确定的蛋白质结构为模式(模型)来预测另一种具有相似氨基酸序列的蛋白质(靶)的构象。此方法现在已经具有了足够的精确性,并且被认为效果良好,因为蛋白质序列的一个微小变化通常仅仅导致其三维结构的细微改变。
Babbitt(UniversityofCalifornia,SanFrancisco,CA,USA)讨论了通过数据库搜索来识别远缘蛋白质的方法。对蛋白质超家族的结构和功能的相互依赖性的理解,要求了解自然所塑造的一个特定结构模板的隐含限制。蛋白质结构之间的最有趣的关系经常在分歧的序列中得以表现,因而区分得分低(low-scoring)但生物学关系显著的序列与得分高而生物学关系较不显著的序列是重要的。Babbit证明了通过使用BLAST检索,可以在数据库搜索所得的低得分区识别远缘关系(distantrelationship)。Levitt(Stanforduniveersity,PaloAlto,CA,USA)讨论了蛋白质结构预测和一种仅从序列数据对功能自动模建的方法。基因功能取决于基因编码的蛋白质的三级结构,但数据库中蛋白质序列的数目每18个月翻一番。为了确定这些序列的功能,结构必须确定。同源模建和从头折叠(abinitiofolding)方法是两种现有的互为补充的蛋白质结构预测方法;同源模建是通过片段匹配(segmentmatching)来完成的,计算机程弃SegMod就是基于同源模建方法的。
三、新的数据工具
Letovsky(JohnshopkinsUniversity,Baltimore,MD,USA)介绍了GDB数据库,它由每条人类染色体的许多不同图谱组成,包括细胞遗传学、遗传学、放射杂交和序列标签位点(STS)的内容,以及由不同研究者用同种方法得到的图谱。就位置查询而言,如果不论其类型(type)和来源(source),或者是否它们正好包含用以批定感兴趣的区域的标志(markers),能够搜索所有图谱是有用的。为此目的,该数据库使用了一种公用坐标系统(commoncoordinatesystem)来排列这些图谱。数据库还提供了一张高分辨率的和与其他图谱共享许多标志的图谱作为标准。共享标志的标之间的对应性容许同等于所有其它图谱的标准图谱的分配。
Markowitz(LawrenceberkeleyLaboratory,Berkeley,CA,USA)讨论了分布式数据库与局部管理的关系,以及用基于工具的方法开发分子生物学数据库(MDBs)的问题。许多方案当前正在促进搜索多种不同来源MDBs的数据,包括建立数据仓库;这要求对各种MDBs的组合有一种全局观,并从成员MDBs中装填数据入中心数据库。这些方案的主要问题是开发整体视图(globalviews),构建巨大的数据仓库并使集成的数据库与不断发展中的成员MDBs同步化的复杂性。Markowitz还讨论了对象协议模型(objectprotocolmodel,OPM),并介绍了支持以下用途的工具:建立用于文本文件或者关系MDBs的OPM视图;将MDBs作成一个数据库目录,提供MDB名称、定位、主题、获取信息和MDB间链接等信息;说明、处理和解释多数据库查询。Karp(SRIinternational,MenloPark,CA,USA)解释了Ocelot,一种能满足管理生物学信息需求的面向对象知识陈述系统(一种面向对象系统的人工智能版)。Ocelot支持略图展开(schemaevolution)并采用一种新的最优化并行控制机制(同时进行多项访问数据的过程),其略图驱动图形编辑器提供了交互式浏览和编辑功能,其注释系统支持数据库开发者之间的结构通讯。
Riley(MarinebiologicalLaboratory,WoodsHole,MA,USA)在讨论大肠杆菌蛋白质的功能同时,特别提到了GPEC数据库,它包括了由实验确定的所有E.coli基因的功能的信息。该数据库中最大比例的蛋白质是酶,其次则为转运和调控蛋白。
Candlin(PEappliedBiosystems,FosterCity,CA,USA)介绍了一种新的存储直接来自ABⅠPrismdNA测序仪的数据的关系数据库系统BioLIMS。该系统可以与其它测序仪的数据集成,并可方便地与其它软件包自动调用,为测序仪与序列数据的集成提供了一种开放的、可扩展的生物信息学平台。
Glynais(NetGenics,Cleveland,OH,USA)认为生物信息学中最关键的问题之一是软件工具和数据库缺乏灵活性。但是,软件技术的发展已得到了其它领域如金融业和制造业的发展经验的借鉴,可以使来自不同软件商的运行于各种硬件系统的软件共同工作。这种系统的国际标准是CORBA,一种由250多个主要软件和硬件公司共同合作开发的软件体系。联合使用CORBA和Java可以开发各种通过一个公用用户界面访问任何种类的数据或软件工具的网络应用软件,也包括生物信息学应用软件。Overton不同意Glynias的这种想法,他强调说CORBA仅对软件集成有用,不兼容的数据库软件可能是计算生物学所面临的最困难问题,一些制药公司和数据库仓库最近资助了一项用OCRBA链接不同的数据库的计划[2,3]。
四、制药先导的发现
Burgess(Sturcturalbioinformatics,SanDiego,CA,USA)讨论了填补基因组学和药物设计之间鸿沟的蛋白质结构中的计算问题。在缺乏主要疾病基因或药物靶的精确描述数据的情况下,药物设计者们不得不采用大规模表达蛋白质筛选方法;而结构生物信息学则采用一种更为实用有效的计算方法直接从序列数据中确定靶蛋白质的活性位点的精细结构特征,它利用一种集成专家系统从现实的或虚拟的化学文库中进行迅速的计算筛选,可以达到一个很大的规模。
Elliston(Genelogic,Columbia,MD,USA)讨论了治疗药物开发中发现新的分子靶的过程,着重讨论了基因发现方法。他认为,随着日益临近的人类基因组测序的完成,几乎全部基因的特征将在序列水平得到揭示。但是,对基因的认识将有赖于更多的信息而不仅仅是序列,需要考虑的第一类信息是转录表达水平信息,而Genelogic公司的GeneExpress就是一个由mRNA表达谱、转录因子位点、新基因和表达序列标签组成的数据库。
Liebman(Vysis,Downessgrove,IL,USA)介绍了Vysis公司开发的计算和实验方法,这些主法不仅用于管理序列数据,而且被用于以下用途:分析临床数据库和自然—突变数据库;开发新的算法以建立功能同源性(区别于序列同源性)模拟生物学通路以进行风险评估;药物设计的靶评估;联系复杂的通路特性以便识别副作用;开发疾病发展的定性模型并解释临床后果。
随着发现的新基因的日益增多,这个问题显得格外重要:基因的功能是什么?Escobedo(Chirontechnologies,Emeryville,CA,USA)提出了这个问题的一种方法:将分泌蛋白质的基因的功能克隆与筛选这些克隆(可能的药物靶)结合起来。在这种方法中,在微粒体cDNA文库池中进行体外翻译避免了劳动密集的克隆、表达和纯化步聚,对文库池中的翻译产物在细胞水平进行筛选,测试其在细胞增殖和分化中的作用。例如,在用这种方法识别的111个克隆中,56个属于已知的分泌蛋白质,25个为膜相关蛋白,另外30个功能未知,可能是新的蛋白质。一种相似的方法在转移到小鼠模型系统中的基因传导载体中构建分泌蛋白质的cDNA文库来克隆特定的功能基因。
Ffuchs(Glaxowellcome,ResearchTrianglePark,NC,USA)讨论了生物信息学更为广义的影响:它不仅影响到新药物靶基的发现,还对改善药物开发的临床前期和临床期的现状极具重要性。众所周知,涉汲数以千计病人的临床试验(可能是药物开发最为花钱的部分)的设计不论多么仔细,也不能为正确的药物选择正确的病人。而在基因组水平划分病人群体的方法可以大大改善发现新药的效率。Fuchs介绍了一种将病人的基因型和表型标志结合起来以改善临床前期和临床期药物开发过程的系统GeneticinformationSystem.他强调将遗传学和生物信息学数据同化学、生物化学、药理学和医学数据连接起来的集成信息管理和分析方法是极其重要的。
Green(HumanGenomeSciences,Rockville,MD,USA)介绍了他的测序工作中采用的数据管理工具。基于EST的测序方法所面临的挑战是,在对几百个cDNA克复测序之后,产生的数据堆积如山。由于大多数人类基因都是用这种方法发现并在么有数据库中分类编排的,面临的识别开放读框、重叠序列的重叠图谱、组织特异表达和低丰度mRNA基因的任务是令人生畏的。HumangenomeSciences公司开发了一些可用户化数据库工具,在同一个数据库中可包括以下功能:WWW上访问和检索数据,序列拼接,临视潜在药物靶基因的研究进展等。这些能够管理多项任务——从注释基因序列到成功开发基因产物进入药物发现的流程——的软件工具,极其可望从一种基于基因组知识的药物发现方法中得到新的药物靶。
Summer-Smith(Base4bioinformatics,Mississauga,Ontario,Canada)描述了一种相关的策略。药物发现阶段中所要求的软件工具的任务是多样化的,要能注释基因,并阐明它的生理和病理功能及其商业潜质。对这样多种来源的信息的集成与分析,在派生的、项目取向的数据库(project-specificdatabase,PSD)中可以很好完成。由于项目贯穿于发现到开发全过程,其间又不断加入背景的成员,PSD在项目的管理与发展中成为一种关键性的资源。
按照Smith(Bostonuniversity,Boston,MA,USA)的观点[2],我们并不需要更快捷的计算机或更多的计算机科学家,而是需要更的生物学家和生物化学家来解释序列的功能。这对有些软件或硬件专家来说是个打击,但生物学系统的复杂性是令人生畏的,并且对基因功能的认识可能需要生物学方法和计算方法的结合。探索基因的功能很可能要花费生物学家们数十年的时间,本次会议表明没有任何单一的方法可以得出一个答案;但是,将计算生物学同大规模筛先结合起来识别一种化学靶物(hit)是一种产生化学工具来探索基因功能的方法,这些化学工具接下来就可以用作理解基因功能的“探针”。这种方法在Butt(GeneTranscriptionTechnologies,Philadelphia,PA,USA)的描述中,既是一种检查基因功能的简单方法,也是为潜在的药物靶发现化学先导物的简单方法,他描述了一种可以在酵母中重建人类基因功能的酵母大规模筛选系统。在此系统中,可以迅捷地在一个化学文库中发现配基。这种技术的重要特征是它不仅仅是发现一种药物靶的配基的筛板(screen),相反,由于该系统的高速度,它也是发现先导靶基因的一种筛板。过去,世界上的制药公司通常在某一时间内仅能对有限数目(约20多个)的药物靶基因进行工作,鉴于此,我们需要根本不同的方法如基因组学来打开通向“新”生物学的通路。由于机器人和合成化学的进步,药物发现中最关键的问题不再是得到一种先导化合物(leadcompound),而是得到导向靶基因。此次会议为从计算和实验方法中发展出的新生物学迈出很好的一步。
参考文献
1LimHA,BatttR.TIBTECH,1998;16(3)):104
1.1医学信息学教学与医学实践需求脱节
医学信息学的教学体系应该从医学信息的上、中、下“三游”来加以组织。医学信息学上游主要是指传授医学信息的本质、特征、类型、产生机制与机构、传播等知识。医学信息学中游主要是指传授医学信息的搜集、整理、鉴定、组织与分析,以及医疗信息化背景下的医学信息的描述与信息库、卫生信息系统、医学信息的储存、检索和深加工等知识。医学信息学下游主要是指传授医学信息资源开发、利用与服务及其文化传承等知识。笔者认为医学信息学是一门应用型较强的课程,对于医学专业的学生需要根据未来所从事的职业性质研修相应的“三游”知识。如临床专业的学生需要研修病案管理学、病案信息资源管理学、医院信息系统、电子病历等课程。但是就笔者所在的南京医科大学进行调研发现,在医学学生的教学计划中,只有卫生信息管理与信息系统专业与医疗保险专业开设了医学信息学的相关课程,而作为未来医学信息的产生者——医生,临床专业的医学生教学计划中没有医学信息学的相关课程。这种医学信息学教学与医学实践需求之间的脱节,直接导致临床专业的医学生在大学期间没有培养良好的医学信息学素养,进而导致这些医学生在未来成为医生之后对医学信息不重视,甚至为医学信息产生、收集、整理而烦恼。
1.2医学信息学学科发展不深入
长春工业大学继续教育学院对开设医学信息学专业(或方向)的高校进行了排名,其顺序是复旦大学、中山大学、中南大学、中国医科大学、首都医科大学、四川大学、北京大学、南方医科大学、山西医科大学、浙江大学、华中科技大学、西安交通大学、石河子大学、吉林大学、重庆医科大学、哈尔滨医科大学、山东大学、杭州师范大学、南京医科大学、泰山医学院、河北医科大学、南昌大学、天津中医药大学、福建医科大学、武汉大学、上海交通大学、青岛大学、天津医科大学、延边大学、浙江中医药大学、新乡医学院、南华大学和大连医科大学等33所高校。笔者在南京医科大学图书馆网站利用“题名=医学信息或卫生信息,文献类型选择‘中文书籍’进行检索,返回结果为51本与医学信息相关,14本与卫生信息相关的文献。在51本与医学信息相关的检索结果中涉及医学信息检索的文献为31本,涉及到医学信息学基础教程的结果为8本。其余主要包括医学信息研究、医学信息资源组织与管理、医学信息系统、医学信息学决策与支持系统和医学信息分析等。综观这些检索结果基本上是针对不同对象的大学课程教科书。在14本与卫生信息相关的检索结果中涉及卫生信息管理的结果为8本,涉及卫生信息系统的结果为2本,涉及卫生信息化的有2本,涉及卫生信息技术与卫生信息资源的各1本。从检索结果可以得出在医学信息学学科发展过程中存在创作重复现象。如在检索结果中涉及到的知识点雷同多,书本编排应急就章,重复建设,后出版之书不仅没有超过前者,有的反而出现倒退现象。除刘冰、黄玉玲主编的《医学信息研究》之外,主要用于医学信息学专业教学教材。在这些教材中除了丁宝芬教授的《医学信息学》、罗爱静教授的《卫生信息管理概论》和《卫生信息管理学》作为普通高等教育国家级教材规划教材之外,其余教材鲜有得到国际或国内同行普遍认同。有些著作虽然注重吸收图书情报与档案管理学的学科知识,但是没有能够与医学信息学有效融合,移植现象比较明显。当然笔者在此无意于简单否定医学信息学界与出版界同行的工作,但我国33所医学信息学相关专业的高等院校应该反思,应考虑利用范式理论指引学科发展,加强知识横向与纵向的传承与发展,引进图书情报与档案管理学、经济学和管理学等理论,弥补国内医学信息学学科的空白和不足,提升学科地位。
2医学信息学范式研究是解困之举
随着全球化进程的加剧,医学信息学也将与其他学科更加相融,医学信息学的发展必将走向开放与合作,医学信息学学科发展问题将会成为一个国际性课题。因此我国医学信息学共同体利用范式理论作为研究手段,从国外学科研究成果和研究方法中汲取有益成分,使之为解决国内医学信息学的学科发展之瓶颈成为应然解困之举。
2.1范式研究有助于医学信息学学科的深化与拓展
医学信息学要想从宏观上和根本上提升学科地位,需要在元科学领域的研究上投入更多精力。元科学理论,即关于科学的科学,医学信息学元科学即是指关于医学信息学的科学。当医学信息学发展到一定阶段的时候,医学信息学共同体会对学科的本质、规律及其相关元问题进行分析与探究,便产生了“学中之学”、“科学之科学”的研究取向,笔者认为可以将这类的医学信息学分支学科称之为“医学信息学元科学”。医学信息学共同体会遵循学科发展史的轨迹,即经验研究、方法论研究和理论研究,具体发展走向为病案管理、医学信息检索、卫生信息管理学、卫生信息化、卫生法律法规、医学信息保护技术学、医院信息系统、卫生信息系统、电子病历、区域医疗合作和医学信息学史等。在此基础之上,医学信息学科分支中会产生医学信息学概论(卫生信息管理概论)——以“揭示医学信息学现象本质和规律为研究目的”的学科。医学信息学范式研究就是关于医学信息学学科自身的深化与拓展,医学信息学共同体立足于宏观抽象层面,从根本上认识医学信息学的元问题和本质规律。现阶段我国的医学信息学研究已具备一定的规模和水平,其研究领域已经从医学知识表达、卫生信息系统、生物信息学、医学信息学教育与培训l等传统领域向面向语义互操作的知识体系构建、跨系统和跨应用的互操作标准制定、网格与云环境下的应用、转化医学、人体模型建设、临床决策和认知学领域深入发展。尽管医学信息学的发展已经进入了一个全新的发展领域,具有较快的发展速度,但是对元问题层面的挖掘探讨仍对学科的发展是至关重要的。以医学信息学元科学代表“医学信息学概论”或“卫生信息管理概论”为例,现有的文献仅有一本,即卫生部“十一五”规划教材——《卫生信息管理概论》。笔者认为作为医学信息学元科学的《卫生信息管理概论》应当注重对医学信息学生存环境、发展史和共同体的研究,应从医学信息学本身的问题出发建立起本学科研究问题的独特视角,而不宜将大量的篇幅放在对“对象性事物”的描述和阐述上。基于元科学的重要性,医学信息学理应将更多的空间设定在元科学领域的研究上,才能从根本上提升该学科地位。医学信息学范式研究理应针对医学信息学自身的探讨和分析,立足于宏观抽象层面认识医学信息学基本问题和本质规律的研究。鉴于此,笔者认为医学信息学范式研究与医学信息学发展的要求是一致的,它是医学信息元科学研究的最佳切入点,它是以医学信息学发展史为研究主线,不仅涉及到医学信息学未来的发展方向,还需要研究医学信息学学科共同体主体作用、医学信息范式变迁与学科外在环境因素之间的关系等。
2.2范式研究是医学信息学汲取外学科精华的典型尝试
较之于医学信息学内部各分支学科之间的互相融合,医学信息学对其他学科理论和技术应用的吸收、引进、消化、渗透、移植等将不断推进医学信息学的发展。即使医学信息学在解谜过程中出现不可通约性,分歧未能达成一致意见,医学信息学也会在反复的推敲和质疑中逐渐成熟。因为在外学科理论引入医学信息学的磨合期中所产生的碰撞、摩擦和火花,可能为医学信息学的发展提供争论的焦点和学术的创新点。医学信息学范式研究正是基于这一思考与目的。美国社会学家米尔斯在《社会学的想像力》中论及:“将自己的领域当作独立的王国,而忽略它与其他领域,诸如经济、政治等方面的联系,造成了归纳的一般性无法演变成演绎的精确性,演绎的精确性又无法上升到归纳的一般性。最终的结果就是,个人困扰没有成为公共论题,甚至于渐行渐远。人文精神的组织力进化成为科学精神的机械性,而概念和方法则成为了问题的主导因素,这不禁有本末倒置之嫌。加之于我们对社会本身是如何形成的一无所知,而只是无意识地接受了其存在的合法性,这更容易加深身处其中人的无力和无助感。”医学信息学范式从本质上说就是社会学理论进入医学信息学领域的一大尝试。医学信息学由单一研究方向向多重研究方向发展,从病案管理学向病案学、医学信息检索、卫生信息系统、医学决策支持系统、认知学和医学伦理与监管等方向发展,医学信息学专业呈现日益增多,学科日趋分化的趋势。从医学信息学的发展趋势来看,符合人类的认识发展规律。初期关于医学信息学的知识是从病案管理实践着手,对于学科还没有一个完整、清晰的认识,随着研究活动的深入、认识的推进,与学科内外发展动力因素的影响,对医学信息学进行逐块逐层的分解研究,于是出现了整体知识的不断吸收、引进、消化、渗透、移植等,在学科组成上表现为学科不断分化成病案学、医学信息学、卫生信息系统等分支学科(或专业)。医学信息学的发展理应汲取外学科的精华充实与强化本学科内涵建设,来解决医学信息学科建设中的热点、难点与焦点问题。因此,为了医学信息学的科学发展,我们需要的是深刻剖析与之存在学科依赖关系及其运作原则,并结合其他学科的研究成果来探讨此情境下的医学信息学的学科发展问题,而不是脱离其中任何一方。我国的医学信息学发端于2O世纪80年代初的医学图书情报学,研究体系不够完整和成熟,研究领域也不平衡,例如重视文献信息管理、技术路线和微观实践,但是对于理论研究和学科RESEARCHONLIBRARYSCIENCE19建设研究不够深入,标准规范建设滞后,信息共享不足、缺乏系统规划,人才数量不足、质量有待提高、结构不尽合理。新时期的医学信息学又面临学科外的政治环境、经济环境的影响,与计算机技术、网络技术、社会学、伦理学、认知学和人工智能技术的应用与渗透,意味着医学信息学已经沿着范式理论的轨迹,发展成为一门综合各学科精华的边缘交叉学科。在医学信息学研究呈现多样化趋势的今天,借鉴社会学方法有助于分析医学信息学的发展方向、分支学科,或许会让我们发现原来的封闭视野所不能看到的演进过程与规律;也有助于当我们习惯于现有学科思维框架下的医学信息学发展之余,换之以外学科的视角重新审视和考察医学信息学的发展和演变,给学科的发展与建设输入新的血液。
3医学信息学学科范式内涵探微
“范式(Paradigm)”一词是托马斯•库恩首先在《科学革命的结构》一书中用于科学研究的,他在该书中指出:“范式通常是指那些公认的科学成就,他们在一段时间里为实践共同体提供典型的问题和解答。可以用来解释科学历史发展轨迹及其科学知识增长模式的社会学概念。”“范式的主要表现为‘符号概括’、‘信念’、‘价值’和‘范例’等。”在解读与理解库恩关于范式的阐述的基础上,笔者认为,医学信息学范式是医学信息学共同体在医学信息生产和管理实践活动中所共有的世界观、方法论、理论成果和共同遵守的行为准则(即范例)等成分,是指医学信息学共同体公认的“模式”。共同体、世界观、方法论、理论成果和范例等是医学信息学范式的重要组成成分,其虽不可能涵盖医学信息学范式全部的“应有之义”,但可以把这些当作医学信息学范式的核心内容。
3.1共同体
科学共同体简称为共同体,最早运用可以追溯到1942年,英国物理学家、哲学家波朗尼(Polanyi)在其论文《科学的自治》中使用了这一概念。库恩在《科学革命的结构》中把“共同体”理解为科学范式的承载体——“一个科学共同体由共有一个范式的人组成”。学科共同体是以上一切成分元素的执行者,也是经常被忽略的研究主体。科学共同体研究在范式研究中的地位毋庸置疑,医学信息学科共同体正因为有了共同的范式才能集中在相同的研究领域内,不受时间和空间的限制,进行交流和互动。因此在研究医学信息学范式时,首先要明确医学信息学共同体的概念。传统的医学信息学学科主要研究的是医学信息学的对象、方法论、理论标准,而很少涉及医学信息学的认识主体——医学信息学共同体。医学信息学共同体可理解为发展医学信息学范式的主体,研究医学信息学范式主体,拥护同一医学信息学范式的主体。医学信息学共同体由授受相应的医学信息学教育背景和学科训I练的学者构成,他们以发展医学信息学为使命,具有共同的价值理念,遵循共同的学术规范和维护共同的学术尊严。医学信息学科共同体通常遵循医学信息学学科发展规律,致力于医学信息学科学研究、教育教学、实践,是医学信息学学科的主体。医学信息学共同体可以是相对稳定的正式组织形式,也可以是自由组合的非正式组织形式。前者具有相对稳定的组织机构、成员、规范和活动方式。如中国医院管理学会下的病案管理委员会、医学信息学会,全国33所开设医学信息学相关专业(或方向)的院校教师组成的同事式组织、导师与学生组成的师徒式组织,以及其他医学信息科研、实践机构组成的固定团队等。后者一般不具备严格意义上传统固定的组织形式、规模和稳定人员构成等内容。如因课题立项而临时组建的课题组形式,各地组织的拥有固定主题的学术研讨会、学术论坛、博士论坛,同一学科领域或分支学科的共同爱好者等。从医学信息学共同体发挥的作用来看,非正式组织形式的学科共同体不仅是学科建设与发展的生力军,也是正式组织形式医学信息学科共同体的补充力量。当他们的自身作用和地位日益得到社会及统治阶层认可时,自组织形式随时有可能转化为有组织形式。
3.2世界观
世界观,又称为宇宙观,是哲学的朴素形态。由于医学共同体所处的社会地位、观察问题的角度不同形成不同的医学信息学世界观,这种观点是共同体自身医学信息学工作、学习和生活实践的结果,往往是自发形成的,需要医学信息学的相关研究者对其进行自觉地概括和总结并给予理论上的论证,才能成为指导学科发展的哲学。医学信息学共同体的世界观是形而上的部分,是共同体对整个医学信息学学科,以及共同体与医学信息学之间的总的看法和根本观点,简而言之即医学信息学共同体对于医学信息学这一学科的总体认识,对医学信息学的共识,包括医学信息学科共同体所共有的基本信念、价值取向、思维方式等,是本体论、认识论层面的承诺,以及对自身在医学信息学学科中的地位和作用的看法。医学信息学共同体的世界观可作为指导思想,指导医学信息学共同体开展医学信息学研究。医学信息的世界观往往决定着一个学科的自身定位和发展方向,表现在医学信息学范式研究中则是要解决“如何看待医学信息学专业研究对象”的问题。当认为医学信息体现为一种历史记录属性时,要维护的是学科历史有机联系;当认为医学信息体现为一种知识属性时,要实现的是学科最大效益。
3.3方法论
医学信息学方法论是医学信息学共同体在医学信息学学习、实践和研究中所自觉沿袭的一般方法。医学信息学方法论是以解决医学信息学中的问题为目标的一种体系或系统,通常涉及问题分析、任务工具和方法技巧等方面的论述。方法论体现在世界观、自然观、社会历史观、伦理观、审美观、科学观之中,可以是由模式、方式、方法、手段等组成的经验研究成果、案例和实用技术方法。医学信息学方法论会对一系列具体的方法进行分析研究、系统总结并最终提出较为一般性的原则。医学信息学学科的发展范式按照库恩的科学范式为一般原则,即从前科学——常规科学——反常与危机——科学革命——新的常规科学为医学信息学的学科发展线索,并利用历史主义方法构建医学信息学范式理论;在经验层面,方法论是理论适用的方式,如在病案科整理病历资料时,利用来源原则与事由原则进行归档管理;在医学信息学安全和实用技术中则是一些纯事实性和操作性方法,如利用原型法指导医院进行信息系统开发建设。医学信息学方法论是用以指导医学信息学进行学术研究和实践活动的路径与纲领,解决的是“医学信息学如何从事专业学术活动”的问题。如研究方法中的历史主义研究方法、实证主义方法、论证方法、比较方法和调查研究方法等。
3.4理论成果
医学信息学理论成果是指对医学信息学范式形成并起着决定作用的共有医学信息学理论。理论需要寻求解释,而范式则提供了寻找解释的方法。医学信息学理论在成为共有认识之后可以上升到范式层面,达到范式层面的理论成果同一般的理论成果有联系,也有区别。联系在于,范式层面的理论来自于一般理论而又高于一般理论,它是医学信息学共有的概论、命题及其推理。概念是思维的基本单位,是反映事物本质属性的思维形式。作为医学信息学理论逻辑出发点的概念是基本概念。共有概念是对医学信息学学科共有基本元素的约定,而这些概念必须是以医学信息学学科的本源概念的面貌出现。如“病历”、“医嘱”和“病案”。命题是表明判断结果的陈述语句,有真假意义的语句才是命题。如病案的本质属性是原始医疗记录性——这是对病案本质属性的肯定判断,是一个可以做真假检验的语句。共有命题是指医学信息学学科理论中类似自然科学中定理、定律性质的命题。推理是指一判断借以另一判断推出的思维功能。共有推理是由共有命题中引申而来的。如从病案的原始性可能推理出病案具有凭证性。虽然范式层面的理论已经得到充分的论证,成为共同体内部约定俗成的公理,但是医学信息学共同体不会因为具体理论的不完善而影响范式共有理论的存在,对于共有理论,也不会因为研究主体的不同阐释而影响其范式指导作用。虽然处于同一学科共同体的成员往往引用同样的理论成果,得出类似的理论观点,医学信息学共同体能够同意确认一个范式,但不会同意对范式的完整诠释或合理化。缺乏标准诠释或不能得出一致同意的规则并不会阻止范式指导研究。
3.5范例
中医药学强调整体功能,用阴阳五行学说描述疾病性质及人体病理;视邪正交争、阴阳失调为主要的疾病观;形神合一为主流的健康观;诊断利用四诊合参;贯穿治病求本、辨证论治、防重于治等理念。而西医则强调局部微观分析,内容涉及解剖、生理、病理、卫生、药物等;主张重视实验、疾病局部定位思想;研究对象为分子、基因、蛋白、亚细胞、细胞、组织、器官、个体、公共卫生等。不论是中医学还是西医学,从二者现有的思维方式的发展趋势来看,均是走向现代系统论、信息论、控制论的思维,故可引入“三论”,用科学的方法论指导中医药信息学学科发展[1]。
2从概念比较
中医药信息学是基于动态现象运动规律理论,遵循整体准则和动态准则,运用计算机与网络技术研究中医药学领域信息现象和信息规律,对中医药信息进行表示、管理、分析、模拟和传播,以实现中医药信息的获取、转化与共享,提示中医药信息的实质与内在联系的一门科学[2]。医学信息学是探讨生物学、医学或者更广义健康数据的采集、存储、交互和展现过程的科学,探讨如何利用信息科技来优化这些过程的科学,以及探讨如何利用这些数据实现信息和知识层次各种应用的科学[3]。
2.1研究对象不同中医药信息学以中医药信息为研究对象,强调以“人”为中心,包括健康的、疾病的及其相互转换的,并且是在时间、空间维度及背景方面的综合多维信息;医学信息学是以生物学的、医学的或者更广义的健康数据为研究对象,强调以“病”为中心,主要针对实验室疾病数据的防病抗病信息。
2.2研究内容不同中医药信息学以中医药领域信息动态现象运动规律为研究内容;医学信息学是以生物学相关领域的信息采集、存储、交互、展现及优化,实现信息和知识层次的各种应用为研究内容。中医药领域信息强调动态的天地人三才一体的整体观,说明中医药领域的信息主要反映人与自然、社会、人文及其相互关系的人体整体动态功能变化及其规律,所以中医药信息学与医学信息学研究内容有着根本的不同。
2.3研究方法不同中医药信息学与医学信息学研究对象、内容迥异,必然导致研究方法的不同。医学信息学以信息科学方法论为研究方法,运用信息观点分析和处理信息流程。中医药信息学也模仿和借鉴其研究方法,但中医药强调功能和整体准则,以中医药理论和经验作为分析和处理人体生命过程中出现的问题,不侧重人体解剖结构及其运动形态的改变。所以,在研究方法上需结合自身特点应用医学信息学方法并予以升华。如研究时需要中医药领域专业知识平衡语义关系存在用自然语言描述时的多义性与用形式化语言描述的确定性之间的矛盾;需要领域专家对知识的准确理解和内涵外延的精确把握;需要结合时间维度体现哲学、自然科学和社会文化背景的专业知识等。
3从知识框架比较
中医药信息学知识框架与医学信息学知识框架可概括如下。两图中从左至右分为四列,左起第一列为中医药信息或医学信息研究的对象,第二列为由基本信息转化专业应用领域的相关学科,第三列为两种信息学均由相关专业学科组成,第四列为两种信息学的知识结构,说明两者都是交叉学科,涉及到一些中间领域学科的知识门类。虽然二者构建模式相通,但研究内容不同,因此其研究领域及方向必然不同。
4研究方向比较
中医药信息学研究范畴可概括以下3个方面:一是基础领域研究,如中医药信息论、中医药知识整合论、中医药信息学原理等;二是技术领域研究,如中医药信息的收集、存储、处理及输出等技术;三是应用领域研究,如中医药信息标准化研究包括信息表达标准化、信息交换标准化、信息处理及流程标准化等,中医药知识体系计算机表示与模拟研究包括功能诊断信息系统、整体数据处理系统、临床决策支持系统等、医院管理系统、电子病历、图像处理等、中药质量控制、中药药效评价、中药优化设计与研发、中药知识发现与管理等,中医药数据分析与利用研究包括利用文本挖掘方法、关联分析方法、信息计量方法等对中医药研究中获得的数据与信息及科技文献信息进行分析与利用研究等,中医药文献信息资源研究包括中医药文献信息资源的获取、保护、存储、处理、传播等,中医教育科研研究包括多媒体教育、网上教育、远程教育等[2]。医学信息学研究范畴可概括以下4个方面:一是原始健康数据,如影像、微阵列、生理数据等。涉及到的研究包括数据采集和集成,如实时的生理信号分析、语音识别、传感器采集、条形码扫描等;二是从原始健康数据中分析出来的有组织的综合数据库,如基因分类及其外在表现形态。涉及的研究主要是数据整合及数据处理,如数据仓库、数据模型、语义网络、本体论、数据储存、提取、可视化及图像处理等;三是从数据库中抽象出来的知识库,如词表、术语学、本体库、语义网等。涉及到的研究主要是推理及知识管理,如自然语言处理、信息抽取、数据挖掘、文本产生、统计处理、自动学习及知识表达、知识模型等;四是从知识库中验证出来的可直接应用的知识结晶和理论,如协议、临床实用手册、概论等,涉及到的研究主要是知识获取及知识应用,如机器学习、文本解释、知识工程、决策理论及诊断、治疗、预防等。综上,中西医在对待临床信息的观念、临床信息的放置位置、采集内容、采集方法,尤其是临床信息模型以及信息分析方法等均有很大区别。目前中医药数据库系统广为应用,用中医电子病历来保存临床中医病案,用数据挖掘技术来整理及查询电子病历等。中医医院已经普遍吸纳了现代医学的诊疗方法,如电子病历在受到中医学自身发展规律的约束之外,也必然兼容有西医学的许多内容,体现着中西医的有机结合。当然还存在一些有待提升的空间,如中医专家系统进入了低潮期,中医的四诊信息还未达到客观化、规范化,对于人工智能的研究还在起步阶段等。
5总结
卫生信息学基础理论研究现状
缺失特色理论一门学科的特色理论至少有两方面的作用:一是代表本学科的科研水平与发展趋势,成为学科发展的里程碑标志;二是对专业特有概念和特有规则从理论的角度进行系统解释,使本学科区别于其他学科。笔者认为,现阶段还没有一套成熟的基础理论能够明确标志卫生信息学成熟与完善程度,即卫生信息学尚缺乏较为系统的特色理论。究其原因,一是卫生信息学现有特色理论研究有待进一步的深化研究,理论阐述本身系统性欠缺,不能充分凸现卫生信息学的存在特征和发展需要;二是,卫生信息学的特色研究之间的关联研究不够。卫生信息学由于其是一门新兴边缘学科,主要由信息学、图书馆学和档案学在卫生领域的应用而产生,因此,生命周期理论、核心价值理论、价值理论、全宗理论和价值鉴定理论被看作为卫生信息学基础理论。但是卫生信息学有其本身学科特色,也有其特有的概念,这些特有的概念引伸出与卫生信息工作相符合的卫生信息工作规则与规律。如果简单地把信息学、图书馆学和档案学的理论套用到卫生信息学中,将会妨碍对卫生信息学自身理论特色理论深层面的挖掘。简单套用现象从信息学、图书馆学和档案学中“套用”其原理和方法应用于卫生信息学学科是现阶段该学科的主要研究方法。卫生信息学中涉及情报学、信息学、图书馆学和档案学等学科,它们之间的界限日趋模糊,套用信息学、图书馆学和档案学的原理和方法,并移植于卫生信息学,能够为本学科开拓出许多新的研究领域。然而这种方法容易造成简单套用信息学等相关学科理论,使得卫生信息学基础理论产生生搬硬套、生吞活剥的套用现象,失去学科生命力。笔者认为,应在卫生信息学研究中灵活运用信息学、图书馆学和档案学相关学科的概念、理论、公式,并使之与卫生信息学进行有机融合,使套用而来的理论根植于卫生信息学学科,使卫生信息学学科理论更精巧、理论理解更简便,并在此基础之上发展卫生信息学的特色基础理论。理论与应用脱节对卫生信息学进行理论与应用的研究有利于适应高科技带来的新现象、新方法、新经验。卫生信息学既是来源于实践,又反作用于实践。现阶段卫生信息领域的现状是基础理论研究远落后于应用实践。如电子病历,由于卫生信息领域的特殊要求,信息技术、标准、电子签名技术、数据库技术等运用与信息学学科是相一致的,但是其理论研究却远落后于信息学学科,进而造成电子病历的理论研究与实际操作相互隔阂,阻碍了电子病历信息资源的进一步开发与利用。另外,在卫生信息学基础理论研究中,对新事物、新技术不敏感,人云亦云,甚至生搬硬套外国卫生信息学者的研究,或把外国卫生信息学者的某些言论作为金科玉律。如对电子病历的研究,其中有些研究者并不精通信息技术、计算机技术、通信技术与网络技术方面的知识,对国外文献不能领会其意,因此其研究成果让人不知所以[3]。无庸讳言,如果这种情形得以存续,卫生信息学基础理论研究将很难深入。
卫生信息学基础理论研究思考
明确学科意义,调整理论研究的思维方式研究卫生信息学基础理论的前提是明确什么是卫生信息学学科。卫生信息学学科是一个门类繁多、层次分明、结构复杂的知识系统,在这个系统中,不仅包括自然科学、技术科学和社会科学方面的知识,而且也包括在这三大领域之间由于门类交叉、学科交叉、知识交叉、方法交叉所产生的知识。但是任何科学知识,都有自己发育的过程,都有自己的演化历史。卫生信息学学科知识也经历了四个演化阶段:准科学、前科学、常规科学、后科学[4]。该学科现阶段仍处于前科学阶段,它是研究者从各个不同侧面观察和研究事物表现效应的结果,因而对同一卫生信息实践现象有着多种不同的认识和看法。前科学阶段的批评或反驳对方的批评,无论怎么激烈,谁也难以取代谁。前科学阶段,科学存在的形式乃是“多重态”的科学,不可能形成排斥异己的所谓“科学共同体”。这个阶段的卫生信息学研究对象的众说纷纭,卫生信息学内容结构划分方法的各异,卫生信息学理论研究现状的不同评价,片面追求学科分支的逻辑增长,过量移植相关学科的理论与方法等等。这是大科学观正确认识某一学科的思维方式,这种思维方式,是以解放思想超越自身有限经验的局限为前提,以人类卫生信息活动的全部历史和实践为对象的开放型思维,这一开放型思维是开展卫生信息学理论研究的思想基础。拓展研究范畴,探寻理论研究生长点探寻卫生信息学学科新的知识生长点是面对新的信息环境研究卫生信息学基础的重要课题,不研究这些新课题,卫生信息学基础理论就没有生命力,卫生信息学学科也就可能萎缩。研究卫生信息学基础理论必须掌握卫生信息学学科坚实、宽广的基础理论和系统深入的专业知识,必须掌握与本学科研究领域有关的相关学科的理论知识和先进的技术方法,只有如此才能创新性研究卫生信息学基础理论。卫生信息学基础理论的研究范畴,始终处于不断更新和拓展的过程中,没有更新就没有发展,没有局部的拓展就没有全局的进步。在这方面,既不可墨守陈规,也不可人为地设置和障碍。不能只强求“同”,而不谋求“和”。应更加注重学科和学者的多样化,更加关注学科的融合,探求卫生信息学基础理论多元发展模式[5]。卫生信息学研究不能仅从病案、医院等实体来进行研究,而是要顺应跨学科研究的趋势,将现代信息技术与卫生信息学理论结合起来开展前沿性课题的研究。探寻学科新的知识生长点与加强卫生信息学理论研究不是矛盾的,而是有助于卫生信息学理论的创新。信息环境新变化和卫生事业的变革为卫生信息学基础理论研究创造了发展的良机。在理论发展的前科学阶段,卫生信息学基础理论研究更多地是研究学科对象、性质、内容、结构、相关学科、研究方法等方面;而当卫生信息学处于整体变革这一特殊阶段时,基础理论研究应关注变革中出现的新问题,总结变革中出现的新理念和新方法,推动卫生事业变革的进行;要审时度势,注重学科新的框架建构,为新理论、新方法的发展提供可容纳的空间;还要关注卫生信息学应用领域中的基础理论问题,离开了应用领域中具有普遍意义问题的研究,卫生信息学基础理论就将成为无源之水。理论与技术融合,促进学科发展优势融合理论与技术,创造学科发展新优势,是卫生信息学基础理论研究的一个新趋向。当前现代信息技术突飞猛进,卫生信息产业快速发展。卫生信息学特有的分类、编目、索引、文摘、检索语言等专业理论和方法仍然占有重要的地位,卫生信息学在虚拟知识空间中并没有失去继续存在和发展的机会。信息技术专家主要考虑怎样提供一种智能化、自动化、高效率的信息存取机制,而卫生信息学专家更多地考虑卫生信息内容本身的合理逻辑性,寻求科学的知识建构、组织和控制的途径。这两者应该相互补充和支持,因为卫生信息学是技术敏感型的学科,在卫生信息学发展史上,信息技术总是渗透到其业务工作和技术设备之中,并武装了卫生信息管理员,成为卫生信息管理领域中最重要的生产力因素。在卫生信息学研究中,应用性技术研究无疑占有相当重要的地位。卫生信息学理论和方法必须与现代信息技术紧密地结合起来,只有这样才能创造交叉发展的学科优势,并继而使之转化成为资源优势,在虚拟知识空间中产生显著的效益。理论与技术相融合的关键,在于正确处理基础与应用的关系。重应用轻基础乃至否定基础研究的价值,这是当前卫生信息学研究中应该反对的一种思想倾向。基础理论和应用技术既相对独立而又不可分割,应用技术的发展与完善是以相应的理论和方法为条件的;没有基础理论的指导,便没有应用技术的发展,也无法解决卫生信息实践所提出的现实问题。