本体论细节的完整收集
基本介绍中文名:Ontology mbth: Ontology第一次使用:德国经院学者郭Clanyue时间:17世纪哲学概念、研究过程、其他领域、构建本体论、简介、步骤、基本问题、概述、本体论历史、概念、对象、联系、实体与环境、存在、哲学概念对本体论一词的定义不同,但大体上。总的来说,马克思主义之前哲学中使用的本体论有广义和狭义之分,马克思主义之后哲学融入实践。广义上是指一切现实的终极性,需要通过认识论来认识。所以,研究一切现实的终极本质是本体论,研究如何认识它是认识论,这就叫本体论和认识论。狭义上有对宇宙起源和结构的研究,广义上有本体论上对宇宙本质的研究。前者是宇宙论,后者是本体论,称为本体论和宇宙论。马克思主义哲学不走本体论和认识论,或者本体论和宇宙论的方法,而是用辩证唯物主义来解释哲学的整个问题。(摘自冯契主编的《外国哲学词典》)研究过程中的“本体论”研究,在希腊哲学史上有其渊源。从米利都学派开始,早期希腊哲学家就致力于探索万物最基本的元素“本原”(希腊语arche,译作“primordia”)。对这个“本原”的研究成为本体论的前身,并逐渐接近对存在的讨论。后来巴门尼德深刻地提出“外物无非无,有之即有之,所以不会有不存在”。并且认为存在是永恒的,只有思维与之相同,只有思维才能达到这个真理;从观点来看,有存在和不存在,存在不为一,所以就灭绝了。巴门尼德对存在的论述确立了本体论研究的基本方向:被“存在”分割的“存在”只能从思维到先验领域去探索,而不能从感觉到经验;由于它的绝对普遍性和独创性,在先验领域中发现的“是”只能是一个。然而,只有苏格拉底和柏拉图才能真正理解这一点,同时期的希腊哲学家或多或少都忽略了这一点。所以,比如说,虽然原子论者也区分了真理知识和黑暗知识,也认识到了思维和感觉的区别,但是他们所寻求的“本源”是否能从经验中获得却是极其模糊的,所以他们实际上并没有区分超越和经验。在苏格拉底没有最终结论的对话中,通过经验归纳获得真理的可能性已经被消除;在柏拉图的理念论中,先验世界的“理念”显然是真理的基础。在古希腊罗马哲学中,本体论的研究主要是探索世界的起源或母体。各种学派的哲学家试图将世界的存在归结于某种物质和精神实体或某种抽象原理。巴门尼德提出了唯一不可改变的原始“存在”,使得对存在的研究成为这一时期的主题。亚里士多德认为,哲学研究的主要对象是实体,实体或本体论的问题是关于本质、相和个别事物的问题。他认为研究实体或本体的哲学是高于所有其他科学的第一哲学。此后,本体论的研究转向探讨本质与现象、* *与超常、一般与个别的关系。在现代西方哲学中,笛卡尔首先把第一种研究实体或本体论的哲学称为“形而上学本体论”。在17~18世纪期间,莱布尼茨和他的继承者沃尔夫试图建立一套完整的关于一般存在和世界本质的形而上学,即独立的本体论体系。沃尔夫把一般和普遍看作是脱离个体、单一和独立的本质和原因。一方面,康德认为不可能建立抽象的本体论,本体论只能研究事物的普遍本质和物质存在与精神存在的区别;另一方面,本体论被从认识论中分离出来的先验哲学体系所取代。黑格尔在唯心主义的基础上提出了本体论、认识论和逻辑学的统一原则,从纯粹存在的概念出发,构建了存在本身辩证发展的逻辑体系。在现代西方哲学中,一些流派(实证主义、分析哲学、科学哲学等。)反对任何形而上学和本体论,有人试图重新建立关于存在主义的本体论,如胡塞尔的先验本体论、海德格尔的基础本体论、哈特曼的批判本体论等。他们经常用超感直觉来建立概念体系,他们的观点是唯心主义的或不可知论的。本体论研究在中国古代哲学中,本体论被称为“根论”,是指探索世界万物产生、存在、发展、变化的根本原因和依据的学说。中国古代哲学家一般把宇宙的根源归结为与宇宙完全不同的东西,大致可以分为三类:(1)没有固定形态的物质,如“气”;(2)“无”、“理”等抽象概念或原理;(3)主观精神,如“心”。这三种观点分别属于朴素唯物主义、客观唯心主义和主观唯心主义。在中国哲学史的研究中,有学者用“本体论”一词来指代在物质世界之外寻找物质世界存在依据的唯心主义理论,如魏晋时期王弼的《贵护》。其他领域的本体论是一个哲学概念,是研究存在本质的哲学问题。近几十年来,这个词被用于计算机领域,在人工智能、计算机语言和数据库理论中发挥着越来越重要的作用。然而,到目前为止,本体还没有一个统一的定义和固定的应用领域。斯坦福大学的Gruber给出的定义得到了很多同事的认可,即本体是对概念化的精确描述(Gruber,1995),用本体来描述事物的本质。在实现上,本体是概念化的详细描述,一个本体往往是一个正式的词汇表,其核心作用是定义某个领域或领域的专业词汇以及它们之间的关系。这一系列的基本概念,就像一座建筑的基石,为各方沟通提供了统一的认识。在这一系列理念的支撑下,搜索、积累和享受知识的效率将会大大提高,也有可能实现真正意义上的知识再利用和享受。从这个意义上说,XML(可扩展标记语言)是本体理论的典型应用。安。xml文档是一个带标签的词汇表。本体可以分为领域、通用、应用和表示四种类型。领域本体包含特定类型领域(如电子、机械、医学、教学)的相关知识,或某一学科或课程的相关知识;通用本体覆盖几个领域,通常称为核心本体。应用本体包含特定领域建模所需的所有知识;表示本体不局限于特定领域,还提供了描述事物的实体,如“框架本体”,其中定义了框架和槽的概念。可见本体的建立是有一定水平的。在教学领域,如果把某一门课程中的概念、术语及其关系看作一个具体的应用本体,那么* * *在所有课程中的概念和特点都具有一定的普遍性。本体论这一哲学范畴被人工智能领域赋予了新的定义,从而被引入到情报学中。然而,信息科学界对本体的理解是逐渐发展和成熟的。1991年,内奇斯等人首先给出了情报学中本体的定义:“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系规定这些词汇的扩展规则的定义。”后来在信息系统、知识系统等领域,随着研究本体的人越来越多,出现了不同的定义。1993格鲁伯将本体定义为“概念模型的明确规范”。在1997中,博斯特被进一步完善为“* * *享受概念模型的形式规格说明”。Studer等人对上述两种定义进行了深入的研究,认为本体是对* * * *概念模型的明确的形式规范,这也是目前对本体概念的统一看法。Studer等人对本体的定义包含四层含义:概念模型、显式、形式化和* * *共享。“概念模型”是指对客观世界中的某种现象的相关概念进行抽象而得到的模型,其意义独立于具体的环境状态;“清楚”意味着所使用的概念和使用这些概念的约束条件被清楚地定义;“形式化”是指本体是计算机可读的,即可以被计算机处理;“* * *享受”是指本体体现了* * *所认知的知识,反映了相关领域所认知的概念集,是针对群体而非个体的。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域的词汇,并从不同层次的形式模型中给出这些词汇(术语)与词汇之间关系的明确定义。虽然对本体的定义有很多不同的方式,但是从内涵上看,不同的研究者对本体的理解是统一的,他们都把本体看作一个领域(一个领域的范围可以是特定的应用,也可以是更广泛的范围)。交流的语义基础(对话、互用性、* *享受等。)在不同的内部主体(人、机器、软件系统等)之间。),也就是本体提供了一种* * *知识。而且本体提供的这种知识主要是给机器用的,机器无法像人类一样理解自然语言表达的语义,目前的计算机也只能把文本当做字符串来处理。所以在讨论计算机领域的本体时,要讨论如何表达* * *知识,也就是概念的形式化。语义网中的本体?本体研究热点的出现也与语义网的提出和发展有直接关系。语义网是蒂姆·伯纳斯·李提出的另一个概念。蒂姆·伯纳斯·李认为,现在的网络是供人们阅读和理解的。作为一种日益庞大的归档介质,它不利于数据和信息的自动处理。新一代语义网不仅要给人类带来语义内容,还要给计算机(信息代理)带来语义内容,让计算机(或信息代理)能够“理解”Web内容,实现信息处理的自动化。他认为语义网不是另一个孤立于当前网的网,而是当前网的延伸。在语义网中,信息的语义被很好地定义,可以更好地促进计算机与人的合作。为了实现语义网的功能,需要提供计算机能够理解的结构化语义描述机制和一系列推理规则来实现自动推理。语义网的挑战是提供一种语言,可以表达数据和数据中的推理规则,它需要这种语言将目前存在于知识表示系统中的规则应用到Web上。在蒂姆·伯纳斯·李的语义网框架中,有几个关键组件。它们是XML、RDF和Ontology。XML允许用户定义自己的文件类型和任意复杂的信息结构,但XML只是语法上的,它不能解释所定义结构的语义。XML在语义网中的重要地位与XML是一种载体语言和XML的命名机制密切相关。在蒂姆·伯纳斯·李看来,语义描述是通过RDF进行的。RDF的两个特点对此做出了特殊的贡献:(1)RDF是由资源、属性和属性值组成的三元结构。这种三元结构类似于句子中主语、谓语和宾语的关系。一个描述资源的RDF语句,就像“某物具有什么样的属性”这句话一样有效。它可以表现出对事物存在状态的一种断言,可以表达大多数情况下计算机需要处理的知识。(2)RDF的另一个重要特征是,组成RDF的资源、属性和属性值必须用URI(统一资源标识)来标识。因为RDF使用URIs对信息进行编码,这意味着RDF引用的任何资源、属性和属性值都是预定义的模糊概念。RDF可以表达陈述句,主语、谓语和宾语这三个构成要素都是由URIs确定的,所以它具有语义表达的特点。但是语义网的要求远不止这些。语义网还需要增加逻辑功能:语义网需要能够使用规则进行推理,选择行动路线,回答相关问题。本体是语义网实现逻辑推理的基础。?语义网研究人员还认为,本体是一个标准化的文件,它正式定义了词之间的关系。对于语义网来说,最典型的本体有一个分类体系和一系列推理原则。其中,分类系统定义了对象的类别以及类别之间的关系。实体之间的类/子类关系对于Web应用程序具有重要价值。在本体中,你也可以给一个类添加属性来定义更多的类别关系。这些范畴关系提供了推理的基础。借助于本体中的推理规则,语义Web应用系统可以提供更强的推理能力,例如可以在一个地理本体中添加一个规则,“如果一个城市代码与一个省代码相关,一个地址使用一个城市代码,那么这个地址与对应的省代码相关”。通过这个规则,程序可以推断中科院文献信息中心位于中关村,应该位于北京。本体语义网研究人员为了描述本体,在RDF的基础上开发了RDFS。RDFS可以借助几个预定义的词,有限地描述概念之间的关系(如RDFS:资源,RDFS:类,RDFS:属性,RDFS:的子类,RDFS: subpropertyof,RDFS:域,RDFS:范围)。为了更方便、更全面地实现对本体的描述,W3C正在RDFS的基础上,借助DAML和OIL的相关研究,积极推动OWL(Web Ontology Language)的应用。自2004年2月10日起,OWL成为W3C推荐的标准。为了找到某一研究领域的相关信息,生物学家往往要花费大量的时间。更糟糕的是,不同的生物数据库可能使用不同的术语,就像一些方言一样,这使得信息搜索更加麻烦,尤其是没有规则的机器搜索。基因本体(GO)就是为解决这一问题而发起的项目。基因本体论中最基本的概念是$ term。GO中的每个条目都有一个唯一的数字标签,比如GO: nnnnnnn,以及一个$ term名称,比如“细胞”、“纤维生长因子受体结合”或“信号转导”。每一个$ term都属于一个本体,总有三个本体,即分子功能、细胞成分和生物过程。一个基因产物可能出现在一个以上的细胞成分中,或者它可能在许多生物过程中起作用,并在其中发挥不同的分子功能。例如,基因产物“细胞色素c”被分子功能术语描述为“氧化教育活性”。生物过程术语用于描述“氧化磷酸化”和“诱导细胞死亡”,最后,其细胞成分术语是“线粒体基质”和“线粒体内膜”。基因本体中的$ term有两种相互关系,分别是是关系和部分关系。Is_a关系是简单的包含关系。比如A是_a B表示A是B的子集,比如核染色体是_a染色体。part_of的关系稍微复杂一点。C part_of_D的意思是如果C出现了,那么它一定是D的一部分,但是C不一定总是出现。比如细胞核part_of cell,细胞核肯定是细胞的一部分,但是有些细胞没有细胞核。基因本体的结构是一个有向无环图,类似于一个分类树,但不同的是一个$ term在基因本体的结构中可以有多个父节点。例如,生物过程$ TERM“己糖生物合成”有两个亲本,它们是“己糖代谢***”和“单糖生物合成”,因为生物合成是一种代谢,而己糖是一种单糖。基因本体论使用了牛津分子生物学词典(1997)中的定义,也参考了瑞士-PROT、PIR、NCBI·CGAP、EC…既定的标准并不是唯一的标准(GOC一直强调的),自然也没有规定每个研究者都必须遵循这个控制词集体系。采用的动态结构是用DAGs(有向无环图)的neork把各个本体串联起来,形成一个层次树,也就是上面提到的“是a”和“的一部分”的关系。因为GO是一个集成的分类体系,其下的三个主要本体是独立的,但无论是GOC的原设计还是我们的使用,还是存在一定的流程关系。在基因/蛋白质或本体的注释过程中,首先考虑细胞中涉及的组件和元件,其次在分子水平上行使组件/元件的分子功能,最后可以呈现分子功能直接参与的生物学过程。由于这是一个带有反馈机制的标注过程,而且整个系统是动态开放的,实时更新的,所以在一定程度上具有纠错能力。TAMBIS项目是唯一一个在概念和联系层面实现了信息资源整合的系统。但是还有其他相关的计划在研究中。比如BioKleisli(宾夕法尼亚大学计算机科学系)利用Mediator技术实现了多个数据源的集成,随后的K2/Kleisli系统也利用数据仓库实现了OLAP(联机分析处理)。DiscoveryLink(IBM研究院)实现了基于包装器/中介器的信息源集成,提出了查询分解和基于成本的优化策略。TAMBIS(曼彻斯特大学计算机科学系)实现了基于包装器/中介器的信息源集成,使用BioKleisli中的CPL语言作为查询语言,并给出了查询优化的方法。TaO的本体定义(TAMBIS Ontology)提供了领域知识供用户浏览和查询。TINet(GSK公司和IBM研究院)基于多数据库中间件OPM(Object-Protocol Model)定义了数据源的对象视图,其CORBA(common Object request broker architecture)服务器使得数据源的包装器更易于扩展。但它们都有一定的缺陷。BioKleisli系统的查询能力比较弱,没有给出查询优化策略。TAMBIS系统和DiscoveryLink系统整合的数据源数量相对较少,且后者在查询处理中没有使用领域知识,因此没有从语义的角度考虑查询分解。TINet系统中的查询处理能力不强。目前突出的问题是缺乏在数据库查询中选择最佳检索成员和动态生成最优检索方案的能力,尤其是当多个数据库中存在重叠信息时。而且现有的工作主要集中在数据集成上,很少考虑服务集成。支持数据和服务综合集成的系统还不完善。所以这也将是围棋未来发展和推广的一个重要方向。本体构建导论在实际应用中,本体学家、知识管理、人工智能、情报学(图书馆学)乃至任何一个有大量信息需要分类划分的部门或领域都可以成为本体的应用对象。本体的基本元素是词汇($ term)/概念,词汇又构成同质类和子类,然后通过在每个类和概念之间添加适当的关系形成一个简单的本体。概念和类都是用来表达词汇本身的,而关系为词汇提供映射,并添加约束,使其符合实际情况。本体构建最常用的软件Protege是由斯坦福大学开发的。最初应用于医学领域,后来逐渐推广到其他领域。软件本身也是开源软件。步骤构建本体的简单步骤是:1。列出研究课题涉及的术语。2.根据术语的固有属性和排他性特征对其进行归纳和修改,为术语建立类和层次分类模型。3.添加一个关系来连接术语和分类法4。最后根据需要,在Protege中,可以使用其附带的函数和插件,以文字和图形的形式导出本体,格式可以自由选择。本体论的根本问题是:“存在的最初分类是什么?”不同学派的哲学家对这个问题有不同的解释。这个问题使得在神学、图书馆学和人工智能研究中使用本体论知识成为必要,并体现在宇宙观、道德观和美学观念中。此外,本体论提出的问题还包括:存在是什么?什么是实物?物体的基本属性是什么?确定一个对象有什么区别?「实物的存在」的基本定义是什么?物体的特征是什么?存在的特征是什么?一个物体什么时候停止存在?不仅仅是改变。为什么物体可以相对于虚无而存在?历史本体论可以追溯到古希腊的柏拉图和亚里士多德。亚里士多德曾将本体论定义为“研究物体存在的科学”。具体来说,它研究对象的分类,即在什么情况下,一个对象可以被定义为“存在”。比较理论包括“普遍的”问题和“具体的”问题、概念、对象和联系。关于存在可以问很多问题:“什么是存在?”“有什么?”“我是什么?”对于本体论来说,最基本的是要搞清楚什么是对象,什么是理念,以及它们之间的关系。笛卡尔在启蒙运动中提出的“我思故我在”为本体论的基本问题开了先河。笛卡尔没有深入研究,也不认为有深入研究的必要。他认为“我思故我在”证明了上帝的存在,后来的神学家也认为:“谁能把这句话应用于一般的一切?”当然只有“上帝”了。20世纪,当数学哲学、科学哲学、基本粒子物理的新发现打破了之前很多物质的所谓边界,人们已经不再满足于神学观点。在20世纪的不同时期,存在着形而上学的主观主义、客观主义、相对主义等不同流派。后现代实体哲学家试图通过不同环境下的哲学行动来重新定义上述问题,主要依靠生物学、生态学和认知科学的最新研究成果来理解动物在自然和人工提供的环境中的认知状况。命题相对于不同环境的变化,使得存在更难定义。如果人们说,“A是B”,“A一定是B”或者“A曾是B”,是什么意思?有的哲学家主张去掉英语中的“是”这个词,用一个抽象的意义代替,以避免混淆;其他哲学家试图理解词汇的深层含义和用法;马丁·海德格尔想要区分“存在”和“对象”的意义。存在主义者认为“存在”是最基本的概念,很多事情都可以说是“是”,而动词“是”有很多用法,所以很容易混淆,所以存在有很多种。简单来说,本体论就是探究这个世界上的一切事物背后是否有一个不依赖于现实世界的抽象基础。无论是精神还是物质,都有自己的抽象基础。简单来说,玄学指的是我们能够感受到的现实世界,玄学指的是感性世界背后的原因,这些原因是抽象的、无形的,是作为感性世界的基础而存在的。本体论是探索形而上世界的形而上基础。