什么是agent的局部信念和全局信念?
相似性:实体、封装状态,可以执行某些动作和方法;通过消息交流;
差异:
1)在决定是否执行对象的方法时,决策权不同;在面向对象系统中,决策由主动调用方法的对象做出,而在代理系统中,决策由接受请求的代理做出;。
2)柔性行为能力(反应性、主动性和社会性)被认为是Agent的基本属性之一;
3)主体的并行性是最基本的特征;传统对象不是这样的;
二、面向服务架构SOA概述
面向Agent的系统具有越来越广泛的应用价值。在理性agent的形式化过程中,一般认为agent的思维状态包括信念、欲望和意图三个属性,因此BDI模型一直是agent建模研究的重点。
BDI模型
目前,agents使用的BDI模型一般是在Cohen和Levesque的正规模态逻辑的意图模型和Rao和Georgeff的BDI计算数逻辑模型的基础上发展起来的,即侧重于信念、欲望和意图的形式化描述,简称BDI。要解决的本质问题是如何确定代理人的目标,以及如何实现目标。
BDI模型包含三个基本组成部分:
(1)信念是一组与世界有关的信念,与其他主体的思维倾向有关的信念和自我信念。信念是主体对世界的认知,包括描述环境特征的数据和描述自身功能的数据,是主体思维活动的基础。
(2)欲望是主体的初始动机,是他希望达到或维持的一组状态。主体想要达到的状态,可以刺激系统的规划和行动。一般来说,可以表示为主体对环境状态的期望和判断,即判断状态是否成立是愿望是否实现的标志。代理人可以有不相容的愿望,他们不需要相信自己的愿望是绝对可以实现的。
(3)意向是当前最需要完成或最适合完成的,是当前主体即将达到的目标,属于心理状态的意向方向。当前意图对代理人的当前动作起指导作用。
基于BDI模型的agent研究一般分为两个层次,一个是理论层,也叫逻辑层,主要研究如何用逻辑方法对BDI agent给出一个形式化的语义描述;另一个层面是实际应用层面,包括系统架构的设计和编程实现。
2.BDI逻辑
2.1模态逻辑
模态逻辑是关于必然性和可能性的逻辑,或者说是关于“必须是”和“可能是”的逻辑。模态逻辑不仅考虑事物实际存在方式的真与假,还考虑如果事物处于与实际存在方式不同的存在方式,什么会是真或假。逻辑关注的是真假,而模态逻辑关注的是现实世界和其他可能世界中的真假。从这个意义上说,一个命题在一个世界中是必然的,只有在所有可能取代这个世界的世界中为真,在一个可能取代这个世界的可能世界中为真才有可能。
通常,□代表必然性运算符,△代表可能性运算符。
定义:一个框架F被表示为一个有序对
定义:一个模型M被表示为一个三元序数群
定义:如果K是极小正规模态系统,那么很多模态系统都是在K上加公理得到的,比如T,S4,S5,KD等。
2.2 ?BDI逻辑
BDI逻辑是一种多模态逻辑,它在可能世界语义下将信念、愿望和意图建模成正规模态算子,分别表示为BEL、DES(目标)和INT,其中(agent)s)。
BDI: B,D,I D,I满足自反性;
BDI: B,D,I满足自反性和传递性;
B D I: B满足欧几里德、连续性、传递性,D满足自反性、传递性、对称性;我满足反身性。
3.组合逻辑
组合逻辑的目标是能够综合利用熟悉的现有逻辑工具。目前组合技能有两种,一种是融合,一种是纤维。通过详细的对比分析,本文认为纤维法更为可行。(刘阳负责解释)
4.具有复合作用的BDI模型扩展。
本章考虑了复合动作,在前人扩展的BDI模型中加入了RES(结果)和OPP(机会)两个算子,并给出了语义描述。
4.1研究背景和动机
我们可以把世界上的事情定义为对错,也可以把行动和事件定义为成功和失败。BDI模型中没有与动作和事件相关的概念。
动作和事件的细微区别如下:动作是指当一种状态转化为另一种状态时,主体所采取的动作;事件是特定代理执行特定操作的性能结果。
饶?Georgeff基于提出的时态框架给出了事件的语义描述,但没有解释具体事件中涉及的动作。
4.2研究基金会
(1)布朗理论-行动与能力
考虑到行动和能力的因素,本文指出了能力的一个主要度量:可靠性,它可以用重复执行的次数来度量。
定义:模型M=(W,f,v),其中W是可能世界的集合;v是每个世界中原子命题的赋值;f是一个函数,它将一个单独的世界与一组世界联系起来。
m,w?能力?iff?然后呢。:M,w '?
语义是:在模型中,有一个世界集合,使得世界集合中的任意一个世界满足智能体的能力?,那么我们认为代理人有能力。
布朗理论也给出了意志、力量等算子的定义。
(2)能力的非有意论;
Elegesem在Sommerhoff提出的非故意和客观目标导向的基础上,认为主体在动态环境中保持特定的目标状态。
定义:焦点条件f(,)= o,语义:认为要实现目标,至少要有某个时间点,至少要有一个动作变量,至少要有一个环境变量,这样才能在任何时间、任何条件下通过执行动作来实现目标。
定义:模型m = (w,v),w是世界集;= … ;v是一个函数。是w的动力集
定义:?(w,),I指代理人;w指某个世界;是使目标g为真的世界的集合。(w,)的语义:它是一个世界的集合,在这个世界中,主体I有能力实现目标G..
定义:?(w,),当且仅当w '满足f(,)= O。
定义:成功?(W,X) X if x w。
理论意义:在所有的世界中,如果一个主体有能力实现目标,就可以定义为成功。
Elegesem的无意图理论也区分了“施事者有实现目标的能力”和“施事者通过采取行动真正实现了目标”并给出了语义描述。
⑶能力-BDI;
Padgham认为,一个代理人有能力实现某个目标G,它总是与一个计划有关。事实上,每一个计划都可以被认为是实现这个目标G的一个触发事件,这意味着代理人至少有一种方法来实现目标G .
定义:信念-能力相容性公理:CAP() BEL(),语义:如果代理人I有能力实现它,则代理人I相信它。
定义:能力-目标相容性公理:GOAL() CAP(),语义:如果agent I的目标是,agent I有能力实现它。
下表显示了添加CAP后的BDI模型和Rao。乔治夫提出的BDI原型机的比较:
饶?乔治夫·帕德加姆?
I系统IC系统?
A1: GOAL( ) BEL( ) CAP( ) BEL()?
A2: INT( ) GOAL( ) GOAL( ) CAP()?
a3:INT(does())does()CAP()BEL(CAP())?
a4:INT()BEL(INT())GOAL()CAP(GOAL())?
a5:GOAL()BEL(GOAL())INT()CAP(INT())?
A6: INT( ) GOAL(INT())?
A7: done( ) BEL(done())?
A8: INT()必然◇( INT())?
4.3 RES算子和OPP算子介绍
上述BDI理论考虑添加其他操作符来对代理进行建模。但是,还有一些问题没有涉及到。比如上表中的A3: INT(does( )) does(),如果在复合动作的条件下,我们得到:INT(does(;))确实(;)
这样就不考虑动作的执行对后续动作执行的影响。
为了解决这个问题,本文引入了RES和OPP两种算子,并给出了语义描述。
OR1:
CAP(does(;)) ?【贝尔(does())OPP(does())】RES(done())?
语义:如果一个智能体有能力执行复合动作?的能力
然后在某个时刻,代理人相信自己可以执行动作,有机会执行动作,相信自己可以执行动作,有机会执行动作,执行动作的结果不会导致违法状态。
OR2:
CAP(does(;)) ?[CAP(does())OPP(does())]RES(done())?
语义:如果一个智能体有能力执行复合动作?的能力
那么代理人有能力执行动作,有机会执行动作,执行动作的结果不会导致非法状态。
OR3:
CAP(does(;)) ?【贝尔(CAP(does()))OPP(does())】RES(done())?
语义:如果一个智能体有能力执行复合动作呢?达到目标,
那么这个代理人相信它有能力和机会执行动作,并且执行动作的结果不会导致非法状态。
……
OR7:
CAP(如果?然后呢?else))?
[ ?BEL(CAP(does()))OPP(does())]RES(done())]?
[ ?贝尔(CAP(does()))OPP(does())]RES(done())]
语义:如果一个代理有能力执行一个动作,否则,执行一个动作?
然后,成立且代理人认为其有能力、有机会执行动作,执行动作的结果不会导致违法状态;或者不成立且代理人认为自己有机会执行动作,执行动作的结果不会导致违法状态。
5基于可废止逻辑的意图推理
5.1问题命题
饶?Georgeff被建模为正规模态算子,因此在重言式蕴涵问题下不可避免地存在逻辑全知问题和副作用。
(1)逻辑全知问题
INT()
(2)同义反复所隐含的副作用。
INT( ) INT(R)
(3)析取扩大问题
INT( ) INT(R?)
(4)合取分离问题
INT(R?)INT(R)?INT()
5.2理论基础
(1)科诺利格?波拉克意向建模
Konolige和Pollack认为正规模态逻辑不适合于意图。他们用场景来表现代理人的精神状态。公式的方案是W真理的子集。模型中的方案集I是所有互不相等的意图公式的集合,只有与I中的一个公式等价的公式才是代理人的意图。所以,如果在这个模型中int()可以用int来表示,
②饶?乔治夫打算做模特。
饶?为了克服上面提到的问题(3)和(4),引入了BDI的唯一模态形式,它本质上类似于KonoligePollack理论。
5.3 de可行逻辑介绍
本文从另一个角度出发,利用基于非单调逻辑的可废止逻辑,研究了基于策略的意图模型。
非单调逻辑是一种推理:推理系统的定理集不随推理过程单调增加,新的理论很可能否定和改变原有的一些定理。非单调推理是处理不完全知识的工具。
可废止逻辑是一种非单调推理,可废止逻辑在意图推理中的应用是允许agent在不完全了解环境的情况下,利用已有的不完全知识进行推理。
6总结和下一步工作
(1)多智能体系统的建模
(2)tableaux系统
(3)多代理系统的动态维护
更多信息:
“ERP首席设计师论坛”()