(计算机应用技术专业论文)粒度计算中的不确定性问题研究.pdf_第1页
(计算机应用技术专业论文)粒度计算中的不确定性问题研究.pdf_第2页
(计算机应用技术专业论文)粒度计算中的不确定性问题研究.pdf_第3页
(计算机应用技术专业论文)粒度计算中的不确定性问题研究.pdf_第4页
(计算机应用技术专业论文)粒度计算中的不确定性问题研究.pdf_第5页
已阅读5页,还剩119页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着4 i 确定性人1 智能的发展,对问题领域近似建模与分析推理的粒度计算 与= _ i i i i 精确概率及其图模型已成为人t 智能领域研究的热点,本文在对国内外在该 方面的研究现状进行深入分析基础上,对粒度计算与巧i 精确概率的基本理论方法 及应用进行了系统的研究与探讨,全文主要内容如下: 1 对于粒度计算的一个主要模型“商空间理论”,提出基于可测空间的商空 间逼近理论;并给出信息非一致情形下半序结构的融合方法。 2 因果定性网络是b a y e s 网络的定性抽象,c r e d a i 网络是相应于b a y e s 刚 络一种扩展,这二者都是h i 精确概率的图模型表示。实际应用中,人们不一定能 得到完整的b a y e s 恻络信息,有时只是某一方面了解较多。本文从粒度计算的角 度,提出广义冈果定性例络的概念及其定性融合方法,这为b a y e s 网络结构学习 提供一种新的近似建模方法:定性融合逼近。 3 对于高维海量且多模式数据集分类问题,构造性学习算法在很多方面比 其他学习算法具有较大优势,但同时也出现一些不足之处。本文从计算学习理论 角度将因果l 列络应用于构造性学习,提出因果覆盖算法。利用训练集包含的冈果 信息,找到每个类别样本出现机会最大的球领域位置,这为构造性学习算法的优 化提供了一个新的思路。不足之处是考虑到汁算代价,该算法在第一次取覆盖中 心时用到各类的最优中心,它起到“尽量盖住同类样本出现机会最多的球形领域” 的作用,而接下的覆盖中心是随机取的,同时因果网络的结构学习不够完善仍在 进一步发展中。另一方面,将因果网络结合构造性学习应用于数据挖掘问题中, 提出两阶段因果覆盖算法。该算法利用数据的各个属性之间或部分属性之间具有 定的因果关系直接找到影响数据的类别属性的属性集,即父亲属性集,并由此 父亲属性集与类别属性一起作为样本集的新属性集,再应用构造性学习算法对降 维后的数据集进行分类,这是一种新的降维方法。 4 提出一个无监督学习条件下判断离群点的算法,该算法在试验中被证实 是有效的;并指出训练集对学习效果的影响,进而提出训练集中样本之间的鞅性 要求,这本质上是对数据生成的不同机制的一个要求以防止太多的离群点的出现 影响学习结果。 5 在考虑计算代价的意义下,对粒度计算在认知过程中对问题领域的表示与 4 i 确定性近似建模i q 题提出商概率模型。商概率本质上也是一个不精确概率,即 它随粒度的变化而变化:它又有概率的本质特征,即在该粒度下的商集所生成的口 一域上具有o - 有限加性;另一方面, 商概率的概率更新能够反映出粒度之间的关 系,即粒度粗细与是否构成分层递阶关系。 关键词:粒度计算,冈果网络,因果定性脚络,构造性学习,不精确概率,鞍 a b s t r a c t w i t ht h e d e v e l o p m e n to fa r t i f i c i a li n t e l l i g e n c ew i t hu n c e r t a i n t y ,g r a n u l a r c o m p u t i n g 、i m p r e c i s ep r o b a b i l i t ya n di t sg r a p h i c a lm o d e l sh a v eb e e nf o c u so nt h e r e g i o no fa p p r o x i m a t em o d e l i n ga n dr e a s o n i n gi na r t i f i c i a li n t e l l i g e n c e a f t e ra n o v e r v i e wo nt h er e s e a r c ho v e rt h ew o r l d ,t h es o m eb a s i ct h e o r i e sa n da p p l i c a t i o n so f t h e mi nt h i st h e s i sa r ei n v e s t i g a t e da sf o l l o w s : 1 q u o t i e n ts p a c ea p p r o a c h a b i l i t yt h e o r yb a s i n go nm e a s u r es p a c e si sp u t f o r w a r dw i t hr e s p e c tt oq u o t i e n ts p a c et h e o r yt h a ti so n eo f t h em a i nm o d e li ng r a n u l a r c o m p u t i n g ,a st h es a m et i m e ,as e m i o r d e rs t r u c t u r ef u s i o nm e t h o du n d e rt h ec o n d i t i o n o fi n c o n s i s t e n c yi n f o r m a t i o ni sp r e s e n t e d 2 c a u s a l q u a l i t a t i v en e t w o r k s ( n a m e l y , q u a l i t a t i v ep r o b a b i l i s t i cn e t w o r k s ( a b b r i vq p n s ) ,o rq u a l i t a t i v eb a y e s i a nn e t w o r k s ) a r eq u a l i t a t i v ea b s t r a c t i o n so f b a y e s i a nn e t w o r k s ,b e a r i n gas t r o n gr e s e m b l a n c et ot h e i rq u a n t i t a t i v ec o u n t e r p a r t s ,a n d a r eag r a p h i c a lm o d e lf u ri m p r e c i s ep r o b a b i l i t y ;c r e d a ln e t w o r k s ,a sar e p r e s e n t a t i o nf o r as e to f b a y e s i a nn e t w o r k so v e raf i x e ds e to fv a r i a b l e s ,i sa n o t h e rg r a p h i c a lm o d e lf o r i m p r e c i s ep r o b a b i l i t yi nf a c t u a la p p l i c a t i o n s ,d i f f e r e n tp a r ti n f o r m a t i o no fb a y e s i a n n e t w o r k sc a nb eo b t a i n e df o rs o m ep r o b l e ms ot h a ti n t e g r a t i n gt h e mi n t oaw h o l ei s n e c e s s a r yb a s i n go nt h ea b o v e ,an e wc o n c e p t ,n a m e l yg e n e r a l i z e dc a u s a lq u a l i t a t i v e n e t w o r k s ,i sp r e s e n t e d ;a st h es a m et i m ei t sq u a l i t a t i v ef u s i o nm e t h o di sp u tf o r w a r dd u e t og r a n u l a rc o m p u t i n g 3c o n s t r u c t i v e l e a r n i n gm e t h o d sb a s e d o nc o v e r i n gh a s a d v a n t a g e s f o r h a n d l i n gh u g ea m o u n t 、m u l t i c l a s sa n dh i g hd i m e n s i o n a l i t yd a t aa c c o r d i n gt ot r a i n i n g s a m p l e s ,b u ti t ss o m ed e f e c t ss u c ha ss a m p l e so fr e f u s e d - r e c o g n i t i o na p p e a r i nt h e t h e s i s ,an e wa l g o r i t h mn a m e dc a u s a lc o v e r i n ga l g o r i t h mi s p r e s e n t e dt h r o u g h a s s o c i a t i n gc a u s a ln e t w o r k sw i t hc o n s t r u c t i v el e a r n i n gw i t hr e s p e c tt o c o m p u t i n g l e a r n i n gt h e o r yc a u s a lc o v e r i n ga l g o r i t h mp r o v i d e san e wm e t h o df o ri m p r o v e m e n to f t h ec o v e r i n ga l g o r i t h mb e c a u s eo fh a r n e s s i n gc a u s a li n f o r m a t i o ni nt r a i n i n gs a m p l e s o nt h eo t h e rh a n d ,w i t hr e s p e c tt od a t am i n i n gu n d e rt h ec o n d i t i o no fd a t as e tw i t ha f e a t u r es p a c eo fh i g hd i m e n s i o n a l i t ya n dag r e a tn u m b e ro fs a m p l e s b a s i n go na b o v e , a na l g o r i t h m ,n a m e dt w o - s t a g e sc a u s a lc o v e r i n ga l g o r i t h m ,i sg i v e nt oi n t e g r a t ec a u s a l d i s c o v e r i n gi n t oc o v e r i n ga l g o r i t h mi no r d e rt oe f f e c t i v e l yr e d u c ed i m e n s i o n a l i t yo fd a t a s e t t h ed e f e c to fc a u s a lc o v e r i n ga l g o r i t h ma n dt w o - s t a g ec a u s a lc o v e r i n ga l g o r i t h mi s t h a tt h ee x p e r i m e n te f f e c tu s i n gt h e mi sn o ts a t i s f i e db e c a u s et h es t r u c t u r el e a r n i n go f c a u s a ln e t w o r k si sn o td e v e l o p e da sw e l la so t h e rr e a s o n sb yt h e m s e l v e s w i t ht h e i m p r o v e m e n to ft h es t r u c t u r el e a r n i n go fb a y e s i a nn e t w o r k s ,t h ea b o v et w oa l g o r i t h m s w i l li m p r o v et h e i rp e r f o r m a n c e h o w e v e r , i n t e g r a t i o nb e t w e e nt h ec o v e r i n ga l g o r i t h m a n dc a u s a ln e t w o r k sw i l lh a v eg o o dp r o s p e c tf o rd a t am i n i n g 4 t h es e l e c t i o no ft r a i n i n gs a m p l es e th a ss o m ei n f l u e n c eo nc l a s s i f i c a t i o n p r e c i s i o na n dg e n e r a l i z a t i o na b i l i t yo f c l a s s i f i e r i nt h et h e s i s ,m a r t i n g a l ec r i t e r i o na b o u t s e l e c t i n gt r a i n i n gs a m p l e sa sw e l la so u t l i e r s d e f i n i t i o ni sb r o u g h tu p ,a n dak i n d o f o u t l i e r sd e t e c t i o na l g o r i t h mi sp u tf o r w a r db a s i n go nu n s u p e r v i s e dl e a r n i n gt h e e x p e r i m e n tr e s u l to fas i m u l a t e dd a t as h o w st h a tt h ea l g o r i t h mc a ne f f e c t i v e l yd e t e c t s a m p l e sp r o d u c e db yd i f f e r e n tm e c h a n i s m s ,n a m e l yo u t l i e r s 5 u n d e rt h ec o n s i d e r a t i o no fc o m p u t i n gc o s t ,aq u o t i e n tp r o b a b i l i t ym o d e li s p r e s e n t e df o ra p p r o x i m a t em o d e l i n go fp r o b l e mr e g i o nw i t hu n c e r t a i n t yi nc o g n i t i v e p r o c e s s q u o t i e n tp r o b a b i l i t yi sak i n do fi m p r e c i s ep r o b a b i l i t yi ne s s e n c eb e c a u s ei t v a r i e sw i t hg r a n u l a r i t yc h a n g e ;o nt h eo t h e rh a n di tb e a r si n b e i n gc h a r a c t e ro f p r o b a b i l i t y ,n a m e l y i t h a sc r f i n i t ea d d i t i o n i n o - 一f i e l d sp r o d u c e d b y t h eq u o t i e n ts e t w i t h t h eg r a n u l a r i t y u p d a t i n go fq u o t i e n t p r o b a b i l i t y c a nr e f l e c tt h er e l a t i o na m o n g g r a n u l a r i t i e s ,n a m e l yh i e r a r c h i c a lr e l a t i o n k e y w o r d s :g r a n u l a rc o m p u t i n g ,c a u s a ln e t w o r k s ,q u a l i t a t i v eb a y e s i a nn e t w o r k s , c o n s t r u c t i v el e a m i n g ,i m p r e c i s ep r o b a b i l i t y , m a r t i n g a l e l , 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得矮矿致犬、挈或其他教育机构的 学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示谢意。 学位论文作者签名:玄i 宏舞衫签字日期:2 口口 年岁月驴日 学位论文版权使用授权书 本学位论文作者完全了解安f 字文太学有关保留、使用学位论文的规定,有 权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借 阅。本人授权安彳| 姒奇以将学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:方,君赤7 i 乡 导师签名 签字日期:2 ,d d 6 年 月矿日签字日期 学位论文作者毕业去向 工作单位: 通讯地址: 电话: 邮编: 矽一 表2 5 1 表2 - 5 2 表2 5 3 表2 5 4 表3 - 2 1 表3 - 2 2 表3 - 2 3 表3 - 2 - 4 表3 - 2 5 表3 - 2 6 表3 - 3 1 表3 - 3 2 表4 - 2 1 表4 2 - 2 表4 2 3 表格清单 定性信息矩阵a k 在一条路径上,两变量之间定性影响的计算o 算子 并行路径的两变量之间定性影响计算算子:o 一算子 合成定性信息值符号。运算算子 测试结果比较 实验数据有关信息表 测试结果比较 实验数据有关信息表 测试结果比较 最近恻上实验结果比较 实验数据有关信启 测试结果比较 文献【7 】中的模拟数据 改进的层次聚类算法对表4 - 2 1 的数据试验结果 其他判断方法的比较 8 ” 弘 撕 甜 加 加 阳 陀 弛 弼 罟窨 如 如 插图清单 图2 21 一个简单b a y e s 网络的定性部分 图2 4 1 在信息一致条件下的半序结构融合模型 图2 4 2 信息非一致条件下的空间半序结构 图2 5 1 定性正影响关系 图2 5 2 一个简单的q p n 网络q k 的图模型 图2 5 3 冈果定性网络的图模型 图2 5 4 一种冈果定性影响协同图模型 图2 55 广义冈果定性刚络g 的图结构与广义冈果定性网络g 的图结构 图2 56 融合后的广义冈果定性蚓络g 的图绗构 一 图2 61 一个c r e d a l 刚络 一 图3 2l 一个含有隐变量的简单b a y e s 嗍络 图3 22 一个不含隐变量的简单b a y e s 刚络 图3 2 3 ( a ) 含有隐变量h 的图结构 图3 2 3 ( b 1 不含隐变量h 的图结构 图3 2 4 m p 神经元的数学原理示意图 图3 2 5 7 - 个简单有限混合模型( 或b a y e s i a n m u l t i n e t ) 的图结构 图3 2 6 样本数为2 0 0 的有限高斯混合模型样本分布图 图3 3 1 一个因果网络的定性部分 一 图3 32 关于类别属性变量x 6 因果降维后得到的图结构 图4 41 提要模式 图4 42 + a 的分层提要 x 加 刀 描 m 舶 舶 舭 m 粥 粥 埘 彤 彤 朋 彤 佃 舶 舶 叭 第一章概述 1 1 不确定性知识表示的概率图模型 客观世界中的大部分现象都是不确定的,而确定的现象是在一定的前提条件 下存在。对于现实世界中存在着大量的不确定性现象,专家系统、决策支持、图 像理解等领域都需要对不确定性信息和知识进行有效地表示、推理、解释和学习。 概率理论是处理随机现象的有力工具,人们对如何使用概率论来有效表示与处理 不确定性知识,开展了长期的、坚持不懈的研究,提出并实现了许多基于概率的 智能信息处理模型和方法,以贝叶斯公式为基础的贝叶斯理论在人1 二智能中处理 才i 确定性占有重要地位。对于复杂的多维随机统计模型,随机变量之间依赖关系 基于贝叶斯理论使用图来表示既直观又自然,这是由于随机变量之间的条件独立 关系与图中的结点之间分割关系具有内在的一些相同性质,由此得到的图模型称 之为概率图模型。随机变量之间的条件独立关系对于减小图模型的复杂性及获得 概率推理有效算法是至关重要的,这使得人们可以研究更复杂的概率图模型。 1 1 1 有向无环图结构的概率图模型 b a y e s 网络( b a y e s i a nn e t w o r k ) 是使用有向无环图结构的一种概率图模型, 是处理不确定性知识的工具,”。使用有向图的b a y e s 网络模型首先由w r i g h t 在路径分析模型中引入【4 , 5 1 ,其后在决策分析中被叫做影响图m 】,而在人工智能领 域又称之为b e l i e f n e t w o r k s 【”。b a y e s 网络的知识表示使用统一的联合概率分布作 为知识库,这保证了知识表示的一致性,提高了推理结论合理性。为解决确定联 合概率分布时所遇到的组合爆炸难题,b a y e s 网络使用有向无环图结构中所蕴含 的条件独立性,在减少独立性限制与降低计算复杂度之间得到合理折衷。 b a y e s 网络由网络结构与条件概率表两部分组成。网络结构是模型中的定性 部分,用于定性描述变量间概率依赖关系。它是一个有翔无环图,图中每个节点 表示问题领域中某随机变量,每条边表示节点间可能存在直接的概率依赖关 系,两节点间没有边连结则表示两节点间没有直接的概率依赖关系。对于网络结 粒度计算中的不确定性刚题研究 构中每个节点,若它没有父节点,则定义一个边际概率分布,若它有父节点,则 定义一个条件概率分布表,表的每一行为该节点在其父节点某一取值状态下的条 件概率分布。条件概率表是模型中的定量部分,用于定量描述节点对其父节点的 概率依赖程度。 b a y e s 网络的结构特征与随机变量( 节点) 的条件独立性之间的关系满足马尔 可夫条件,即:任一节点在已知其父节点取值状态的条件下,独立于它的所有非 子孙节点。b a y e s 网络借助网络结构中蕴含的变量之间的独立性或条件独立性, 将联合概率分解为一系列边际概率和条件概率的乘积,把确定联合概率分布的问 题转化为对边际概率分布和条件概率分布的确定。具体地说,对于n 元的随机向 量u = f x 。,x :,x 。) ,由链式法则可以得到联合概率分布的表示式: p ( u ) = 兀p ( 刊x 。,x 2 ,x 一) = n p ( 葺l p a r ( ) ) ( 1 1 11 ) ,- 1i = l 其中p a r ( x i ) 表示b a y e s 网络结构中x i 的所有父节点的集合( 若没有父节点则 p a r ( x i ) = q b ) ;p ( x i l p a r ( x i ) ) 表示节点x i 在其父节点某一取值状态下的条件概率分布。 贝叶斯网络用图形模式表示随机变量之间的条件独立依赖关系,从而反映出 因果信息。这样人们可以根据贝叶斯网络结构及条件概率表得到联合概率分布与 每个基本事件的概率,基于贝叶斯网络的各种概率推理算法及其应用相继推出 ,”川,” 。由于贝叶斯理论将先验知识与观察样本数据有机结合,运用概率表达 先验信息与观察样本信息,因而使得不确定知识表示与推理清楚且在逻辑上很好 理解。 贝叶斯网络在表示不确定性知识的上述优点,使得其成为人工智能领域进行 不确定性推理与建模的一个有效工具,因而对其进行网络学习就显得重要起来。 b a y e s 网络学习是九叶年代的热点问题1 4 ,”】。若将b a y e s 网络模型看作是一种 概率空间的表示模型,则可以通过样本数据进行学习。近几年,人们提出了许多 改进b a y e s 网络模型,分别在不同的程度上解决了大规模b a y e s 网络的知识表示 等问题1 1 6 , 1 7 , i g , 1 9 , 2 b , 2 1 , 2 2 , 2 3 。这些模型的有效性主要在于不同程度地降低了大规模 b a y e s 网络知识表示的复杂度。 冈果定性网络又称为q u a l i t a t i v ep r o b a b i l i s t i cn e t w o r k ( a b b r i v q p n ) ,它是对应 于b a y e s 网络的定性提取表示2 “。因果定性网络采用有向无环图且在图上附有表 第一章概述 示定性关系的符号,即网络中部分或全部有向弧上带有用以表示随机变量之间定 性概率关系的符号,简单的说,就是表达具有有向弧连接的随机变量之间定性概 率影响或概率协同关系。所谓定性概率影响,是指在有有向弧连接的随机变量之 间,一个随机变量的取值如何影响另一变量取值的概率。p e t e rj 与f l u c a s 口“利 用因果独立与b o o l e a n f u n c t i o n s 对b a y e s 网络概率表的相互作用定性特征进行了分 析与描述,并提出定性因果模式( t h eq u a l i t a t i v ea n dc a u s a lp a t t e r n ( q cp a t t e m ) ) 可 用于b a y e s 网络的设计过程与因果定性网络的定性信息用于b a y e s 网络的建模一种 表示。 另一方面,若对b a y e s 网络的定性部分不变,却对其联合概率分布进行扩大 为一集合,即信任集【2 6 ,得到c r e d a l 网络【2 7 1 ,即一个c r e d a l 网络是一个有向无 环图且图上的每个结点表示一个随机变量,而每个随机变量附有信任或条件信任 集,且按照有向图的马尔可夫条件下结合所有变量的条件信任集组成联合分布 集。因果定性网络与c r e d a l 网络相对于b a y e s 嘲络都是定量部分的某种改变,即 非精确化,而定性部分即网络结构未变。 1 1 2 无向图结构的概率图模型 使用无向图的概率图模型又称为m a r k o v 网络。在无向图中,结点之间的分隔 关系表示随机变量间的条件独立关系,就得到m a r k o v 网络。一个m a r k o v 网络本 质上表示一个m a r k o v 随机场,且被广泛应用于图像处理 2 9 ”】。m a r k o v 随机场 与g i b b s 分布具有等价性 2 s , 3 u ,利用g i b b s 分布与m a r k o v 随机场之间的等价性, 可以给出m a r k o v 网络模型中的联合概率分布一个表示【3 2 】。 1 2 粒度计算与不精确概率 1 2 1 粒度计算 粒度计算是人工智能领域新兴起的一个研究方向,它是信息处理的一种新的 概念与计算方法,日前成为人t 智能领域研究的热点之一。粒度汁算中的粒度是 最基本的概念,所谓粒度是指一个论域的类、簇或子集【3 3 ,论域中属于同一粒度的 对象具有不可分辩性、等价性或相似性。这样在此粒度下,将论域划分为若t 个 粒度计算中的不确定性问题研究 子集的过程就是对论域的粒度化,并根据论域划分所得到的每个子集为基本单位 元素进行推理。粒度计算的基本问题主要为:如何根据问题论域构造粒度,即粒 度的表示、粗细与语义,这涉及到求解效率与有意义程度;另一方面是如何利用 粒度去计算,即粒度的运算法则及其相互关系。 目前世界上粒度计算的主要模型有:模糊集模型”“,粗糙集模型 4 5 a 6 , 4 7 】, 商空间模型【4 8 5 ”。按照z a d e h 粒度训算的定义,商空间理论和粗糙集理论都属 于“粒度计算”范畴,粗糙集和商空间讨论的粒度是“清晰的粒度”,而z a d e h 自己 讨论的是“模糊粒度”。在模型上,三者都是描述人类能按不同粒度来处理事物的 能力的模型。商空间理论、粗糙集理论、模糊集理论都将所讨论的对象的集合构 成论域,但讨论对象之间的关系时却各有不同。模糊集理论能够处理不确定与不 精确问题,但模糊集理论中的对象论域元素x 的隶属度函数不依赖于论域其他对 象元素,而是人们主观的直接给出,因而具有主观性且无精度的概念。粗糙集理 论中的对象隶属度函数值依赖于知识库,直接从处理的数据中得到,但缺少有效 处理问题的代数运算体系与基本粒度的语义解释,等等。商空间理论研究不同粒 度世界之间的互相转换、互相依存的关系,是描述空间关系学说的理论。 模糊集理论模型主要分析粒度的表示问题,即在人们认知过程与推理时,需 要粒度。粒度是用语言来表示,主要是“词计算”问题。按照z a d e h 的思想,从理论 上说商空间理论、粗糙集理论都可以看成是“精确”的粒度计算【5 1 1 。商空间的方法 与“粗糙集”方法都是利用等价类来描述“粒度”,都是用“粒度”来描述概念,但讨 论的着重点有所不同,前者的着重点是研究不同粒度世界之间的互相转换、互相 依存的关系,是描述空间关系学的理论;而目前的粒度计算( 如粗糙集理论等) 主要是研究粒度的表示、刻画以及粒度与概念之间的依存关系。商空间理论是在 论域元素之间存在有拓扑关系的情况下进行研究的,即论域是一个拓扑空间,而 现在的粗糙集理论,其论域只是简单的点集,元素之间没有拓扑关系,即它们讨 论的是无结构的特殊情况。就模糊集理论与商空间理论关系来看,一方面,模糊 集理论被引入商空间提出模糊等价关系,并利用模糊等价关系推广商空间结构模 型得到模糊商空间结构模型口| 】:另一。方面,由于问题论域粒度的一i 断细化构成分 层递阶结构,粒度的粗化伴随着模糊程度加大,反之粒度的细化伴随着模糊程度 第一章概述 减少。同时在给出模糊集的结构性定义后,得到模糊集的隶属度函数的差异不是 本质的,而分层递阶结构的不同才是本质的口”。 1 2 2 商空间意义下定性与定量的相互关系 作为粒度计算的主要模型之一的商空间理论模型,其着重点是论域元素之间 存在有拓扑关系或部分元素之间存在有半序关系的前提下进行粒度分析与计算的 研究。商空间理论的数学模型是采用三元组( 置t ,) 来描述一个问题。其中, x 是论域,即研究的对象:丁是论域的拓扑结构,它表示论域中各元素之间的相 互关系,r ( ) 表示论域上( 元素) 的属性函数,用f 石一y 表示,】,可以是n 维空 间,也可以是一般的集合。论域爿的粒度化就是给定一个等价关系r 或个划分, 得到一个对应于r 的商集i x ,同时亦得到对应的三元组( 口7 ,h 7 ,凹) ,此三元 组称为对应于r 的原空间( 工t ,厂) 的商空间。 从计算代价的角度来看,商空间理论并不是只针对某个给定的商空间或知识 基来讨论知识的表达以及问题的求解,而是在所有可能的商空间中,找出一个或 多个最为合适的商空间,利用从彳i 同商空间观察同一问题,以便得到对问题不同 角度的理解,最后综合成对问题总的理解。它的求解过程是在“由所有商空间组成 的半序格”中运动转换的过程。它的最重要性质是同态原则,即保假原理与保真原 理。当考虑一个复杂问题时,常先将问题化成在一个粗粒度商空间对应的问题进 行分析,若得出该问题在粗粒度空间中无解,则由“保假原理”得到原问题亦无解, 这样就可以用很少的计算量得到所要的信息与结论,同样利用“保真原理”亦可达到 降低求解的复杂性。这样商空间理论从计算代价的综合考虑出发按照所获取的信 息量对问题的粒度不断细化,从而得到更接近精确解的近似解。 定性推理也是目前世界上人工智能领域研究的重点之一。从商空间理论4 8 的 角度来看,“定性”相对于“定量”是不确定的描述,定性推理可以用不同粒度空间的 模型来描述,这样对系统进行定性推理与分析就转化为在某个商空间上进行推理 分析。因此从这个角度,阕果定性网络与c r e d a l 网络是因果网络的某种定性推广。 1 - 2 3 不精确概率 硝i 精确概率6 ”在2 0 世纪后半叶开始受到广泛注意,其重要性在很多领域凸现 粒度计算中的不确定性问题研究 出来如感知计算,粒度计算等等。从计算代价来看,它是对所考虑问题对象的信 息获取程度与计算代价的一个折中反映。一i 精确概率理论一般是基于集合论且包 含很多领域,它是作为没有明显数值概率但可度量机会或不确定性的许多数学与 统计模型通用术语,如可能性测度与必要性测度陋5 ”、信任函数与似真函数( b e l i e f f u n c t i o n sa n dp l a u s i b i l i t yf u n c t i o n s ) i 那”、c h o q u e tc a p a c i t i e s 5 96 0 ,6 ”、l o w e ra n du p p e r e x p e c t m i o n so rp r e v i s i o n s 6 。6 5 、偏好半序、概率测度集( s e t so fp r o b a b i l i t y m e a s u r e s ) t 6 6 ,6 ”、s e t so f d e s i r a b l eg a m b l e s t 6 s l 与c o m p a r a t i v ep r o b a b i l i t yo r d e r i n g s t 6 9 , 7 0 1 等目前主要一些模型。一般说来,在分析推理问题过程中,相关信息不足、含糊 不清或有冲突时,不精确概率方法就是必须且是必要的;事实上,从更一般性意 义上来看,彳i 精确概率方法就是对部分无知、不完全性、不明确性等情形下的问 题建模。 从粒度计算与1 i 精确概率的表现形式与内容来看,都是对问题对象的- * 9 近 似建模与近似推理,同样的定性推理与定性建模也是如此。对于粒度计算与不精 确概率之间的关系,l o t f iaz a d e h 教授1 提出粒概率概念,用以表达描述模糊信息 下的不精确概率,试图将粒度汁算与概率结合起来并用模糊逻辑作为概率的前提 逻辑。作为对随机现象进行描述与建模的概率理论以其博大精深的内容及深刻的 理论成果著称于世,而概率的一个最本质的特征就是在仃一域上具有o - 有限加性。 对于这一点的表示上述粒概率模型是无能为力的。 1 3 本文的主要内容及章节安排 本文共分五章: 第一章是绪论,简要介绍不确定知识表示的概率图模型,粒度计算与不精确概 率及定性推理,在考虑计算代价的意义下它们的发展现状与相互关系。 第二章研究了商空间逼近的一般性理论,信息非一致情形下半序结构的融合问 题。在对4 i 确定知识表示的主要模型b a y e s 刚络结构学习问题进行分析及其与| 夭l 果定性删络的关系时,提出广义冈果定性网络的概念及其定性融合方法,这为 b a y e s 网络结构学习问题提供一种新的建模方法:定性融合逼近。从粒度计算的角 度来看,当对冈果嘲络的条件概率表或边际概率表进行因果定性化,就得到冈果 第一章概述 定性网络( 或称为定性概率网络) ;另一方面,若对b a y e s 网络的定性部分不变, 却对其联合概率分布进行扩大为一集合,得到c 1 _ e d a l 网络;冈果定性例络与c r e d a l 脚络相对于b a y e s 删络都是定量部分的某种改变,即非精确化,而定性部分即删 络结构未变。这同时从一个侧面表明问题论域的元素之间的拓扑结构是更本质的 知识。 第三章研究主要结合因果网络,对构造性学习【7 2 , 7 3 从计算学习理论角度进行分 析。首先介绍含有隐变量的因果网络与样本生成的有限混合模型,并进一步阐述 有限混合模型与含有隐变量的因果网络之间的关系,进而应用于构造性学习,提 出因果覆盖算法。因果覆盖算法不仅利用训练集的几何距离信息,而且利用训练 集包含的因果信息,找到每个类别样本出现机会最大的球领域位置,这样就从覆 盖算法的每个覆盖尽量盖住训练集中同类样本,转化为该算法的每个覆盖尽量盖 住同类样本出现机会最多的球形领域:另一方面,覆盖算法在处理高维海量数据 且多模式的数据挖掘中既具有计算快速简单等优点,又有出现拒识样本等缺陷。 基于此,提出两阶段因果覆盖算法。该算法利用数据的各个属性之间或部分属性 之间具有一定的因果关系直接找到影响数据的类别属性的属性集,从而此属性集 与类别属性一起作为样本集的新属性集,这样达到减少属性个数从而实现降维, 再应用覆盖算法对降维后的数据集进行分类,这是一种新的降维方法,不同于传 统的数据集降维方法,如f i s h e r 线性判别方法等等。但不足的地方是在基于数据 集下因果网络结构学习,目前国际已有的学习方法,其效果都不尽理想仍需改进, 这对因果数据挖掘的发展是一个重大挑战,同样对因果网络与覆盖算法的结合的 效果具有一定消极影响。 第四章研究粒度计算在认知过程中的表示与不确定性问题。人们在认知过程 中对问题的分析都是在一定粒度条件下进行的,因而在认知过程中获取的知识也 是一定粒度条件下的知识。对此进行的知识表示具有粒度的条件性及不确定性。 本章首先对有限样本学习问题作出分析,指出训练集对学习效果的影响,进而提 出训练集中样本之间的鞅性要求,同时给出离群点的定义及在无监督学习条件下 判断离群点的算法,该算法在试验中被证实是有效的。在认知过程中,方面对 问题领域保留条件概率与期望的信息,对推理与决策是至关重要的;另一方面, 问题领域的结构信息及问题领域的粒度表示也对推理与决策至关重要,这从阕果 粒度计算中的不确定性问题研究 网络,影响图等可得到验证。本章结合粒度计算与概率理论,提出商概率概念, 并在信息一致或非一致情形下,分析其性质,并得到一些结论。从商概率的定义 及推导的性质来看,它具有条件性,即它随信息一致或非一致情形下粒度的变化 而变化;同时它又具有概率的本质特征,即在该粒度下的商集所生成的a 一域上, 该商概率具有a 有限加性。还有一点,商概率的概率更新能够反映出粒度之间的关 系,即信息一致或非一致与粒度粗细。商概率将不精确概率与粒度计算结合在一 起,在考虑计算代价的意义下对问题领域进行近似建模与近似推理,这比不精确 概率与粒度计算独自运作会更有效率,并克n - - 者各自的缺点与不足。 第五章是总结与展望。总结全文的工作,给出需要进一步研究的要点。 参考文献 1 】j p e a r lp r o b a b i l i s t i cr e a s o n i n gi ni n t e l l i g e n c es y s t e m s :n e t w o r k so fp l a u s i b l ei n f e r e n c e m 】 m o r g a nk a u f m a n n ,s a nm a t e o ,c a l i f o r n i a ,1 9 8 8 2 】ren e a p o l i t a np r o b a b i l i s t i cr e a s o n i n gi ne x p e r ts y s t e m s :t h e o r ya n da l g o r i t h m s 【m w i l e y , n e wy o r k ,1 9 9 0 3 fvj e n s e n a ni n t r o d u c t i o nt ob a y e s i a nn e t w o r k s m 】u c lp r e s s ,19 9 6 【4 】w r i g h ts ,“c o r r e l a t i o na n dc a u s a t i o n ”【j 】ja g r i cr e s ,v 0 1 2 0 ,p p5 5 7 5 8 5 ,1 9 2 1 【5 】w r i g h ts ,“t h em e t h o do f p a t hc o e f f i c i e n t s ”【

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论