数字图像处理论文_第1页
数字图像处理论文_第2页
数字图像处理论文_第3页
数字图像处理论文_第4页
数字图像处理论文_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、甘肃省政治法学院本科课程设计数据仓库和数据挖掘基于FCM算法的聚类研究计算机科学学院(科系)信息管理和资讯系统主修2011年本科班学号名字导师成绩完成时间2013年十二月基于FCM算法的聚类研究摘要:牙齿文档在说明聚类分析方法的基础上,着重研究FCM集群算法。FCM算法是一种基于分割的集群算法,其思想是在划分为相同集群的对象之间的相似性最大,在不同集群之间的相似性最小。最后,基于MATLAB对图像信息进行了聚类。关键字:FCM;群集算法MTALABcluster analysis based on FCM algorithmabstract : this paper describes the

2、 basis of cluster analysis methods and focus on the FCM clustering algorithm . FCM algorithm is a clusteris iths密钥word : FCM;Clustering algorithmMTALAB目录第一章概述1第二章聚类分析方法12.1聚类分析12.2主要群集算法分类2第三章模糊聚类算法43.1图像分割43.2模糊群集43.3模糊c均值算法53.4算法步骤53.5基于WEKA的FCM聚类分析6基于3.6 MATLAB的灰度图像分割分析7第5章FCM群集结果12谢谢13工具书13第1章概述

3、1.1研究背景随着计算机和数据采集技术的发展,数据挖掘应用得很广泛。数据挖掘(WHO)可以帮助用户发现隐藏大型数据库种类的规则和模式,它将人工智能、统计、机器学习、模式识别、数据库等多种学科理论、方法和技术集成在一起。数据挖掘模型包括决策树、关联规则、群集、神经网络、粗糙集、概念网格、遗传算法、序列模式、贝叶斯、支持向量机、模糊集和基于案例的推断。在牙齿中,群集是数据挖掘领域的核心技术,广泛应用于类似发现、客户区分、趋势分析、金融投资、信息检索等领域。聚类分析是数据挖掘的重要功能,集群算法是当前研究的核心。聚类分析就是使用集群算法的发现有意义的集群,即“物有类聚”。群集也可以作为分类,但与大多

4、数分类或预测不同。大多数分类方法都是演绎的。也就是说,人们牙齿事先将某事物分类的准则或各种标准分类的过程是将分类的要素与各种种类的标准进行比较,然后将各要素分类为各种类别。确定事物的分类标准或各种标准中的某种程度上的主观色彩。模糊C均值(Fuzzy C-means,FCM)聚类方法是基于目标函数的模糊集群算法范畴之一。模糊C均值聚类方法是基于目标函数的模糊聚类算法理论中最完善、应用最广泛的算法之一。模糊C-均值算法硬簇目标函数优化中最先导出。为了使用目标函数方法解决集群问题,构建了使用平均平方近似理论解决集群问题的约束非线性编程函数,这些内部平方误差和平均误差(WGSS)已成为集群目标函数的一

5、般形式。提出了模糊划分概念,Dun首先将其扩展到加权WGSS函数,稍后从Bezdek扩展到加权WGSS的无限族,形成了FCM集群算法公共集群准则。从此这种模糊的集群蓬勃发展,现在已经形成了庞大的体系。第二章聚类分析方法2.1聚类分析聚类分析根据对象的相似性,成组,群集是一种无监督学习方法,没有先验分类知识,是发现数据下的隐藏结构。其目标是分割给定的数据集。牙齿分割必须满足以下两个茄子特性:1类中的相似性:属于同一类的数据必须尽可能相似。跨类李晟:属于徐璐不同类的数据应尽可能徐璐不同。图2.1是一个简单的聚类分析示例。图2.1聚类分析示例聚类分析是数据挖掘的重要功能,集群算法是当前研究的核心。聚

6、类分析就是使用集群算法的发现有意义的集群,即“物有类聚”。群集也可以作为分类,但与大多数分类或预测不同。大多数分类方法都是演绎的。也就是说,人们牙齿事先将某事物分类的准则或各种标准分类的过程是将分类的要素与各种种类的标准进行比较,然后将各要素分类为各种类别。确定事物的分类标准或各种标准中的某种程度上的主观色彩。聚类分析(WHO)是归纳的,无论您知道什么类标记,都不需要预先确定分类标准来分析数据对象。通常,培训数据没有提供班级标记。因为您不知道从哪里可以使用群集生成这些标记。对象根据最大化类内相似性和最小化类间相似性的原则进行聚集或分组,通过一些计算合理地对观测值进行分类,使类似观测值更接近,其

7、他种类的观测值有更多的差异。(约翰f肯尼迪、美国电视电视剧(Northern Exposure),形成的每个群集都可以看作是可以导出规则的对象类。集群提高了对客观现实的认识,是概念说明和偏差分析的前提。2.2主要群集算法分类聚类方法可以分为多种茄子大类别,包括多种茄子类型的算法、主要分割方法、分层方法、基于密度的方法、基于网格的方法和基于模型的方法。(l)分割方法提供了包含n个对象或数据行的数据集。分割方法将数据集分为K个子集(分割)。其中,每个子集表示一个群集。换句话说,将数据划分为K组。这些组满足以下要求:1 .每个组必须至少包含一个对象。2.每个物件必须仅属于一个群组。后一种要求在一些模

8、糊划分方法中可以得到缓解。指定需要分割的数目K后,分割方法首先创建初始分割,然后使用重新定位循环技术移动其他分割(组)中的对象,从而更改分割内容。良好的分隔度量标准通常“相似”或徐璐相关同一组中的对象,而不同组中的对象“远”或徐璐不同。为了获得基于分割聚类分析的全局最优结果,需要所有可能的对象分割。为此,大多数应用程序使用的一般启发方法是k-average算法,算法中的每个群集都表示为该群集的对象平均值。K-medoid算法,算法中的每个群集都由该群集上距离群集中心最近的对象表示。这种启发式群集方法在分析中小型数据集并将其分析为发现圆或旧式群集时效果很好,但在分析大型数据集或复杂数据类型时效果

9、不好,需要扩展。(2)分层方法层次方法是划分给定的一组数据对象以创建层次。根据层次分解的方式,层次方法可以分为自下而上和自上而下两种类型。自下而上层次方法从每个对象为单独的组开始,逐步合并这些(对象)组,直到其位于层次顶部或满足结束条件。由上而下层次方法始于属于一个组的所有对象。每个循环将组分成较小的组,直到每个对象构成一个组或满足退出条件。(3)基于密度的方法大多数分割方法是根据物件之间的距离进行丛集的。这些方法只能发现圆形或球形群集,并且发现任意形状的群集更加困难。基于密度概念的群集方法是实际增长的群集,直到“相邻”(数据对象或点)密度超过特定字段值(例如,群集中的点数或指定半径内必须至少

10、包含点数)。牙齿方法可用于从数据中删除噪声(异常数据),发现所有形状的群集。K-常用的基于密度的方法,如最近的邻居方法,是基于与对象相邻的K个对象的距离之和来确定数据是否异常。(4)基于网格的方法基于网格的方法将对象空间划分为有限数量的单元,从而形成所有群集操作都在其中执行的栅格结构。牙齿方法的主要优点是执行时间相对较快,因为它与数据对象数无关,只相关划分对象空间的网格数。基于网格的方法主要包括网格群集、bang-clustery、sting和wave cluster(5)基于模型的方法基于模型的方法是假定每个群集有一个模型,然后发现执行与该模型匹配的数据对象。基于模型的算法可以通过配置描述数

11、据点空间分布的密度函数来确定特定群集。采用标准统计方法,考虑“噪声”或异常数据,自动确定集群数,从而产生强大的集群方法。另一个集群算法结合了几个茄子集群方法的思想,有时很难明确定义一个集群算法属于什么集群方法类别。另外,一些应用程序需要结合使用多个群集技术来实现应用程序目标。第三章模糊聚类算法3.1图像分割原理和群集概述基本原则:根据图像的组织结构和应用要求,将图像分割成不徐璐交叉的子区域的过程。这些子区域是4茄子意义上具有共同属性的像素的连接集合。一般方法如下:(1)将区域划分为对象,并将相似性原则作为分割基准,根据图像的灰度图像、色彩、转换关系等特征划分图像的子区域,将每个像素划分为相应对

12、象或区域的像素群集方法,即区域方法。(2)通过将对象边界分割为对象直接确定区域之间的边界来分割对象边界。(3)首先检测边缘像素,然后连接边缘像素以形成边界,从而形成分割。丛集是将资料物件分割成类别或丛集的程序,在相同丛集中的物件之间有很高的相似性,每个丛集的物件高度都不同。集群起源于数据挖掘、统计、生物学、机器学习等很多研究领域。通过自动群集识别对象空间中稠密的稀疏区域,从而在全局分布模式和数据属性之间建立有趣的相关。聚类分析已经在很多领域得到了广泛的应用,包括市场研究、模式识别、资料分析、图像处理。群集还可以用于脱离接触检测,如信用卡欺诈检测和电子商务内的犯罪活动监控。聚类分析是查找数据的自

13、然集合结构的重要方法,是概念说明和偏差分析的前提。群集是一种大量、繁杂、属性多、没有类徽标数据的有效方法。在知识发现过程中,群集经常被用作其他数据挖掘工作的前奏。分析已成为数据挖掘和知识发现领域最重要的课题之一,至今为止,为了解决许多数据集群的算法、传统集群方法、空间数据的集群方法、统计学的集群算法等各个领域的集群问题,提出了很多数据集群问题。对象之间的相似性是集群的核心,衡量相似性是区分对象的主要基础,衡量相似性的方法主要是两个茄子类别:距离和相似系数。距离通常用于数值数据,距离越接近0,相似性越大。相似系数通常用于对类型数据进行分类,相似系数越接近1,相似性越大。聚类分析通常以距离为基础,

14、构建M维空间的距离函数,利用牙齿距离函数进行群集。在维度空间中,物件集、和是与之间的距离。距离定义通常必须满足以下四个茄子特性:1)2),03)、=4)、聚类分析期间通常只需要满足距离函数的前三个茄子特性。常用距离公式为:1)闵可夫斯基距离是距离的最常见形式(例如3-1:(3-1)2)曼哈顿距离,即每个属性差的绝对值之和(例如,3-2:(3-2)3)欧式距离,即每个属性差异的平方根的平方根,例如3-3。(3-3)4)切比塞夫距离,即每个属性差异的最大值,例如3-4。(3-4)3.2模糊聚类在模糊聚类中,每个示例不再属于特定类,而是属于具有特定成员资格的每个类。即模糊聚类分析,结果样本属于每个类

15、别的不确定性。也就是说,设定了类别的不确定性的样本说明,以便更准确地反映现实世界。模糊聚类不需要训练样本,可以直接通过机器学习实现自动分类目的。模糊聚类不仅可以直接从远视数据中提取要素,还可以优选已获得的要素并减少维数,以避免“维数灾难”。常用模糊聚类算法:模糊C均值模糊C均值(FCM)算法。牙齿算法是在传统C平均算法中应用模糊技术的。模糊划分的概念是1969年Ruspin牙齿提出的,利用牙齿概念提出了多种聚类方法。根据模糊聚类分析集群过程,可以大致分为三类茄子。(l)基于模糊关系的分类这包括系谱群集算法(也称为系统群集方法)、基于等价关系的群集算法、基于相似关系的群集算法,以及图论群集算法。那是一种比较早的研究方法,但不能应用于大数据量,所以实际应用并不广泛。文献综述了牙齿方面的研究。(2)基于目标函数的模糊聚类算法牙齿方法将聚类分析归结为受约束的非线性规划问题,通过最优化解决,得到数据集的最佳模糊分割和聚类。牙齿方法设计简单,问题解决范围大,可转换为最优化问题,通过经典数学非线性规划理论解决,易于电脑实现。因此随着计算机的应用和发展,基于目标函数的模糊集群算法牙齿

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论