{$cfg_webname}
主页 > 计算机 > 论文 >

K-均值聚类算法的研究

来源:56doc.com  资料编号:5D26595 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D26595
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 帮助
资料介绍

K-均值聚类算法的研究(任务书,开题报告.论文13000字)
摘要
近年来信息技术快速发展,人们每天要处理的数据信息量都十分庞大。为了能快速从这些庞大的数据信息中提取出重要的信息,数据挖掘(Data Mining,DM)应运而生。而聚类分析作为数据挖掘的重要方法,在实际的应用中更是不可或缺。它在图像处理、市场评估、生物学等诸多领域都有研究应用。
聚类算法大概有以下几种分类:层次算法、划分算法、基于网格的算法、基于密度的算法和基于模型的算法。而本文所研究的算法就是划分算法中的K-均值聚类算法。文中先对聚类算法进行系统的介绍,而后针对K-均值聚类算法的原理及算法流程进行分析,并介绍如何通过MATLAB对算法进行实现。接着又通过结果分析了该算法的优点和存在的缺陷。针对其聚类结果易受初始中心影响的特点,对算法进行了改进。对初始聚类中心的选择进行优化,并将准则函数改为绝对误差函数,由此也在一定程度上消除了原算法对于孤立点和噪声点敏感性的缺陷。在算法的应用上,选择图像分割为应用方向,通过分别用原算法和改进后的算法用MATLAB实现对图像的分割处理。从结果来看,改进后的算法能更好的达到图像分割的效果。
关键词:聚类分析;K-均值聚类算法;数据挖掘;图像分割

Abstract
In recent years, the rapid development of information technology, people every day to deal with the amount of data is very large. Data Mining (DM) came into being in order to quickly extract important information from these large data sources. And clustering analysis as an important method of data mining, in the practical application is indispensable. It is in image processing, market assessment, biology and many other fields have research and application.
The clustering algorithm has the following categories: hierarchical algorithm, partitioning algorithm, grid-based algorithm, density-based algorithm and model-based algorithm. The algorithm studied in this paper is the K-means clustering algorithm in the algorithm. In this paper, the clustering algorithm is introduced systematically, then the principle and algorithm flow of K-means clustering algorithm are analyzed, and how to realize the algorithm by MATLAB is introduced. Then the advantages and disadvantages of the algorithm are analyzed. The algorithm is improved for the characteristics that the clustering results are susceptible to the initial center. The selection of the initial clustering center is optimized, and the criterion function is changed to the absolute error function, which also eliminates the defects of the original algorithm for the isolated point and the noise point sensitivity to a certain extent.In the application of the algorithm, the image segmentation is the application direction, and the image segmentation is realized by using the original algorithm and the improved algorithm respectively.From the results, the improved algorithm can better achieve the effect of image segmentation.
Key words: clustering analysis; K-means clustering algorithm; data mining; image segmentation

目录
第1章 绪论    1
1.1研究的背景及意义    1
1.2 国内外的研究现状    1
1.3 本文的研究内容及结构    3
第2章 聚类算法的分析    4
2.1聚类方法    4
2.1.1 聚类的概念    4
2.1.2 聚类的步骤    4
2.2 聚类算法的要求    4
2.3 聚类分析中常见的数据结构    6
2.3.1 数据矩阵    6
2.3.2 差异矩阵    6
2.4 聚类算法中的相似性测度    7
2.5 主要的聚类方法    8
2.5.1 划分聚类算法    8
2.5.2 层次聚类算法    9
2.5.3 基于密度的聚类算法    9
2.5.4 基于网格的聚类算法    9
2.5.5 基于模型的聚类算法    10
第3章 K-均值聚类算法    11
3.1 K-均值聚类算法    11
3.1.1 K-均值聚类算法简介    11
3.1.2 K-均值聚类算法流程分析    11
3.2 K-均值聚类算法的MATLAB实现    13
3.3 K-均值聚类算法结果分析    16
3.4 K-均值聚类算法的改进    17
第4章 基于K-均值聚类的图像分割算法的实现    19
4.1 图像分割概念    19
4.2 基于K-均值聚类的图像分割算法实现    19
第5章 总结与展望    22
5.1 总结    22
5.2 展望    22
参考文献    23
致 谢    24

推荐资料