大家好,关于深入探索数据挖掘:高效聚类方法解析很多朋友都还不太明白,今天小编就来为大家分享关于的知识,希望对各位有所帮助!
K-means算法是最经典的基于分区的聚类方法,也是十大经典数据挖掘算法之一。它是一种自下而上的聚类方法。 K-means算法最大的优点是容易理解、简单、快速,但只能应用于连续数据;缺点是聚类结果与我们最初设定的中心点的选择直接相关,需要我们自己做。提供聚类数,但您可以通过从多个聚类中获取最佳结果来设置初始聚类数。如果我们不知道样本集会被聚类成多少个类别,那么此时kmeans就不适合了。算法,建议使用其他方法进行聚类,例如(hierarchical或meanshift)。
K-means算法的基本思想是以空间中的k个点为中心进行聚类,并对距离它们最近的对象进行分类。通过迭代的方法,逐个更新各个聚类中心的值,直到得到最好的聚类结果。这大概就是“物以类聚,人以群分”的意思。具体流程如下:
首先输入我们自己设置的k 值。 k表示对数据集进行聚类得到的组数。
从数据集中随机选择K个数据点作为初始中心点。
对于集合中的每个数据点,分别计算到每个初始中心点的距离。数据点距离中心越近,就属于这一类。
通过平均等方法确定聚类簇的新中心点。
如果新的中心点与原中心点的距离小于一个阈值(设定的阈值),说明比较稳定,那么这个聚类就达到了我们的预期,算法结束。
如果新中心点与原中心点距离较大,则需要迭代上述步骤3-5。
【深入探索数据挖掘:高效聚类方法解析】相关文章:
2.米颠拜石
3.王羲之临池学书
8.郑板桥轶事十则
用户评论
聚类分析真的很神奇,能把一堆看似无关的数据分组好清晰!
有13位网友表示赞同!
想了解用户行为分析,聚类分析应该很管用吧?
有11位网友表示赞同!
学习过kmeans算法,感觉聚类分析的原理蛮有趣的。
有16位网友表示赞同!
现在好多机器学习项目用到聚类分析的吧?哪个算法最常用啊?
有6位网友表示赞同!
好像在电商平台上也能用聚类分析,比如推荐相似商品。
有16位网友表示赞同!
听说有个新技术叫“自监督学习”,还能用来做聚类吗?
有10位网友表示赞同!
对数据进行聚类分析之后,能更方便地进行深入的调查吧?
有9位网友表示赞同!
如果可以用聚类分析帮我们找到潜在用户群,那就太棒了!
有15位网友表示赞同!
我学习数据科学的时候,总觉得聚类分析是蛮重要的一个模块。
有7位网友表示赞同!
想问下,不同的聚类算法有什么区别?适合哪些场景使用呢?
有14位网友表示赞同!
最近在看一些市场调研报告,发现很多都用到了聚类分析的结果。
有5位网友表示赞同!
感觉聚类分析的应用真的还挺广泛的,各个行业都有它的身影。
有12位网友表示赞同!
想学习一下聚类算法的原理,准备去看相关书籍和文献资料。
有14位网友表示赞同!
好像有一些开源工具可以方便地进行聚类分析操作吧?
有12位网友表示赞同!
我觉得聚类分析的结果还需要结合其他分析方法才能更全面地理解数据。
有11位网友表示赞同!
学习聚类分析应该会对我的机器学习能力提升很大帮助吧?
有19位网友表示赞同!
对聚类分析的最新研究进展还挺好奇,感觉这个领域一直在发展。
有14位网友表示赞同!
想分享一些自己的聚类分析案例,看看其他人的想法和建议。
有14位网友表示赞同!