大家好,今天给各位分享深度解析:数据挖掘领域的十大关键技术解析的一些知识,其中也会对进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧!
【嵌入式牛人入门】数据挖掘中一些常见实用的分析方法。
[嵌入式牛鼻子]数据挖掘(MBR、OLAP.)
【千牛提问】不同业务领域的数据挖掘我们应该如何正确选择分析方法?
【嵌入牛文】
1.历史MBR分析
基于历史的MBR分析方法(Memory-Based Reasoning)的主要概念是利用已知案例来预测未来案例的某些属性,通常寻找最相似的案例进行比较。
MBR中有两个主要元素,即距离函数和组合函数。距离函数的目的是找到最相似的案例;组合函数结合相似案例的属性以达到预测目的。
图片来自Jianshu AppMBR的优点在于它允许各种类型的数据,并且这些数据不需要遵守某些假设。另一个优点是它的学习能力,可以通过研究旧案例来获取新案例的知识。更为诟病的是,它需要大量的历史数据。只有有了足够的历史数据,我们才能做出好的预测。此外,基于记忆的推理方法在处理上也比较耗时,并且很难找到最优的距离函数和组合函数。其适用范围包括欺骗行为检测、客户反应预测、医疗诊疗、反应分类等。
2. 购物篮分析
市场篮分析的主要目的是找出什么样的东西应该放在一起?商业应用是通过客户的购买行为来了解客户是什么样的客户以及为什么这些客户购买这些产品。找到相关的关联规则,企业可以通过挖掘这些规则来获得利益并建立竞争优势。例如,零售商店可以利用此分析来改变货架上产品的排列或设计商业包装来吸引顾客等。
购物篮分析的基本操作流程包括以下三点:
选择正确的项目:这里的正确是指对于一个企业来说,需要在成百上千的项目中选择真正有用的项目。
通过探索共现矩阵来挖掘关联规则。
克服实际限制:选择的项目越多,计算所花费的资源和时间就越长(呈指数级增长)。这时候就必须采用一些技巧来减少资源和时间的消耗。
购物篮分析技术可以应用于以下问题: 对于信用卡购买,它可以预测未来客户可能购买什么。对于电信和金融服务行业,可以通过市场篮子分析设计不同的服务套餐,以扩大利润。保险业可以使用市场篮子分析来检测潜在的异常保险组合并采取预防措施。对于患者来说,购物篮分析可以作为确定治疗组合是否会导致并发症的基础。
3.决策树
决策树具有很强的解决分类和预测问题的能力。它们以规则的形式表达,而这些规则又表达为一系列问题。通过不断提出问题,最终可以得出所需的结果。典型的决策树在顶部有一个根,在底部有许多叶子,它将记录分解为不同的子集。每个子集中的字段可以包含简单的规则。此外,决策树可以具有不同的形状,例如二叉树、三叉树或混合决策树类型。
4. 遗传算法
遗传算法学习细胞进化的过程。细胞通过不断的选择、复制、交配、突变,可以产生新的、更好的细胞。遗传算法以类似的方式运行。它必须提前建立一个模式,然后经历一系列类似于生成新细胞过程的操作。它使用适应度函数来确定产生的后代是否符合该模式。最终,只有最终的拟合结果得以幸存,程序继续执行,直到函数收敛到最优解。遗传算法在聚类问题上有很好的表现,一般可以用来辅助基础推理方法和神经网络在记忆方面的应用。
5. 聚类分析
聚类分析(聚类检测)是一项涵盖广泛领域的技术,包括遗传算法、神经网络和统计学中的聚类分析。其目标是在数据中找到以前未知的相似群体。在许多分析中,最初都是以聚类检测技术作为研究的开始。
6. 连接分析
链接分析基于数学中的图论,通过记录它们之间的关系来开发模型。它以关系为主体,由人与人、物与物、或人组成。与对象的关系已经发展了相当多的应用。例如,电信服务行业可以利用链路分析来收集客户打电话的时间和频率,然后推断客户的使用偏好并提出对公司有利的解决方案。除了电信行业,越来越多的营销人员也在利用链接分析来进行对企业有利的研究。
7.OLAP分析
严格来说,OLAP(On-Line AnalyticProcessing;OLAP)分析并不是一种特殊的数据挖掘技术,而是通过在线分析处理工具,让用户能够更清楚地了解隐藏在数据中的潜在意义。像一些视觉处理技术一样,通过图表或者图形的方式展现出来,对于普通人来说会感觉更加友好。此类工具还可以帮助实现将数据转换为信息的目标。
8. 神经网络
神经网络使用重复学习的方法从一系列示例中学习,从而总结出可区分的模式。如果面对新的例子,神经网络可以根据其过去的学习结果推导出新的结果,这是机器学习的一种。与数据挖掘相关的问题也可以采用神经学习方法,其学习效果非常准确,并且可以执行预测功能。
9. 判别分析
当遇到的问题的因变量是定性(分类)而自变量(预测变量)是定量(度量)时,判别分析是一种非常合适的技术,通常用于解决分类问题。如果因变量由两组组成,则称为二组判别分析;如果它由多个组组成,则称为多重判别分析(MDA)。
一个。找到预测变量的线性组合,使组间变异与组内变异的比率最大化,并且每个线性组合与先前获得的线性组合不相关。
b.检查各组的重心是否有差异。
c.找出哪些预测变量具有最大的判别能力。
d.根据预测变量的值将新受试者分配到一个组。
如果你还想了解更多这方面的信息,记得收藏关注本站。
【深度解析:数据挖掘领域的十大关键技术解析】相关文章:
2.米颠拜石
3.王羲之临池学书
8.郑板桥轶事十则
用户评论
这篇文章讲的就是一些常见的模型吧?我最近在学习数据挖掘,不知道哪种模型最适合拿来做实战项目。
有17位网友表示赞同!
我一直好奇数据挖掘里到底有哪些常用的方法,看完这篇文章就知道应该好好学一学啦!
有19位网友表示赞同!
感觉好实用,特别是那些能直接应用到实际问题的分析方法,我笔记要记录下来!
有14位网友表示赞同!
看标题就觉得很有用的样子,希望文章详细介绍每个方法的原理和应用场景。
有12位网友表示赞同!
数据挖掘这么专业,想学起来可真不容易,希望这篇文章能把我入门带得更好一点。
有19位网友表示赞同!
我最近在研究市场分析,不知道这些算法能不能帮我更好地理解客户行为?
有13位网友表示赞同!
学习学习,我要尽快把这些方法运用到我的工作中去!
有6位网友表示赞同!
终于找到一篇讲清楚数据挖掘实用方法的文章了,太棒啦!
有11位网友表示赞同!
数据分析确实越来越重要了,希望这篇文章能让我学到一些新知识。
有5位网友表示赞同!
原来数据挖掘方法这么多样化,感觉我的知识面有点狭窄了,需要好好补一下。
有9位网友表示赞同!
哪个方法最受欢迎呢?我想先看看哪种方法比较实用简单再学习。
有7位网友表示赞同!
感觉数据挖掘应用场景很多啊!看完这篇文章我要去探索更多可能性!
有20位网友表示赞同!
我之前只知道一些基本的统计分析,现在想学习更进阶的数据挖掘方法,太好了。
有14位网友表示赞同!
这篇标题很有吸引力,我已经迫不及待去看文章内容了!
有6位网友表示赞同!
希望这篇文章介绍的不仅是理论知识,还有具体的实例说明!
有12位网友表示赞同!
我是一名计算机专业学生,这些方法对我学习非常有帮助!
有15位网友表示赞同!
我要把这篇文章分享给我的同事们,他们也在学习数据挖掘。
有8位网友表示赞同!
终于可以解开数据分析的神秘面纱了,期待看到详细讲解!
有10位网友表示赞同!
希望文章能够深入浅出地讲解每一个方法的细节,让我更清楚地理解。
有15位网友表示赞同!
我已经开始下载这篇文章了,我准备好好研读看看!
有12位网友表示赞同!