数据挖掘 基于关联的分类方法.ppt

上传人:精*** 文档编号:1148645 上传时间:2024-11-12 格式:PPT 页数:23 大小:2.03MB
下载 相关 举报
数据挖掘 基于关联的分类方法.ppt_第1页
第1页 / 共23页
数据挖掘 基于关联的分类方法.ppt_第2页
第2页 / 共23页
数据挖掘 基于关联的分类方法.ppt_第3页
第3页 / 共23页
数据挖掘 基于关联的分类方法.ppt_第4页
第4页 / 共23页
数据挖掘 基于关联的分类方法.ppt_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、7.67.6基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类7.77.7其它分类方法其它分类方法 -7.7.1 k-7.7.1 k-最临近分类最临近分类 -7.7.2 -7.7.2基于案例的推理基于案例的推理 -7.7.3 -7.7.3遗传算法遗传算法 -7.7.4 -7.7.4粗糙集方法粗糙集方法 -7.7.5 -7.7.5模糊集方法模糊集方法 制作者:张华制作者:张华 杜玉锋杜玉锋 2012.04.162012.04.167.6基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类7.7其它分类方法其它分类方法 -7.7.1 k-最临近分类最临近分类 -7.7.2基于案例

2、的推理基于案例的推理 -7.7.3遗传算法遗传算法 -7.7.4粗糙集方法粗糙集方法 -7.7.5模糊集方法模糊集方法 7.6 基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类基于关联规则分类基于关联规则分类:(1)关联规则聚类系统(ARCS):量化关联规 则挖掘和关联规则聚类(2)关联分类:它挖掘形如“cond_set=y”具有高 支持度和高置信度的规则,这里y是一个类标号挖掘关联规则使用的支持度概念分类挖掘关联规则使用的支持度概念分类:(3)通过聚集显露模式分类(CAEP)基于最小支持度和增长率挖掘显露模式(Eps)7.6 基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念

3、的分类1.基于聚类挖掘关联规则基于聚类挖掘关联规则(ARCS)(1)ARCS挖掘形如Aquant1Aquant2=Acat的关联规则 (2)用ARCS产生的聚类关联规则用于分类7.6 基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类1.基于聚类挖掘关联规则特点:特点:限制条件:ARCS的准确性与离散化程度有关可扩展性:可时间:相比之下,C4.5具有指数运行时间空间:相比之下,C4.5要求整个数据库(乘以某个因子)全部装入内存7.6 基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类2.关联分类概念:挖掘形如condset=y的规则;其中,condset 是项(或属性值对)

4、的集合,而y是类标号 满足最小支持度的规则是频繁的频繁的 满足最小置信度的规则是精确的精确的 如果一个规则项集具有相同的condset,则选择具有最高置信度最高置信度的规则作为可能规则(可能规则(PR),代表该集合7.6 基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类2.关联分类 挖掘高支持度和高置信度的规则(1)找出所有频繁的,精确地可能规则(找出所有频繁的,精确地可能规则(PR)集合)集合。算法使用迭代方法,类似于6.2.1小节介绍的Apriori使用的方法,先验知识用于裁减规则搜索。(2)使用一种启发式方法构造分类使用一种启发式方法构造分类。这里,发现的规则根据支持度和置信

5、度按递减的优先次序组织。(3)对一个新的样本进行分类时,满足该样本的第一个规则用于对它分类。分类法也包含省缺规则,它具有最低的优先次序,用来为不被分类法中其它规则满足的新样本指定一个省缺的类。例如:Coundset=a1,a2,a3,a4 y=C7.6 基于源于关联规则挖掘概念的分类基于源于关联规则挖掘概念的分类3.CAEP(通过聚集显露模式分类)使用项集支持度用项集支持度挖掘显露模式(EP)构造分类。显露模式(EP):是一个项集(项的集合),其支持度由一个类到另一个类显著增加。两个支持度的比称作EP的增长率。例如,假定我们有顾客数据集,包含类buys_computer=“yes”或C1和bu

6、ys_computer=“no”或C2。项集age=“=2)(income=50K)THEN credit=“approved”(7.21)根据规则(7.21),一个至少工作两年的顾客将得到信用卡,如果他的收入是$50K;但是,如果他的收入是$49K,他将得不到。这种苛刻的阈值看来可能不公平。替换地,可以将模糊逻辑引入系统,允许定义“模糊”阈值或边界。7.7.5 模糊集方法模糊集方法模糊逻辑使用0.0和1.0之间的真值表示一个特定的值是一个给定类成员的程度,而不是用类或集合的精确截断。因而,使用模糊逻辑,我们可以断言:在某种程度上,$49K的收入是高的,尽管没有$50K的收入高。7.7.5 模糊集方法模糊集方法将属性值转换成模糊值。图7.14展示如何将连续属性income的值映射到离散分类low,mediu,high上,以及如何计算模糊成员关系或真值。通常,模糊逻辑系统在这一步提供图形工具,支持用户。对于给定的新样本,可以使用多个模糊规则。每个可用规则为分类的成员关系贡献一票。通常对每个预测分类的真值进行求和。组合上面得到的和,得到一个系统返回的值。这一过程可以这样做:用每个分类的真值和加权并乘以每个分类的平均真值。所涉及的计算可能更复杂,这取决于模糊成员关系图的复杂性。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 实用文档 > PPT模板素材

版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。

Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1 

陕公网安备 61072602000132号     违法和不良信息举报:0916-4228922