永发信息网

多维关联规则挖掘算法r语言能实现吗

答案:2  悬赏:60  手机版
解决时间 2021-02-26 15:49
多维关联规则挖掘算法r语言能实现吗
最佳答案
一下自己学习关联规则经典算法Apriori的笔记。
1、概述
Apriori算法是用一种称为逐层搜索的迭代方法,从项集长度k=1开始,选出频繁的k=1项集,根据先验性质:频繁项集的子集一定是频繁的(逆否命题:非频繁项集的超集一定是非频繁的,通俗的说就是某件事发生的概率很低,比这件事发生条件更严苛的事情发生的概率会更低),筛选k=2项集中的频繁项集,以此迭代k=3...。每迭代一次都要完整的扫描一次数据库。
2、关联规则三度:
支持度:占比
置信度:条件概率
提升度:相关性
3、R语言示例代码如下:(小众语言的辛酸:选项里没有。。)
[plain] view plain copy
library(arules)
#从rattle包中读入数据
dvdtrans <- read.csv(system.file("csv", "dvdtrans.csv",package="rattle"))
str(dvdtrans)
#将数据转化为合适的格式
data <- as(split(dvdtrans$Item,dvdtrans$ID),"transactions")
data

#用 apriori命令生成频繁项集,设其支持度为0.5,置信度为0.8
rules <- apriori(data, parameter=list(support=0.5,confidence=0.8,minlen = 2))

#用inspect命令查看提取规则
inspect(rules)
常用数据形式有data.frame格式和list格式,前者即A项集为一列B项集为另一列,后者为A和B放在同一个购物篮中。

去除冗余规则以及提取子规则代码如下:

[plain] view plain copy
redundant.rm <- function(rule,by="lift")
{
#rule:需要进行简化的规则
#by:在清除的时候根据那个变量来选择,
#可能取值为"support","lift","confidence"
a <- sort(rule,by=by)
m<- is.subset(a,a,proper=TRUE)
m[lower.tri(m, diag=TRUE)] <- NA
r <- colSums(m, na.rm=TRUE) >= 1
finall.rules <- a[!r]
return(finall.rules)
}
rules <- redundant.rm(rules)
rules.sub <- subset(rules, subset = lhs %in% "筛选项集名称" & lift > 1)
全部回答
应该不能吧。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
福州哪里有欧派特电动车的专卖店,知道多少说
西马峪村地址有知道的么?有点事想过去
忆秦娥.娄山关 这首词表达了作者什么的思想感
牡丹鹦鹉刚出壳需要喂吃的吗
蓝天手机大卖场在哪里啊,我有事要去这个地方
盈建科最大附加阻尼比是什么意思
为什么用完欧诗漫水精灵脸上热热的有点刺痛感
下图为某区域示意图。读图完成下列各题。【小
DNF红眼和阿修罗到底谁好点?
郑州大学研究生容易录取吗,是不是上线了就能
《小王子》的星球上有多少座火山
驾驶c1科目二和科目三怎么看你得了多少分,怎
求北京市网络推广服务的公司都有哪些?求大神
薰衣草有什么成分组成不要拿百度百科上面东西
更新iOS9.3.5需要iCloud密码吗
推荐资讯
阅读下列材料 材料1 1831年刑部奏称:“现今
摩托车原配化油器坏了怎样从新配置一个新的
手机被偷了。QQ密码被别人改了。。还可以找回
朔州诚信职业培训学校地址在哪,我要去那里办
农村合作医疗保险有特病保险吗?
兴崖隆三兄弟龙虾烧烤地址在什么地方,想过去
九九鸭专卖地址在哪,我要去那里办事
天丛人愿的意思是
哪里有光学轮廓仪(干涉显微镜),用于测量表
洛克王国召唤石怎么用
古琳阁地址有知道的么?有点事想过去
一个数乘1一定比这个数乘0大。对吗?
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?