永发信息网

FP-tree的FP-tree构造算法

答案:1  悬赏:60  手机版
解决时间 2021-04-09 18:21
FP-tree的FP-tree构造算法
最佳答案
输入:事务数据库D和最小支持度阈值minσ。
输出:D所对应的FP-tree。
方法:FP-tree是按以下步骤构造的:
(1)扫描事务库D,获得D中所包含的全部频繁项集1F,及它们各自的支持度。对1F中的频繁项按其支持度降序排序得到L。
(2)创建FP-tree的根结点T,以“null”标记。再次扫描事务库。对于D中每个事务,将其中的频繁项选出并按L中的次序排序。设排序后的频繁项表为[p|P],其中p是第一个频繁项,而P是剩余的频繁项。调用insert_tree([p|P],T)。insert_tree([p|P],T)过程执行情况如下:如果T有子女N使N .item_name=p.item_name,则N的计数增加1;否则创建一个新结点N,将其计数设置为1,链接到它的父结点T,并且通过node_link将其链接到具有相同item_name的结点。如果P非空,递归地调用insert_tree(P,N)。FP-tree是一个高度压缩的结构,它存储了用于挖掘频繁项集的全部信息。FP-tree所占用的内存空间与树的深度和宽度成比例,树的深度一般是单个事务中所含项目数量的最大值;树的宽度是平均每层所含项目的数量。由于在事务处理中通常会存在着大量的共享频繁项,所以树的大小通常比原数据库小很多。频繁项集中的项以支持度降序排列,支持度越高的项与FP-tree的根距离越近,因此有更多的机会共享结点,这进一步保证了FP-tree的高度压缩。

我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
单选题某基因在复制过程中,一个碱基被替换,
3千的发动机为什么1缸和3缸缺缸
形容结婚很幸福的句子,形容幸福的句子大全
单选题一个多边形的边数每增加一条,这个多边
涓涓早餐店这个地址在什么地方,我要处理点事
梦幻西游力DF加多的装备
细胞中的遗传物质是A.细胞核B.DNAC.基因D.
混凝土和植筋一平方多少
斗笠蓑衣渔夫的诗句,有描写渔夫为生活所迫而
怎样讽刺多管闲事人的句子 人多管闲事的句子
求小说,现代古代均可,最好是女主很聪明善于
单选题已知Sn是等差数列{an}(n∈N*)的前n项和
纯速机车我想知道这个在什么地方
神之墓地2.6a任务攻略
王者荣耀貂蝉好不好 貂蝉出装铭文推荐 貂
推荐资讯
猫咪可以吹空调吗
地球表面海洋面积占A.21%B.29%C.71%D.79%
电脑网络断开怎么连接,监控使用本地连接就好
怎么去猴头菇的苦味,猴头菇泡发后用开水焯一
全效学习八年级上册数学答案
单选题Thereisnodoubt________peopleought
30,31到邛崃平乐古镇好玩不?有没人啊?天台
跟女朋友见面都聊的好好的为什么微信不怎么愿
6+6连锁店地址在什么地方,想过去办事
填空或填写理由.如图,直线a∥b,∠3=125°
新疆风味兰州拉面怎么去啊,有知道地址的么
安康职业技术学院东门地址在什么地方,想过去
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?