永发信息网

数据挖掘不同领域中的采样方法有哪些?

答案:2  悬赏:80  手机版
解决时间 2021-03-06 20:05
数据挖掘不同领域中的采样方法有哪些?
最佳答案
1,关联规则的采样
挖掘关联规则的任务通常与事务处理与关系数据库相关,该任务需要反复遍历数据库,因此在大数据集上将花费大量的时间。有很多的算法可以改进关联规则算法的效率与精度,但在精度保证的前提下,采样是最直接与最简单的改进效率的方法。
2.分类的采样
分类一般分为三种类型:决策树、神经网络及统计方法(如无偏差分析),在这些算法中均有使用采样的案例。分类的采样一般有四种,一种是随机采样,另外三种是非随机采样,分别是“压缩重复”、“窗口”及“分层”。
3.聚类的采样
在聚类中进行采样有若干的用途。有些聚类算法使用采样进行初始化工作,例如,利用采样得到的样本得到初始化的参数,然后再对大数据集进行聚类。当处理大数据集时,需要降低算法使用的空间。为了得到较好的聚类,根据数据的分布情况需要采用不同的采样方法。随机采样仍然是一种常规的方法,在随机采样忽略了小的聚类的情况下,一般采用非随机采样的方法。非随机采样的方法中最常用的是分层采样。例如,在密度差别很大的数据集中,根据密度的不同,采样的样本数量可以不同,在密度较高的区域采样的次数少一些,而在密度稀疏的区域,采样的次数多一些。
4.扩充(Scaling-Up)的数据挖掘算法的采样
扩充是指利用已有的数据挖掘算法能够高敛地处理大数据集。当数据挖掘的算法初期是处理小数据集的情况下,处理大数据集就会受到限制。在这种情况下,一般会采用分而抬之的方法:将大数据集分解成较小的互不重叠的数据集,利用己有算法进行处理,然后,将小数据集得出的结果合并成最终的结果。需要注意的是,这种方法等价于将困难转嫁到合并步骤,即需要复杂的处理才能得到正确的结果。因此,整体的复杂性没有降低。
全部回答
搜一下:数据挖掘不同领域中的采样方法有哪些?
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
万里马皮具在什么地方啊,我要过去处理事情
你好我准备在永久都是自己的农村自己的宅基地
有肺癌病人可以和灵芝泡的酒吗
我包一块地给别人做坟地,犯法吗?
除数和被除数都是8 商是多少
朋友老是对我的问题的回答的每一句话前加上“
【life will find the way ,happiness is not
she is worried about her sick mother
二胡子烧烤在哪里啊,我有事要去这个地方
户口本能快递吗,去哪里寄啊
查理九世与莫多多解密卡的原理是什么?
请驴友帮忙推荐峨眉山一日游攻略
我是哈铁道学院盾构系大一学生,想了解关于黑
酪素塑料 用途?
崩坏学园2 社团剩余强化值怎么获得
推荐资讯
幼师有哪些课程
我的胸部有点外扩,为什么我穿有钢托的内衣,
怪怪屋儿童摄影地址有知道的么?有点事想过去
求助啊,双语版中的国语和粤语混音,该怎么调
门泊东吴万里船的前一句是什么
巴奴毛肚火锅东明路店在什么地方啊,我要过去
回答下列有关新航路开辟的问题:15—17世纪,
请问:暖通水管是怎么分大小的?是按什么来分
求好看的日本少女动漫,本人要求极高:女主角
凌晨1到点武汉天河机场,到大冶怎么乘车
【火星历险记】火星历险记作文
说话脑袋想的 嘴就是说不出来,怎么办 有时候
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?