永发信息网

如何构建训练集和测试集 成什么比例

答案:1  悬赏:40  手机版
解决时间 2021-03-04 11:11
如何构建训练集和测试集 成什么比例
最佳答案
[size=14.399999618530273px]做分类预测等数据挖掘任务时,需要测试所建立模型的准确性时,如没有事先划分好的训练集与测试集,常采用的方案有。
[size=14.399999618530273px] A. 随机划分数据集:将数据集随机划分成训练集和测试集,一般按照3:1的比例划分,其中3/4的数据集用于模型的建立,1/4数据集用于测试所建立模型的性能。最终模型的性能,通过K次随机划分数据集,可以得到K次划分的模型性能的平均值,作为建立模型的性能。
[size=14.399999618530273px] B. 交叉检验(Cross-Validation):交叉检验,是按一定的方式将数据集划分成训练集和测试集,每个数据记录既有作为训练集,又有作为测试集。常用的交叉检验有:
[size=14.399999618530273px] 》Leave One Out Cross-Validation:每次选择一个数据作为测试集,其余的N-1个作为训练集用于测试模型的性能,共执行N次测试,N次测试的结果作为最终模型的性能;
[size=14.399999618530273px] 》K-Fold Cross-Validation:将数据集划分成K份,每次是其中的k-1份作为训练集建立模型,剩余的1份作为测试集检测模型性能,共执行K次性能测试。常用的是10折交叉检验,或采用随机划分数据集法将数据集划分成K份,此时可采用K-ford M-time Cross-Validation。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
笔记本系统占C盘20多G
做水果沙拉需要些什么东西?
睡眠不好怎么办总做梦每天早上感觉总是睡不醒
临沂至日照然后到西藏的路线图
什么名字象征长久?
【夜渡】请问李白的诗《夜渡》随知道?
河南力旭商贸有限责任公司这个地址在什么地方
佳帝防水涂料质量好不好,怎么样
光辉和小法哪个厉害
雅马哈摩托车天剑越野前泥瓦多少钱
走向共和李鸿章为什么说慈禧的寿袍大
用营业执照能拿无息贷款吗
华和名的四字成语
昏迷几个小时算轻伤
谁知道宁波鲜香菇批发价?
推荐资讯
小孩子脸色暗黄怎么办? 10分
LES 100 CIELS怎么样
伊丽莎白二世 英文怎么读啊,是读
1995年到2009年历届乒乓球全国锦标赛男单冠军
he does some sports every day变否 疑问 肯
谁知道山西卫视歌从黄河来怎么报名啊
如果a+c=b则方程ax方+bx+c=0(a不等于0)的其
Fail
在公司当管理,职业怎么填写
下列固定资产中,应计提折旧的固定资产有( 
市场中路在哪里啊,我有事要去这个地方
部落冲突ios换账号不能重玩
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?