永发信息网

1984年美国国会投票记录数据集可以用c4.5算法预测什么

答案:1  悬赏:60  手机版
解决时间 2021-02-24 09:47
1984年美国国会投票记录数据集可以用c4.5算法预测什么
最佳答案
ID3算法是决策树的一个经典的构造算法,在一段时期内曾是同类研究工作的比较对象,但通过近些年国内外学者的研究,ID3算法也暴露出一些问题,具体如下:
(1)信息增益的计算依赖于特征数目较多的特征,而属性取值最多的属性并不一定最优。
(2)ID3是非递增算法。
(3)ID3是单变量决策树(在分枝节点上只考虑单个属性),许多复杂概念的表达困难,属性相互关系强调不够,容易导致决策树中子树的重复或有些属性在决策树的某一路径上被检验多次。
(4)抗噪性差,训练例子中正例和反例的比例较难控制。
于是Quilan改进了ID3,提出了C4.5算法。C4.5算法现在已经成为最经典的决策树构造算法,排名数据挖掘十大经典算法之首,下一篇文章将重点讨论。
决策树的经典构造算法——C4.5(WEKA中称J48)
由于ID3算法在实际应用中存在一些问题,于是Quilan提出了C4.5算法,严格上说C4.5只能是ID3的一个改进算法。
C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:
1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;
2) 在树构造过程中进行剪枝;
3) 能够完成对连续属性的离散化处理;
4) 能够对不完整数据进行处理。
C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。
另外,无论是ID3还是C4.5最好在小数据集上使用,决策树分类一般只试用于小数据。当属性取值很多时最好选择C4.5算法,ID3得出的效果会非常差。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
【米契尔】乔妮·米契尔是哪种风格类型的歌手
手机背后有个圆圈里边有个十号后边有360什么
小胖牛肉馆地址在哪,我要去那里办事
甲乙年龄和33岁,四年后甲比乙大3岁,问乙的年
觉得两个人在一起越来越没有意思了,怎么办?,
为什么和喜欢的人去开房时犹豫不决,还是别去
考研:华电(保定)通信与信息系统大概多少分能
为什么网上的凉拌腐竹都说要开水焯一下,为什
声控开关可以控制led灯吗
小丽美容养生馆我想知道这个在什么地方
买卖双方经过经纪公司牵线后,撇开经纪公司,
神鬼世界尼莫任务在哪接
为什么在空调房待久了感觉脸更紧很痒
基金,关于我一窍不通,我想问:假设我买5000元
电脑医院地址在哪,我要去那里办事
推荐资讯
现在玻璃期货是一千一百多元。我期货账号里有
香港电影秦朝的兵马俑
剑三周末大攻防大车、小车怎么开?大车小车技
2015年-第103期:千军万马向前冲,孙子兵法藏
洗完澡后卫生间有瓷砖声音
宜佳副食店在什么地方啊,我要过去处理事情
手机漫游是什么意思
初中基础差上高中还有救吗
艺家布艺地址在什么地方,想过去办事
世界有没有紫水晶 紫水晶有什么用
麻烦老师解答:用足量的金属铝分别与
碧麓嘉园南区北门我想知道这个在什么地方
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?