|
|
|
|
移动端

3.7 C45算法的参数介绍

《大数据分析:数据挖掘必备算法示例详解》第3章决策树算法,本章重点介绍三个非常经典的决策树算法,分别是 ID3、C45和 CART。在具体讲解本章的算法之前,需要引入信息熵值的概念。本节为大家介绍5算法的参数。

作者:张重生来源:机械工业出版社|2017-12-13 17:51

技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战

3.7 C45算法的参数介绍

本节中 C45算法的调用,也将使用 Weka工具包中的算法实现,关于 Weka工具包在此不再过多介绍,下面直接来看 C45算法的参数设置及含义。

C45算 法 在 Weka中 的 类 名 是 “wekaclassifierstreesj48”,其 中 几 个 重 要 的 参 数如下:

● U:使用未修剪过的决策树。

● C:设置剪枝的阈值,默认值为 025。

● M:设置叶子上的最小实例数,默认值为 2。

● R:使用错误率降低剪枝。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码

 

51CTO读书频道活动讨论群:365934973
【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Visual Studio Team Systems软件工程实践

本书论述了软件开发价值增加的思维方式。这一思维方式构成了VSTS的基础,包括VSTS的指导思想,为什么这些指导思想会以某些方式表现,以及它...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊