|
|
51CTO旗下网站
|
|
移动端

2.2.2 LibSVM 的使用

《大数据分析:数据挖掘必备算法示例详解》第2章SVM 算法,本书详细介绍了大数据分析,尤其是数据分类相关算法的原理及实现 细节,并给出了每个算法的编程实例。本节为大家介绍LibSVM 的使用。

作者:张重生来源:机械工业出版社|2017-12-13 17:38

2.2.2 LibSVM 的使用

(1)LibSVM的一般处理过程

① 数据预处理

数据格式转换:将数据转换成 SVM的格式。SVM算法要求一个实数向量表示一个数据样本。

数据规范化:不仅可以避免算法实施过程中大数值范围的属性对小数值范围属性的影响,同时也可以避免出现数值计算困难的问题。

对于训练集和测试集,要使用同样的方法进行规范化。

② 模型选择:选择合适的内核,并确定惩罚参数 (C)和内核参数 (γ,gamma)。

③ 通过交叉验证获取最优的参数 C和 γ,并用来训练整个训练集。

④ 对测试集进行测试。

(2)LibSVM的参数介绍

打开 MATLAB,将工作目录切换至 LibSVM文件夹下,输入如下命令:

  1.  >>svmtrain 

即可看到如下输出 (该段代码为 LibSVM软件包的输出):

  1. Usage:model=svmtrain(training_label_vector,training_instance_matrix,′libsvm_options′);  
  2. libsvm_options:  
  3. -ssvm_type:settypeofSVM(default0)