|
|
51CTO旗下网站
|
|
移动端

1.4 数据分类问题与回归问题的区别与联系

《大数据分析:数据挖掘必备算法示例详解》第1章数据分析绪论,本章主要介绍预备知识,即在进行数据分析前,读者需要了解的知识与背景。本节为大家介绍数据分类问题与回归问题的区别与联系。

作者:张重生来源:机械工业出版社|2017-12-13 17:22

1.4 数据分类问题与回归问题的区别与联系

在数据分析领域,回归问题和分类问题是容易混淆的问题。当待预测的属性是顺序型数据 (Ordinaldata)时,回归问题和分类问题是可以互相转换的。但是,当待预测的属性是连续的数值型数据 (Numericaldata)时,只能使用回归预测算法。当待预测的属性是连续的分类型数据 (Categoricaldata),且待预测的属性的取值之间没有数值大小关系时 (不能通过数值的大小进行比较该属性上的取值),只能用分类算法。

具体而言,回归问题和分类问题是否可以互相转换,取决于数据中要预测的属性 (标签列 /类别列)的类型,需要判断标签列 /类别列的那个属性的类型是数值型数据 (Numeri?caldata)、分类型数据 (Categoricaldata),还是顺序型数据 (Ordinaldata)。

下面举例说明。

(1)只能是回归问题而不能是分类问题的例子

股票价格的预测,该属性是一个连续型的数值型数据 (Numericaldata)。该属性上的数值是连续的,随机的,没有明确的归类 /类别关系,没有下限和上限。

此时只能用回归算法 (模型)拟合股票的价格,而不能用分类算法。

(2)只能是分类而不能是回归问题的例子

如果待预测的属性本身并不是 Ordinal类型的,而是分类型数据 (Categoricaldata),而且该属性上的各种取值之间没有大小、等级上的数值单调关系。譬如,待预测的属性如果是不同疾病的类型: “心血管病” “肺病” “外伤”,这些属性对应的值之间并没有顺序、大小、等级之分,这种情况下,就只能是分类问题,而不能是回归问题。

(3)回归问题和分类问题可以相互转换的例子

当待预测的属性本身是顺序型时,回归问题和分类问题可以相互转换。顺序型属性的举例:网购的***评分,产品的等级,酒店的排名。

Ordinal类型 (顺序型)的属性,其取值有顺序、大小的关系,如 5*** >4*** >3*** >2*** >1***。此时,回归问题和分类问题可以相互转换。

总之,回归问题和分类问题是否能相互转换,关键在于标签列 /类别列是 Ordinal类型的属性、数值型类型的属性,还是分类型的属性。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码

 

51CTO读书频道活动讨论群:365934973
【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

16招轻松掌握PPT技巧

16招轻松掌握PPT技巧

GET职场加薪技能
共16章 | 晒书包

289人订阅学习

20个局域网建设改造案例

20个局域网建设改造案例

网络搭建技巧
共20章 | 捷哥CCIE

645人订阅学习

WOT2019全球人工智能技术峰会

WOT2019全球人工智能技术峰会

通用技术、应用领域、企业赋能三大章节,13大技术专场,60+国内外一线人工智能精英大咖站台,分享人工智能的平台工具、算法模型、语音视觉等技术主题,助力人工智能落地。
共50章 | WOT峰会

0人订阅学习

读 书 +更多

Linux标准教程

本书以Linux Redhat 9.0中文版为基础编写,从易用性和实用性角度出发主要介绍Linux Redhat 9.0中文版的应用知识,通过本书的学习,相信初中...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客