博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数值变量分类问题相关原理知识
阅读量:5106 次
发布时间:2019-06-13

本文共 372 字,大约阅读时间需要 1 分钟。

1 string->labelencoder(preprocessing.LabelEncoder())

Sklearn中的LabelEncoder可以将标签分配一个0到n_classes-1之间的编码 ,即将各种标签分配一个可数的连续编号。

2 可视化 matplotlib

data.hist(bins=50)#bin指定bin(箱子)的个数,也就是总共有几条条状图。

3 标准化、归一化

归一化算法是通过特征的最大最小值将特征缩放到[0,1]区间范围内。标准化是通过特征的平均值和标准差将特征缩放成一个标准的正态分布,均值为0,方差为1。standarscaler去均值和方差归一化是针对每一个特征维度来做的,而不是针对样本。

转载于:https://www.cnblogs.com/DHuifang004/p/11099738.html

你可能感兴趣的文章
vscode React插件
查看>>
redis 安装后不能使用
查看>>
开发落网电台windows phone 8应用的计划(5)
查看>>
二维火Java实习生面试
查看>>
HDU 4734 - F(x) (数位DP)
查看>>
调用GridControl自带的导航按钮
查看>>
Nowcoder | [题解-N165]牛客网NOIP赛前集训营-普及组(第二场)
查看>>
充放电利器 BYD双向逆变充放电技术解析
查看>>
74. 编码与解码
查看>>
导入excle读取表头添加到对应的源字段列表里
查看>>
UVA10453
查看>>
竟态条件(时序竟态)初窥
查看>>
Infopath 2010 设置具有 xsi:nil 属性的节点的值
查看>>
HTML5 设备上的API
查看>>
使用Ueditor上传图片到图片服务器(二)
查看>>
TestNg 12. extentReport测试报告
查看>>
Java SimpleDateFormat的用法(日期格式)
查看>>
记一次线上Java程序导致服务器CPU占用率过高的问题排除过程
查看>>
redis的三种启动方式
查看>>
day02-爬虫入门
查看>>