数据转换 :标准化vs 归一化(附代码&链接)
标准化和归一化的区别
何时使用标准化和归一化
如何用Python实现特征缩放
“特征缩放的目的是使得所有特征都在相似的范围内,因此建模时每个特征都会变得同等重要,并且更便于机器学习的算法进行处理。”
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(df)
scaled_features = scaler.transform(df)
#Convert to table format - MinMaxScaler
df_MinMax = pd.DataFrame(data=scaled_features, columns=["Age", "Salary","Purchased","Country_France","Country_Germany", "Country_spain"])
特征缩放后
工资变量的常态分布和标准差
特征缩放的使用场景:
注:如果算法不是基于距离计算,特征缩放则不重要,比如朴素贝叶斯和线性判别分析,以及树模型(梯度提升、随机森林等)。
使用特征缩放的目的
标准化与归一化的区别
需要使用标准化或归一化的算法
在Python中实现特征缩放
获取代码和数据集合,请使用一下连接:
https://github.com/clareyan/feasturescaling
END
转自: 数据派THU 公众号;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
合作请加QQ:365242293
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号
随时掌握互联网精彩
随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 澳门是伟大祖国的一方宝地 7979053
- 2 36岁女子看高血压查出怀孕34周 7950120
- 3 日本火山喷发灰柱高达3400米 7848215
- 4 中国为全球经济增长添动能 7700312
- 5 刘诗诗方辟谣离婚 7657150
- 6 女子8年生6个女儿第7胎再产女 7552502
- 7 #胡锡进的2024年终总结# 7473448
- 8 肖战新片射雕英雄传郭靖造型曝光 7353979
- 9 女法官遇害案凶手被判死刑 7272050
- 10 蒋欣生图更是妈妈级别 7136793