推荐|数据转换:标准化vs 归一化(附代码&链接)
标准化和归一化的区别
何时使用标准化和归一化
如何用Python实现特征缩放
“特征缩放的目的是使得所有特征都在相似的范围内,因此建模时每个特征都会变得同等重要,并且更便于机器学习的算法进行处理。”
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(df)
scaled_features = scaler.transform(df)
#Convert to table format - MinMaxScaler
df_MinMax = pd.DataFrame(data=scaled_features, columns=["Age", "Salary","Purchased","Country_France","Country_Germany", "Country_spain"])
特征缩放后
工资变量的常态分布和标准差
特征缩放的使用场景:
注:如果算法不是基于距离计算,特征缩放则不重要,比如朴素贝叶斯和线性判别分析,以及树模型(梯度提升、随机森林等)。
使用特征缩放的目的
标准化与归一化的区别
需要使用标准化或归一化的算法
在Python中实现特征缩放
获取代码和数据集合,请使用一下连接:
https://github.com/clareyan/feasturescaling
END
转自: 数据派THU 公众号;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
合作请加QQ:365242293
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号
随时掌握互联网精彩
随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 准确把握守正创新的辩证关系 7944249
- 2 中国黄金原董事长家搜出大量黄金 7965270
- 3 空调英文不会男生盯着考场空调看 7840397
- 4 消费品以旧换新“加速度” 7720443
- 5 被铁路售票员的手速惊到了 7664677
- 6 网红赤木刚宪爆改赵露思 7511750
- 7 县委原书记大搞“刷白墙”被通报 7441849
- 8 山姆代购在厕所分装蛋糕 7383208
- 9 马龙刘诗雯穿正装打混双 7299132
- 10 刘强东提前发年终奖 7161408