推荐|数据转换:标准化vs 归一化(附代码&链接)
标准化和归一化的区别
何时使用标准化和归一化
如何用Python实现特征缩放
“特征缩放的目的是使得所有特征都在相似的范围内,因此建模时每个特征都会变得同等重要,并且更便于机器学习的算法进行处理。”





from sklearn.preprocessing import MinMaxScalerscaler = MinMaxScaler()scaler.fit(df)scaled_features = scaler.transform(df)#Convert to table format - MinMaxScalerdf_MinMax = pd.DataFrame(data=scaled_features, columns=["Age", "Salary","Purchased","Country_France","Country_Germany", "Country_spain"])

特征缩放后

工资变量的常态分布和标准差

特征缩放的使用场景:


注:如果算法不是基于距离计算,特征缩放则不重要,比如朴素贝叶斯和线性判别分析,以及树模型(梯度提升、随机森林等)。
使用特征缩放的目的
标准化与归一化的区别
需要使用标准化或归一化的算法
在Python中实现特征缩放
获取代码和数据集合,请使用一下连接:
https://github.com/clareyan/feasturescaling
END
转自: 数据派THU 公众号;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
合作请加QQ:365242293
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 中法元首相会都江堰 7904379
- 2 中方不接受日方所谓交涉 已当场驳回 7808044
- 3 大闸蟹为何会在欧美泛滥成灾 7712560
- 4 国际机构看中国经济 关键词亮了 7616047
- 5 家长称婴儿被褥印不雅英文单词 7520631
- 6 日方军机滋扰擅闯或被视为训练靶标 7425533
- 7 12306出新功能了 7330461
- 8 国乒8比1击败日本队 11战全胜夺冠 7237770
- 9 男子海洋馆内抽烟被白鲸喷水浇灭 7138966
- 10 千吨级“巨无霸”就位 7040084







数据分析
