20行Python代码给微信头像戴帽子
作者 | Leauky,北理工硕士在读,非CS专业的Python爱好者。
朋友圈里@微信官方要求戴圣诞帽的活动曾经火爆一时,有些会玩的小伙伴都悄咪咪地用美图秀秀一类的 app 给自己头像 p 一顶,然后可高兴地表示“哎呀好神奇hhhh”,呆萌的小伙伴当然就一直等啊等... ...作为一名坚信“用技术解决需求”的萌新,在一个无聊的周末尝试用python来搞一波事情。
主要思路
准备两张图:一张头像,一张帽子。先用人脸识别定位头像中的人脸,给出人脸像素坐标;再根据这个坐标确定帽子放置的坐标;最后将两张图片拼接后输出。(需要注意的是,帽子是不规则图像,除了主体外背景应该是透明的,因此必须是四通道png格式)。gakki 酱亲自演示如下:
问题展开
1. 人脸识别怎么搞定?(重新造轮子?不存在的,这辈子都不可能造轮子的)。Github上一个开源的python人脸识别库face_recognition双手奉
https://github.com/ageitgey/face_recognition#face-recognition
据说识别率99.38%(顶瓜瓜啊!)。通过安装这个库就可以调用人脸检测器。
2. 确定了帽子的放置位置,怎么拼接图层?这个属于基本的图像操作,python提供了PIL(Python Image Lib)这么一个库来进行图像处理,具体操作请看后面的代码。
库的安装
我的环境是Ubuntu 16.04+Python2.7.12。使用Window,Mac OS和Python3的同学也可以参考,都是类似的。face_recognition这个库比较事儿,安装前需要依次安装boost(boost_python),cmake,dlib这几个依赖和库,中间出现任何问题都可以通过Google解决(懒得写 -.. -)。安装完所有的依赖后,使用命令:
1pip install face_recognition
2pip install pillow #PIL库
完成后就可以在你的python脚本里import face_recognition和PIL了。
代码分析
Talk is cheap, show me the code。直接上代码:
1from PIL import Image
2import face_recognition
3img_path = raw_input("image path:")
4image = face_recognition.load_image_file(img_path)
5face_locations = face_recognition.face_locations(image)
6print("Found {} face(s) in this photograph.".format(len(face_locations)))
第1、2行导入PIL库中的Image模块和face_recognition库。第3行,等待用户输入头像图片的路径。第4行,把路径所指的图像数据读入image中。第5行,调用face_locations处理image中的图像数据,对图片中的人脸进行识别定位,定位后的得到的像素坐标数据放在face_locations里。第6行在shell里输出图片里识别到的人脸的个数。
7human_img = Image.open(img_path)
8human_img = human_img.convert("RGBA")
9hat_img = Image.open("./hat.png")
10hat_img = hat_img.convert("RGBA")
第7、8行,把路径所指的图像数据读入human_img中,并转换为四通道RGBA模式。9、10行读入帽子图像并做相同处理。
11for face_location in face_locations:
12 top, right, bottom, left = face_location
13 top -= 10
14 print("A face is located at pixel location Top: {}, Left: {}, Bottom: {}, Right: {}".format(top, left, bottom, right))
15 head_h = bottom-top#hight of head
16 head_l = right-left#length of head
17 hat_img = hat_img.resize( (head_l,head_h) )#convert size of hat
18 hat_region = hat_img
19 human_region = ( left, top-head_h, right, top )
20 human_img.paste(hat_region, human_region,mask=hat_img)
21human_img.show()
如果一张图里有多张人脸,face_recognition.face_locations(image)会返回每张人脸的位置信息,存放在一个list里。因此第11行是遍历face_locations里的每张人脸的数据。第12行解包一个人脸像素坐标数据,得到top,right,bottom,left分别为示意图中的y1,x2,y2,x1。第13行,为啥y1要减10个像素?因为人脸识别得到的y1最多到你额头的位置,所以再把这个坐标往上提一提帽子才戴得更自然。第14行输出坐标数据方便调试。第15、16行计算人脸的高度和宽度。第17行使用resize()根据人脸的大小调整帽子的大小,因为图像中的人脸有大有小,调整后看起来更和谐。第18行,将帽子图像作为顶部图层图像。第19行,确定底部图层(头像图片)被覆盖的区域(就是帽子放置区域)。第20行,把顶部图层与底部图层拼接(不太明白的看下图)。然后一个循环结束,亦即完成图片中一个人的戴帽操作,接着进行下个人的戴帽,直到所有人都戴上了帽子。最后21行,完成输出~
更新
更多人脸:
源码链接(提取密码:3979)
https://pan.baidu.com/share/init?surl=i53rGH3
(*本文为作者投稿文章,转载请联系原作者)
公开课预告
◆
全双工语音
◆
本期课程中,微软小冰全球首席架构师及研发总监周力博士将介绍微软小冰在全双工语音对话方面的最新成果,及其在智能硬件上的应用和未来将面临的更多技术产品挑战。
推荐阅读
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
随时掌握互联网精彩
- 1 中共中央国务院举行春节团拜会 7961605
- 2 DeepSeek又崩了 7957837
- 3 什么事都能年后再说但这事不行 7832300
- 4 全世界爱上“非遗中国年” 7723363
- 5 全国的山姆都被挤爆了 7626517
- 6 倪萍曾救下想轻生的宋丹丹 7577128
- 7 ChatGPT回应被DeepSeek超越 7455543
- 8 冯巩 我想死你们了 7341471
- 9 美股集体低开 英伟达跌超12% 7260223
- 10 多民族特色美食 共赴团圆之约 7183857