硬核黑科技告诉你,漫威 10 年到底有多少个角色?


作者 | 法纳斯特
责编?| 郭芮
最近正值复联4上映,笔者也发现了一个有趣的网站,主要是关于漫威人物、漫威电影的图谱。

https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/index.html
其实之前笔者也利用了有关Graph的库实现了一波人物的关系分析,只不过分析结果比较粗糙而已~下面是网站的概况,网站是基于Graph技术开发的。,大家可以一览。


那么人家能做出这么酷炫的关系图,我们自己能不能实现呢?本文就利用网站提供的数据,使用Neo4j(NOSQL图形数据库)进行实战一波。

获取分析
人物及人物关联信息从网站上获取,具体接口如下:

数据为JSON格式,分别在「characters」和「relationship」中。

这里的信息是分别指托尼·斯达克,关系「0」为朋友,斯蒂文·罗杰斯。


数据获取
具体代码如下:
import?json
import?requests
headers?=?{
????'user-agent':'Mozilla/5.0?(Windows?NT?6.1;?WOW64)?AppleWebKit/537.36?(KHTML,?like?Gecko)?Chrome/63.0.3239.132?Safari/537.36'
}
url?=?'https://graphics.straitstimes.com/STI/STIMEDIA/Interactives/2018/04/marvel-cinematic-universe-whos-who-interactive/data/marvel-data.json'
response?=?requests.get(url=url,?headers=headers)
result?=?json.loads(response.text)
num?=?0
names?=?[]
item?=?{0:?'friend',?1:?'enemy',?2:?'creation',?3:?'family',?4:?'work',?5:?'love'}
for?i?in?result['relationship']:
????subject?=?result['relationship'][i]['id']
????object?=?result['relationship'][i]['target_id']
????if?subject?not?in?names:
????????names.append(subject)
????if?object?not?in?names:
????????names.append(object)
????relation?=?int(result['relationship'][i]['relationship'])
????with?open('relation_message.csv',?'a+')?as?f:
????????f.write(subject?+?','?+?object?+?','?+?item[relation]?+?'n')
for?j?in?names:
????num?+=?1
????with?open('names_message.csv',?'a+')?as?f:
????????f.write(j?+?','?+?str(num)?+?'n')
for?k?in?result['characters']:
????id?=?result['characters'][k]['id']
????name?=?result['characters'][k]['name']
????status?=?result['characters'][k]['status']
????species?=?result['characters'][k]['species']
????with?open('message.csv',?'a+')?as?f:
????????f.write(id?+?','?+?name?+?','?+?status?+?','?+?species?+?'n')
最后成功获取数据。

人物名为简称,共计182个人物。

1144条人物关系数据,4大类型,下面是182个人物的一些详情信息:

包含了人物的名字及简称,存活状态,人物属性。

数据可视化
下面通过Neo4j对人物关系进行可视化,Neo4j的安装这里就不细说了,大家可以自行百度。开启Neo4j服务后,登陆Neo4j网站,初始化界面如下:

先加载第一个文件:

具体代码如下:
LOAD?CSV??WITH?HEADERS?FROM?'file:///names_message.csv'?AS?data?CREATE?(:people{name:data.name,?id:data.id});
下面加载第二个文件:

具体代码如下:
LOAD?CSV??WITH?HEADERS?FROM?"file:///relation_message.csv"?AS?relations
MATCH?(entity1:people{name:relations.subject})?,?(entity2:people{name:relations.object})
CREATE?(entity1)-[:rel{relation:?relations.relation}]->(entity2)
点击1144按钮处,取消限制数,再点击全屏。



这里大致能看出来漫威的人物聚集情况,第一大反派灭霸(thanos),原来这么孤立的。
这里由于人物太多,造成观察不便,所以对结果进行一些筛选,比如筛选托尼·斯达克的朋友,运行下面的代码。
match?p=(n:people{name:"tonys"})-[:rel{relation:"friend"}]->()?return?p;
得到下图结果:

其中「thor」为「雷神」,「stever」为「美队」,「blackw」为「黑寡妇」,「vision」为「幻视」,「peterp」为「蜘蛛侠」,「bruceb」为「绿巨人」。
下面再来看一下美队的女友吧。

佩吉·卡特和她的侄女莎朗·卡特,据说两人样貌极为相像。

总结
本次只是对Neo4j的一些简单操作,后期或许会去深入了解。此外漫威的这些人物信息,还可以玩出很多花样的。也希望大家能去动手尝试尝试,做一枚硬核铁粉~
作者:法纳斯特,Python爱好者,专注爬虫,数据分析及可视化。
声明:本文首发个人公众号法纳斯特,作者投稿,版权归其个人所有。


作为码一代,想教码二代却无从下手:
听说少儿编程很火,可它有哪些好处呢?
孩子多大开始学习比较好呢?又该如何学习呢?
最新的编程教育政策又有哪些呢?
下面给大家介绍CSDN新成员:极客宝宝(ID:geek_baby)
戳他了解更多↓↓↓

?热 文?推 荐?
?华为在剑桥建芯片厂;小米公布出货量反驳调研机构; 中移动否认限制号 | 极客头条
?安全顾问反水成黑客, 靠瞎猜盗得5000万美元的以太币, 一个区块链大盗的另类传奇
?如何确定最佳训练数据集规模?6 大必备“锦囊”全给你了 | 技术头条
??“别再埋头学Python了!”上线收获 3.6W 程序员热议,你怎么看?
System.out.println("点个在看吧!");
console.log("点个在看吧!");
print("点个在看吧!");
printf("点个在看吧!n");
cout?< "点个在看吧!"?< Console.WriteLine("点个在看吧!");
Response.Write("点个在看吧!");
alert("点个在看吧!")
echo "点个在看吧!"
点击阅读原文,输入关键词,即可搜索您想要的 CSDN 文章。
你点的每个“在看”,我都认真当成了喜欢
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 中共中央召开党外人士座谈会 7904763
- 2 日本附近海域发生7.5级地震 7809514
- 3 日本发布警报:预计将出现最高3米海啸 7711936
- 4 全国首艘氢电拖轮作业亮点多 7618619
- 5 课本上明太祖画像换了 7520145
- 6 中国游客遇日本地震:连滚带爬躲厕所 7426292
- 7 亚洲最大“清道夫”落户中国洋浦港 7329969
- 8 日本地震当地居民拍下自家书柜倒塌 7238723
- 9 留几手征婚要求女方是富婆 7136585
- 10 “人造太阳”何以照进现实 7048003








程序人生
