文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,如有什么问题请立即在线留言以作解决 。

创作者:小白大爷

来源于:程序猿GitHub

Python网络爬虫 、数据统计分析、网站建设等实例视频教程在线免费收看

https://space.bilibili.com/523606542

近期一段时间 ,外国媒体TOP BEAUTY WORLD选择了全世界最酷男士和最美女性前100名,肖战。变成了该排名榜历年至今第一位登上的东方人。这一信息马上变成了总流量的网络热点 。

我只想去查了一下,爱看一下总榜中的最美丽漂亮小姐姐的信息。但是如今都还没最美丽漂亮小姐姐的文本总榜信息。可是我却查到2019年年末公布的上一届的全世界最美女性前一百名的详尽总榜 ,包括了名字、国藉和岗位等信息 。

 

有那么详细的总榜,大家怎能不用来好好地的研究一波?我立刻抓取了数据信息,并开展了数据信息的大数据可视化 ,一起来瞧瞧吧。

 

评价方法

针对排名榜的评定,不仅仅是针对容貌的评比。总榜是依据下边公式计算开展打分 。

总成绩=0.3粉絲网络投票 0.5官方网对于入选大牌明星的五官比例得出的成绩 0.2*(个性化 、身型、公益慈善工作中等)

能够见到,打分考试成绩中 ,综合性的考虑到了很多层面的要素 ,能从参赛选手的多方位开展综合性的剖析和打分评定 。懂了打分的评价方法后,大家下面就看一下怎样获得该份总榜的数据信息吧。

 

极品女神数据获取

 

最先,我们要获得到要想的数据信息 ,包含漂亮小姐姐的相片,名字及其国藉等信息。因为网页页面归属于静态页面,因而能够立即剖析网页源代码 ,获得到大家必须的数据信息就可以 。程序流程如下图所显示:

 

所述的程序流程中,大家最先利用requests要求网页页面,随后利用BeautifulSoup分析网页页面。这儿必须留意的是 ,不一样的li标签的“id"是依据排行来开展转变的。

因此我们要根据循环系统来搭建不一样的id特性,为此来爬取相匹配的li标签,并获取名字、国藉等信息 。

利用self.downloadImg涵数将图片下载到当地 ,将爬取到的名字和国藉等信息储存到当地。爬取到的信息以下所显示:

 

对顶尖极品女神数据统计分析

获得到数据信息后,大家来对数据信息开展一下清楚,并看一下从数据信息里能获得什么信息。

1).佛山信息统计分析

 

能够见到 ,美女们来源于全世界全国各地 ,这儿大家以我国为统计分析企业,统计分析每个佛山上我国出現的频次,留意 ,上边的 ”Filipina-American“,大家将其统计分析2次,即即是菲律宾人也是外国人 。根据下边的程序流程 ,我们可以数据可视化的展现出不一样佛山我国出現的频次。

 

能够见到,全世界一百名美女来源于了除南极大陆以外的别的六个佛山,在其中来源于亚洲的国家是数最多的 ,欧州和北美洲略逊一筹。

 

2).国藉信息统计分析

针对美女国藉的统计分析和数据可视化解决,是一件十分不便的事儿,这儿必须对于数据信息开展细心的分辨解决 ,尽管十分耗费時间,可是好在总数并并不是许多,如下图所显示:

 

大家对于于不一样美女的不一样我国信息 ,只必须开展循环系统分辨 ,比如假如美女的我国是”Thai",大家就将其我国填补为“Thailand” 。由于在事后利用pyecharts数据可视化全过程中,大家必须利用pyecharts内置的规范国家名字来表明 ,不然得话就没有办法开展数据的表明。历经分辨统计分析后,其数据可视化結果以下。

 

能够见到,这一百名美女中 ,来源于英国的是数最多的,自然,毫无疑问的是许多全是拥有英国和其他国家的多重国籍真实身份的 。来源于美国的是13名美女 ,自然也是有很多是拥有多重国籍的真实身份 。

而第三名的中国和韩则是彻底不会有多重国籍的难题。从全世界的遍布范畴看来,非州和欧州的总数形象化看起来十分的少,尤其是西班牙 、荷兰等一些欧洲各国 ,也没有如选前100名的美女出現。

 

3).职业定位

针对总榜中美女们的岗位,这儿也是十分的集中化,仅有三种岗位:女模特、知名演员、歌星 。不容置疑 ,每一个岗位全是必须本身的标准十分的极致。

 

而在岗位的占有率中 ,能够见到知名演员的占有率是最大的,由于长相是一个知名演员的个人名片,也是打分考试成绩中占有率最大的一项 ,因而在前100名中,知名演员占有率最大也就不奇怪了。

4).长相打分

即然这一总榜是有关全球最美的100名女士,那长相当然是逃不动的话题讨论 ,最终,大家来利用百度搜索的面部识别来为100名美女的长相做一个打分,看来一下到底在AI的眼里 ,哪位最美丽的女星 。

 

所述程序流程中,根据向FaceScore涵数传送照片的途径,在FaceScore涵数中 ,根据get_file_content涵数将照片以二进制方式载入;

并根据base64库开展编号后,做为params主要参数post给要求url链接。并分析url链接回到的信息,获取回到信息中的长相打分数据信息;

运作所述的程序流程后 ,大家便会获得有关100名美女的AI长相打分。这儿 大家为大伙儿展现一下 ,长相打分前五名都名人有哪些 。

 

之上便是我今日为大伙儿产生的有关全球最美100名女士的共享,热烈欢迎大伙儿在留言板留言区吱一声,说说你最爱哪一位极品女神哦!

文章来源于网络 ,如有侵权请联系站长QQ61910465删除
本文版权归趣营销www.SEOgUrublog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ卍61910465