文中的文本及图片来自互联网,仅作学习培训、沟通交流应用,不具备一切商业行为,著作权归创作者全部,如有什么问题请立即在线留言以作解决

 

 

Python 数据统计分析训练解读:大数据可视化

https://www.bilibili.com/video/BV1sK4y1E77C/

 

序言

2020年的最终一段时间里,大伙儿都会盼望着新一年来临的日子里 ,又有一位超重量级的女星公布告一段落自身的婚姻生活。12月23日下午,刘嘉玲和高圣远在新浪微博中往大伙儿公布了自身的离异的信息,一时间变成了新浪微博的熔点话题 。大伙儿为她们觉得痛惜的另外 ,也祝愿两个人之后都可以各自珍重,有着自身美好人生。

 

实际上离异的话题,在大家的日常日常生活 ,早已算不上是十分新鮮的话题了,依据民政的互联网大数据显示信息,在我国的离婚率早已持续八年上升 ,而结婚率早已持续5年降低。为了更好地更强的协助大伙儿掌握现阶段在我国的离婚率现况,大家根据数据信息的数据可视化展现,来形象化的呈现给大伙儿 。

 

1

数据获取

针对数据信息的获得 ,能够立即到中国统计局的官网开展获得 ,网址为:

https://data.stats.gov.cn/easyquery.htm?cn=C01&zb=A0P0C&sj=2019

因为中国统计局的数据信息全是朝向群众对外开放的,因而大家无须运用网页爬虫开展抓取,能够立即从网址上开展免费下载 ,如下图所显示:

 

这儿免费下载的数据信息是对于于全国各地的状况开展统计分析的,大家还能够分省本年度报考中,免费下载每一个省份的离异信息内容的年度报表。

 

2

数据统计分析

 

1).数据信息的基本剖析

获得到数据信息以后 ,大家先來对全国各地的离异信息内容开展掌握。

 

从上边的信息内容能够见到统计分析的信息内容中包括了登记结婚 、国内住户结婚登记、离婚登记这些信息内容的统计分析 。而这儿的粗离婚率指的是本年度离异数与人口总数之比。相匹配到大家图中的数据信息中,以2019年为例子,粗离婚率是千分之3.36 ,换句话说在1000本人之中有3.36人会离异。

2).大数据可视化

俗话说得好“字比不上表,表比不上图”,大家然后运用数据图表看来一下 ,近十年来在我国的粗离婚率的转变状况 。

 

大家将全国各地数据信息中的年代信息内容和粗离婚率的特征提取出去,并取名为x_data和y_data,随后运用pyecharts中的Line类来绘图数据可视化結果 ,結果以下:

 

能够见到 ,在我国的粗离婚率伴随着時间的发展趋势而持续的飙升,从2010年到2019年这十年间,粗离婚率翻了近1.7倍。

3).离婚率的统计分析

从全国各地的数据信息中 ,能够见到,2019年,在我国的粗离婚率的均值标值为3.36。大家来统计分析一下 ,全国各地31个省市自治州中,坐落于均值标值的省份总数的遍布状况 。

 

程序流程最先获取了每个省市自治区数据信息中,2019年粗离婚率数据信息 ,随后依据平均值的尺寸来开展分辨统计分析,最终运用Pie类来开展数据可视化的展现 。

 

从数据可视化的统计分析結果看来,我们可以获得以下几个方面结果。超过3.36的省份总数和低于3.36的省份总数基本上是势均力敌 ,没有一个大城市的粗离婚率正好相当于3.36,而且粗离婚率超过3.36的大城市为16个。所以说全国各地范畴内离婚率都处于一个比较均衡的范畴内,并沒有哪一个省份的离婚率比较突显 。

 

04).北京市 VS 上海市 离婚率

尽管上海北京在离婚率上并不是很突显 ,可是大家還是能够来对于这两个大城市来做一个目的性的比照 ,运用Altair库看来一下,上海与北京近十年的离婚率比照状况。

 

程序流程最先载入北京和上海的粗离婚率数据信息,随后获取并结构年代、大城市等数据信息 ,并融合为DataFrame文件格式的数据信息,随后根据Altair库来结构数据可视化柱形图,运作所述程序流程 ,获得下列的結果。

 

能够看得出,上海与北京的离婚率从分别的大城市考虑,展现周期性的起伏 ,一直持续两年提高后快速下降,随后再度渐渐地提高,并且趣味的是 ,2个大城市的起伏规律性基本上是完全一致的 。而从2个大城市比照的视角看来,北京市的粗离婚率一直高过上海市。

文章来源于网络,如有侵权请联系站长QQ61910465删除
本文版权归去快排Seo www.SEOgurublog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ▷61910465