要求:

  • 导进文档,查询初始数据
  • 将人口数量数据和美国各州通称数据开展合拼
  • 将合拼的数据中反复的abbreviation列开展删掉
  • 查询存有缺少数据的列
  • 寻找有什么state/region促使state的数值NaN ,开展去重复实际操作
  • 为寻找的这种state/region的state项补好恰当的值,进而去祛除state这一列的全部NaN
  • 合拼美国各州总面积数据areas
  • 大家会发觉area(sq.mi)这一列有缺少数据,找到是什么行
  • 除去带有缺少数据的行
  • 找到2010年的全员人口数量数据
  • 测算美国各州的人口密度散布
  • 排列 ,并找到人口密度散布最大的五个州 df.sort_values()

 

1. 导进文档,查询初始数据

import numpy as np
from pandas import DataFrame,Series
import pandas as pd

2. 将人口数量数据和美国各州通称数据开展合拼

 

3. 将合拼的数据中反复的abbreviation列开展删掉

 

4. 查询存有缺少数据的列

 

5. 寻找有什么state/region促使state的数值NaN,开展去重复实际操作

 

6. 为寻找的这种state/region的state项补好恰当的值 ,进而去祛除state这一列的全部NaN

 

7. 合拼美国各州总面积数据areas

 

8. 大家会发觉area(sq.mi)这一列有缺少数据,找到是什么行

 

9. 除去带有缺少数据的行

 

10. 找到2010年的全员人口数量数据

 

11. 测算美国各州的人口密度散布

 

12. 排列,并找到人口密度散布最大的五个州 df.sort_values()

 

文章来源于网络 ,如有侵权请联系站长QQ61910465删除
本文版权归趣KUAI排www.SEOguruBlog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系QQ→61910465