要求:
- 导进文档,查询初始数据
- 将人口数量数据和美国各州通称数据开展合拼
- 将合拼的数据中反复的abbreviation列开展删掉
- 查询存有缺少数据的列
- 寻找有什么state/region促使state的数值NaN ,开展去重复实际操作
- 为寻找的这种state/region的state项补好恰当的值,进而去祛除state这一列的全部NaN
- 合拼美国各州总面积数据areas
- 大家会发觉area(sq.mi)这一列有缺少数据,找到是什么行
- 除去带有缺少数据的行
- 找到2010年的全员人口数量数据
- 测算美国各州的人口密度散布
- 排列 ,并找到人口密度散布最大的五个州 df.sort_values()
1. 导进文档,查询初始数据
import numpy as np from pandas import DataFrame,Series import pandas as pd
2. 将人口数量数据和美国各州通称数据开展合拼
3. 将合拼的数据中反复的abbreviation列开展删掉
4. 查询存有缺少数据的列
5. 寻找有什么state/region促使state的数值NaN,开展去重复实际操作
6. 为寻找的这种state/region的state项补好恰当的值 ,进而去祛除state这一列的全部NaN
7. 合拼美国各州总面积数据areas
8. 大家会发觉area(sq.mi)这一列有缺少数据,找到是什么行
9. 除去带有缺少数据的行
10. 找到2010年的全员人口数量数据
11. 测算美国各州的人口密度散布
12. 排列,并找到人口密度散布最大的五个州 df.sort_values()