安裝pandas

根据python pip安装pandas

pip install pandas

pandas算法设计

pandas常见算法设计包含:Series和DataFrame

Series

Series是一种一维的数字能量数组型对象,包括一个值编码序列(与numpy中的基本数据类型类似) ,数据标签(称之为索引(index)) 。

import pandas as pd

# 建立Series对象
obj=pd.Series([4,5,6,7])
print(obj)
0    4
1    5
2    6
3    7
dtype: int64

左侧为索引,右侧为值,默认设置索引从0到n-1(n为数据信息长短) ,能够 根据values属性和index属性各自得到Series对象的值和索引

print(obj.values)
array([4, 5, 6, 7], dtype=int64)
print(obj.index)
RangeIndex(start=0, stop=4, step=1)
# 自定索引编码序列
obj2=pd.Series([4,5,6,7],index=['a','b','d','e'])
print(obj2,'\n')

# 输出索引
print(obj2.index)
a    4
b    5
d    6
e    7
dtype: int64 

Index(['a', 'b', 'd', 'e'], dtype='object')

Series对象能够 应用标识来开展索引

# 输出索引为b的元素
print(obj2['b'])

# 输出索引为a,d,e的元素
print('* '*10)
print(obj2[['a','d','e']])
5
* * * * * * * * * * 
a    4
d    6
e    7
dtype: int64

Series对象也可以应用布尔值开展过虑

# 输出值超过5的元素
print(obj2[obj2>5])
d    6
e    7
dtype: int64

DataFrame

DataFrame表明引流矩阵的数据分析表 ,包括已排列的列结合,每一列能够 是不一样的的值种类(标值、字符串数组 、布尔值等)

DataFrame具有行索引,也是有列索引 ,能够 被视作一个共享资源同样索引的Series的词典

# 建立DataFrame对象
data={'age':[18,18,18,20,20,20],'name':['a','b','c','aa','bb','cc'],'height':[180,180,180,182,182,182]}
frame=pd.DataFrame(data)
print(frame)
   age name  height
0   18    a     180
1   18    b     180
2   18    c     180
3   20   aa     182
4   20   bb     182
5   20   cc     182

DataFrame还可以用columns主要参数特定列索引排列顺序

frame=pd.DataFrame(data,columns=['name','age','height'])
print(frame)
  name  age  height
0    a   18     180
1    b   18     180
2    c   18     180
3   aa   20     182
4   bb   20     182
5   cc   20     182

假如传的列主要参数没有词典中 ,可能出現缺少值

frame=pd.DataFrame(data,columns=['name','age','height','addition'])
print(frame)
print(frame.columns)
  name  age  height addition
0    a   18     180      NaN
1    b   18     180      NaN
2    c   18     180      NaN
3   aa   20     182      NaN
4   bb   20     182      NaN
5   cc   20     182      NaN
Index(['name', 'age', 'height', 'addition'], dtype='object')

DataFrame的一列能够 按字典型性标识或属性那般索引为Series

frame=pd.DataFrame(data,columns=['name','age','height'])
print(frame['name'])
print(frame.age)
0     a
1     b
2     c
3    aa
4    bb
5    cc
Name: name, dtype: object
0    18
1    18
2    18
3    20
4    20
5    20
Name: age, dtype: int64

行还可以根据部位或独特属性loc开展索引

frame=pd.DataFrame(data,columns=['name','age','height'])
print(frame.loc[2])
name        c
age        18
height    180
Name: 2, dtype: object
本文版权归去快排wWw.seogUrublog.com 所有,如有转发请注明来出,竞价开户托管,seo优化请联系qq❉61910465