Pandas通常是用于数据分析过程中, 数据的清洗, 数据预处理, 数据的描述性分析等过程中.
API:应用程序编程接口
Pandas可认为是Python中的excel
Pandas中最主要的两种数据类型是:一维的Series和二维的DataFrame
一个Series中只能保存一种数据类型
DataFrame是由Series构成的,所以看DataFrame由几个元素构成,就看有几个Series
列表转换为DataFrame是按行转换的,字典转换为DataFrame是按列转换的
字典转换:会把字典的key转化为索引
Pandas是基于numpy的一个数据分析包,它里面的内核是Numpy
手动构建Series
用np.array和列表创建Series
data = np.array([22,3000,33,37,40,1500])
L = [22,3000,33,37,40,1500]
然后
pd.Series(data)
pd. Series(L)
使用Series类创建Series对象
test = pd.Series(data)
拓展Series:(给series添加索引和索引名称.设置类型)
s = pd.Series(data,name="年龄",index=['蜘蛛侠','灭霸','奇异博士','钢铁侠','蝙蝠侠','索尔'],dtype='int')
给索引起一个名:
s.index.name = "姓名"
查看: 索引/ 索引名称/ 索引值/ 索引值名称/ 索引值类型
s.index/ index.name/ values/name/ dtype
修改: 索引/ 索引名称/ 索引值名称/ 索引值类型
s.index = [1,2,3,4,5,6]
s.index.name='英雄姓名'
s.name = '英雄年龄'
s.astype('float')
另一种修改; 索引/ 索引值名称的方式:
s = pd.Series(data,name='英雄年龄',index = ['蜘蛛侠', '灭霸', '奇异博士', '钢铁侠', '蝙蝠侠', '索尔'])