1、选用读取文件的函数,excle就用read_excle(),csv,txt文件就用read_csv() 2、路径的完整性,注意是相对路径还是绝对路径,路径中尽量不要有中文,路径前加r,防止转义,文件名文件格式完整 3、分隔符,提前查看下文件分隔符,导入文件时选对应的分隔符,excle一般不需要设置分割符 4、是否忽略第一行,或者是否设置标题,索引等
读童话的狼
2020-03-13
sample函数默认的都是不放回抽样,所谓无放回抽样,也就是说某个元素一旦被选择,该总体中就不会再有该元素。 如果是有放回抽样,则需添加一个参数repalce=T: >>> x=1:10 >>> sample(x=x,size=5,replace=T) 4 7 2 4 8 “replace”就是重复的意思。即可以重复对元素进行抽样,也就是所谓的有放回抽样。我们看上面的结果,元素4在5次随机抽样
读童话的狼
2020-03-13
import pandas as pd pd.set_option('display.float_format',lambda x : '%.2f' % x) 运行这行代码就可以将所有的浮点数输出保留两位小数,也就不会显示科学计数法了
读童话的狼
2020-03-13
polyfit函数可以使用最小二乘法将一些点拟合成一条曲线. numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False) # x:要拟合点的横坐标 # y:要拟合点的纵坐标 # deg:自由度.例如:自由度为2,那么拟合出来的曲线就是二次函数,自由度是3,拟合出来的曲线就是3次函数 首先我们先来构造一下需要被拟合的散点 x
读童话的狼
2020-03-12
1、io,Excel的存储路径 import pandas as pd io = r'C:\Users\Administrator\Desktop\data.xlsx' #建议使用英文路径以及英文命名方式。 2、sheet_name,要读取的工作表名称 可以是整型数字、列表名或SheetN,也可以是上述三种组成的列表。 整型数字:目标sheet所在的位置,以0为起始,比如sheet_name
读童话的狼
2020-03-12
有时默认的图例位置不符合我们的需要,那么我们可以使用下面的代码对legend位置进行调整。 plt.legend(loc='String or Number', bbox_to_anchor=(num1, num2)) loc位置参数如下: =============== ============= Location String Location Code
读童话的狼
2020-03-12
Matplotlib的可以把很多张图画到一个显示界面,这就设计到面板切分成一个一个子图。这是怎么做到的呢。matplot提供两种方法。 subplot直接指定划分方式和位置进行绘图。 t=np.arange(0.0,2.0,0.1) s=np.sin(t*np.pi) plt.subplot(2,2,1) #要生成两行两列,这是第一个图plt.subplot('行','列','编号') plt.p
读童话的狼
2020-03-12
使用%matplotlib命令可以将matplotlib的图表直接嵌入到Notebook之中,或者使用指定的界面库显示图表,它有一个参数指定matplotlib图表的显示方式。inline表示将图表嵌入到Notebook中。 Python提供了许多魔法命令,使得在IPython环境中的操作更加得心应手。魔法命令都以%或者%%开头,以%开头的成为行命令,%%开头的称为单元命令。行命令只对命令所在的
读童话的狼
2020-03-12
r是保持字符串原始值的意思,就是说不对其中的符号进行转义。 因为windows下的目录字符串中通常有斜杠"\",而斜杠在Python的字符串中有转义的作用。 例如:\n表示换行如果路径中有\new就会被转义。加上r就是为了避免这种情况。
读童话的狼
2020-03-12
区别: series,只是一个一维数据结构,它由index和value组成。 dataframe,是一个二维结构,除了拥有index和value之外,还拥有column。 联系: dataframe由多个series组成,无论是行还是列,单独拆分出来都是一个series。 另外series和dataframe都是python中的类,是两个平等的类
读童话的狼
2020-03-11
1、python中定义类使用class关键字,class后面紧接类名,类名通常是大写开头的单词 2、类包含属性和方法 3、一个对象的特征称为"属性",一个对象的行为称为"方法"。属性在代码层面上来看就是变量,方法实际就是函数,通过调用这些函数来完成某些工作 4、在类中定义方法的形式和函数差不多,但其不称为函数,而是叫方法。方法的调用需要绑定到特定的对象上(通过self.),而函数不需要。
读童话的狼
2020-03-11
函数 :可以直接用函数名字调用 ,函数在定义的时候,不依赖于任何类 方法:本质是定义在类的内部的函数,调用的时候依赖于类,必须有一个此类当中的对象存在,通过这个对象(实例)来调用方法
读童话的狼
2020-03-11
不需要计算就可以获得的就是属性,如形状,列名,也就是说表已经存在了,表的基本特征的查看 方法是需要详细计算的,比如表的描述统计 使用的时候属性后加括号会报错 方法不加括号返回表的信息
读童话的狼
2020-03-11
sort、sorted()都是参照字符的编码大小,进行排序的。汉字对应的编码顺序,本身就是杂乱的,所以使用sort排序结果自然无规则可言。 所以你首先要有自己的排序规则,比如按拼音字母,笔画多少。 然后再创建排序规则(可以是一个文本文件、也可以保存到数据库、也可以做个列表保存)。 最后用匿名函数配合sort排序。
读童话的狼
2020-03-11
pandas排序的方法有很多,sort_values表示根据某一列排序 pd.sort_values("xxx",inplace=True) 表示pd按照xxx这个字段排序,inplace默认为False,如果该值为False,那么原来的pd顺序没变,只是返回的是排序的结果
读童话的狼
2020-03-11