业务理解:业务的背景,业务场景,需要解决的问题,业务目标,需要什么数据数据获取:综合考虑数据获取难度、准确率、覆盖率,如何获取:数据库,爬虫,调查问卷数据预处理: 训练集和测试集划分 数据查看:数据读取,数据的前几行,后几行,shape,缺失值情况,数据类型,统计描述性信息(数值型,类别型) 数据的清洗:删除无效字段,删除缺失值,填充缺失值,删除重复,异常
雯子哦呀呀
2020-08-08
# 设立一个DataFramedf=pd.DataFrame([['1985-04-01',2,3],['1999-01-01',np.nan,5.0],[np.nan,2,3],[1998,2,3]])df# 把第一列的变量类型改为字符串型,再查看DataFrame的类型df[0]=df[0].astype('str')df.info()# 提取出生日期的前4个字符,就是出生年df[0].map
雯子哦呀呀
2020-08-08
附件-->命令提示符-->以管理员身份运行-->输入以下代码:pip install graphviz -i https://pypi.tuna.tsinghua.edu.cn/simple 等待......如果不行就再运行一次
雯子哦呀呀
2020-08-06
✓ 计算已知类别数据集中的点与当前点之间的距离; ✓ 按照距离递增次序排序; ✓ 选取与当前点距离最小的k个点; ✓ 确定前k个点所在类别的出现频率; ✓ 返回前k个点所出现频率最高的类别作为当前点的预测分类
雯子哦呀呀
2020-08-04
机器学习的分类:有监督、无监督、半监督1.有监督学习:特点---训练模型时提供给学习系统训练样本以及样本对应的类别标签, 因此又称为有导师学习。举例子---学生从老师那里获取知识、信息,老师提供对错指示、告知最终答案的学习过程目标---获得泛化能力方法---决策树、支持向量机、监督式神经网络应用---手写文字识别、声音处理、图像处理、垃圾邮件分类与拦截、网页检索、 基因诊断、股票预测等任务---预
雯子哦呀呀
2020-08-04
在默认状态下, 带单位的数字是不可以参与运算的, 像这样, 会报错:单价销量销售额10010瓶#VALUE!但是我们可以先设置销量那一列的单元格格式,让10既带有单位瓶,又可以参与运算: 选中销量的单元格-->右键-->设置单元格格式-->分类:自定义-->类型:0"瓶"-->确定 这里的0是数字的代替 2. 在单元格中输入"10",就会自动变成10瓶,而且又可以做乘法:
雯子哦呀呀
2020-08-03
EXCEL常用函数序号函数类别分序号函数名称用 途1数学1.1SUM(number1,number2,…)计算某个目标区域中单元格里数字的总和1.2ROUND(number,num_digits)设定指定位数,按此位数对目标数字进行四舍五入取整1.3MOD(number,divisor)对目标值除以指定数后的余数,余数的符号和除数相同。1.4INT(number)对目标数字进行舍入处理,处
雯子哦呀呀
2020-08-01
在随便打开的一个ipynb文件中,复制粘贴下面的代码:!pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple会有各种各样的报错,没关系,解决报错的唯一办法就是:多运行几次!!!亲测有效
雯子哦呀呀
2020-07-30
1.条件计数:在一个范围内某个值出现的个数=countif(A1:A10,“a”)2.多条件计数:多个范围内同时符合多个条件的个数=countifs(A1:A10,“a”,B1:B10,“b”)3.单条件求和:满足条件的数值求和例:计算借款金额=sumif(借贷那一列,“借”,金额那一列)4.多条件求和:满足多条件的数值求和例:计算工行借方求和=sumifs(金额区域,借贷区域,“借”,银行名称区
雯子哦呀呀
2020-07-29
1,datafram和array的相互转换dataframe转化成arraydf=df.valuesarray转化成dataframeimport pandas as pddf = pd.DataFrame(df)
雯子哦呀呀
2020-07-27
pip install missingpy -i https://pypi.tuna.tsinghua.edu.cn/simple
雯子哦呀呀
2020-07-27
在电脑右下角找到附件--->命令提示符-->右键,以管理员身份运行1.更新pip:python -m pip install --upgrade pip2.更新jupyter:pip install --upgrade jupyter3.安装 nbextensions:pip install jupyter_contrib_nbextensions4.配置 nbextension:jupyter
雯子哦呀呀
2020-07-26
有时候在安装好Anaconda3后,使用conda命令时依然会出现:C:\Users\dell\PycharmProjects\pytorch>conda list'conda' 不是内部或外部命令,也不是可运行的程序或批处理文件。这样的情况大部分时因为在安装的时候,没有将anaconda命令加入到系统的环境变量中。配置步骤如下:在我的电脑右键-属性-高级系统设置-高级-环境变量中在path中加入
雯子哦呀呀
2020-07-26
生成数组:import numpy as npnp.array([1,2,3])常用数组:全0、全1、全N数组np.zeros((3,3)) #生成全0数组np.zeros_like(arr1) #生成的0数组会和里面的arr1行列数(形状)一样np.full((5,5),5) #5 X 5的全为5 的数组单位数组:np.eye(3) #3 X 3的单位数组np.
雯子哦呀呀
2020-07-24
!pip install pyecharts -i https://pypi.tuna.tsinghua.edu.cn/simple
雯子哦呀呀
2020-07-24
# windows电脑 Matplotlib 支持中文plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus'] = False~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~#mac电脑正常显示中文plt.rcParams['font.family'] = ['Aria
雯子哦呀呀
2020-07-23