读童话的狼

ERROR: Invalid requirement:' jupyter contrib nbextensions- ihttps:/ /pypi. douban. com/ simple/"

少了空格,应该是pip install jupyter_contrib_nbextensions -i https://pypi.douban.com/simple/

读童话的狼

2021-03-11

47.6492 1 0
  • 关注作者
  • 收藏

启动内核失败,ImportError:DLL load failed while importing win32api:找不到指定的模块

将Lib\site-packages\pywin32_system32中这两个文件复制到C:\Windows\System32目录下

读童话的狼

2021-03-11

47.6492 1 0
  • 关注作者
  • 收藏

这个代码导入到SQL里面 发现只会倒入鼠标点击执行的一行代码

分号之前是单独一句代码,选中要执行的多行代码,点这个

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

什么时候用哑变量,什么时候用独热编码?

a 哑变量的截距是基准类别的值,哑变量的回归系数表示的是某类别和基准类别之间的平均差异;b 若线性模型有截距项,用哑变量,因为多余的自由度可以被统摄到截距项intercept里去;c 若线性模型有截距项,且使用正则化,用独热编码,因为正则化会约束系数,使各变量地位相等,从而处理多余特征;d 无截距项,使用独热编码e 树模型不建议使用二进制类型的编码,因为会加深树的深度,或者减小节点分裂增益最好是选

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

如果做完onehotencoder后 列名都是0,1,2这样顺序排下去的 怎么能显示是由哪个特征转化来的

使用pd.get_dummies()

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

mysql报错:Error Code: 1064. You have an eror in your SQL syntax

函数名称和括号之间不要有空格

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

mysql报错:Error Code: 1064. You have an eror in your SQL syntax

关键字写错了,应该是load data infile

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

MySQL报错Error Code: 1062. Duplicate entry 7369 for key PRIMARY

导入成功,不需要重复导入

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

在C盘里找不到programdata

这个programdata文件夹默认是隐藏的,可以通过下面方式打开

读童话的狼

2021-03-10

43.8203 1 0
  • 关注作者
  • 收藏

为啥有些文件打开时就自动显示了目录,有些则没有显示呢

有这个情况,目录插件的bug,多打开几次试试

读童话的狼

2021-03-08

66.7322 2 0
  • 关注作者
  • 收藏

pd.read_sas()读取文件,字符型变量前多一个‘b'

python3.x里默认的str是(py2.x里的)unicode, bytes是(py2.x)的str, b”“前缀代表的就是bytes若要正常显示,需要加encoding='unicode_escape'

读童话的狼

2021-03-08

66.7322 2 0
  • 关注作者
  • 收藏

data.loc[:,'I11':'I65']为连续变量,这些列都有缺失值,用每列的平均值填充该列的缺失值

import pandas as pddf=pd.read_sas('fs_6.sas7bdat',encoding='unicode_escape')df1=df.loc[:,'I11':'I65']for i in df1.columns: df[i].fillna(df[i].mean(),inplace=True)

读童话的狼

2021-03-08

66.7322 2 0
  • 关注作者
  • 收藏

照着视频敲的。运行的时候会报这个错误,提示没有normed属性

包更新了,移除了这个属性,换用下面代码即可import matplotlib.mlab as mlabfrom scipy.stats import normmu = 100 # 均值sigma = 15 # 标准差x = mu + sigma * np.random.randn(1000)n, bins, patches = plt.hist(x, 50, density=True)#

读童话的狼

2021-03-08

66.7322 2 0
  • 关注作者
  • 收藏

比如分类问题 拿不同的算法跑完了 选结果最好的那个模型再调优吧

用这个图先大概选一下用什么模型分类问题也是有不同场景的筛选之后,再对可用的模型跑跑看哪个效果好

读童话的狼

2021-03-05

66.6339 1 0
  • 关注作者
  • 收藏

热图看的也是x和y之间的线性相关性吧

即可以看x与y,也可以看x与x,但是x之间是两两之间的,如果多个变量之间的相关关系不一定能体现出来

读童话的狼

2021-03-05

66.6339 1 0
  • 关注作者
  • 收藏

使用什么算法前,需要处理多重共线性,如果需要处理,是先处理相关性之后再处理共线性吗

一般就是回归里边,用到最小二乘法的,直接处理共线性就可以,因为共线性指的就是两个或两个以上变量的高度相关

读童话的狼

2021-03-05

66.6339 1 0
  • 关注作者
  • 收藏

mac怎么安装jupyter的目录

在Terminal里分别运行两个安装命令pip install jupyter_contrib_nbextensions -i https://pypi.douban.com/simple/ jupyter contrib nbextension install --user

读童话的狼

2021-03-04

80.0000 1 0
  • 关注作者
  • 收藏

DataFrame如何进行组内排序

元数据如下:分组排序结果为:

读童话的狼

2021-03-04

80.0000 1 0
  • 关注作者
  • 收藏

中文坐标轴标题无法显示

上面的代码适用Windows,下面的代码适用macWindows电脑就把第一行取消注释,第二行添加上注释重启kernel再运行代码

读童话的狼

2021-03-04

80.0000 1 0
  • 关注作者
  • 收藏

SyntaxError: positional argument fol lows keyword argument

参数赋值应该用等号,双等号表示判断

读童话的狼

2021-03-04

80.0000 1 0
  • 关注作者
  • 收藏
<123458>