阿抽哥哥

windows10系统下打不开Rstudio问题

问题如图:打开Rstudio后直接报错 解决方法:windows10系统如果打不开Rstudio并报这个错误的话,直接找到Rstudio.exe应用程序,并添加“以管理员身份运行”后即可正常打开Rstudio。

阿抽哥哥

2018-11-30

0.0000 0 2
  • 关注作者
  • 收藏

matplotlib基本误差线

衡量数据误差是科学测量中无比重要的事儿,而在数据可视化异常处理中将数据的误差用图形描绘出来能提供更多的有效信息。 %matplotlib inline import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np plt.style.use('seaborn-whitegrid') # 导入各种包 x

阿抽哥哥

2018-11-29

0.0000 0 2
  • 关注作者
  • 收藏

matplotlib绘图之画散点图

常用的图形除了线形图,还有散点图,这种图形不由线段连接,而是由独立的点、圆圈或其他形状构成。其中可以用plt.plot与plt.scatter两种方法画散点图。 下列为plt.plot绘图 %matplotlib inline import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np plt.style.

阿抽哥哥

2018-11-29

0.0000 0 2
  • 关注作者
  • 收藏

matplotlib绘图之线形图

在所有图形中最简单的便是线形图的可视化了,绘制线形图前需要导入以下命令: %matplotlib inline #在绘图时,将图片内嵌在交互窗口,而不是弹出一个图片窗口 import matplotlib as mpl import matplotlib.pyplot as plt #pyplot是常用的接口 import numpy as np plt.st

阿抽哥哥

2018-11-29

0.0000 0 5
  • 关注作者
  • 收藏

matplotlib绘图之设置图形标签

下面简单介绍matplotlib设置图形标签的方法:图形标题、坐标轴标题、图例。其中plt.title()为设置图形标题,plt.xlabel()与plt.ylabel()分别为设置x轴标题与y轴标题,plt.legend()为创建图例,在函数plt.plot()中设置参数 label为想要的图例即可。下为代码与图: %matplotlib inline import matplotlib as

阿抽哥哥

2018-11-28

0.0000 0 4
  • 关注作者
  • 收藏

matplotlib绘图之坐标轴上下限

虽然matplotlib会自动为图形选择最合适的坐标轴上下限,但有时自定义坐标轴上下限会更好。调整坐标轴上下限最基础的方法时plt.xlim()和plt.ylim(),比如以下对比 %matplotlib inline import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np plt.style.use(

阿抽哥哥

2018-11-28

0.0000 0 2
  • 关注作者
  • 收藏

matplotlib绘图之线条颜色与风格

我们绘图时对图形的第一次调整通常是调整其颜色与风格,plt.plot()函数可以通过相应的参数设置颜色与风格。要修改颜色可以使用color参数,它支持各种颜色的字符串。你也可以使用linestyle调整线条的风格。 %matplotlib inline import matplotlib as mpl import matplotlib.pyplot as plt import numpy as

阿抽哥哥

2018-11-28

0.0000 0 2
  • 关注作者
  • 收藏

DataFrame中对某列数据修改属性失败

问题报错图: 解决办法:首先,使用DataFrame的某列数据时用中括号只能列名,其次,这里不能直接astype的原因是数据中含有字符",",不能直接转成int,改成一下代码即可 data["总金额_美元"].map(lambda x:x.replace(",",""))astype(int)

阿抽哥哥

2018-11-27

0.0000 0 5
  • 关注作者
  • 收藏

Rstudio打开后总是会有警告,如何解决?

Rstudio警告图: 解决方法:根绝路径进入tools-> global options-> packages-> cran mirror,试选一些国内的镜像,并选择稳定的镜像。

阿抽哥哥

2018-11-26

0.0000 0 1
  • 关注作者
  • 收藏

win10系统下shift 右键不能打开命令窗口

win10系统下想通过"shift+右键"打开命令行窗口,以当前的路径打开jupyter notebook,但是没有"在此处打开命令行窗口"的选项,只有"在此处打开Powershell窗口"选项,咋办啊? 解决方法:把下列代码写入记事本并保存为"opencmdhere.reg",文件编码格式为"UCS-2 Little Endian",后打开执行文件。 Windows Registry Ed

阿抽哥哥

2018-11-26

0.0000 0 0
  • 关注作者
  • 收藏

决策树中用graphviz画出的树图怎么看这些参数

如图中所示,这些参数是啥意思啊? 答: meda<=60.5 为true,往左分,gini值=0.48,其中samples表示meda<=60.5的样本数有30566个,class =no purchase是没买,class = purchase是买了(两个分类),其中value = [18337,12229],参数18337表示这30566个样本中没买的个数,12229表示这30566个样本

阿抽哥哥

2018-11-22

0.0000 0 1
  • 关注作者
  • 收藏

scikit-surprise安装失败怎么办

无论使用pip install scikit-surprise 还是 conda install -c conda-forge scikit-surprise 都不能下载scikit-surprise包。 原因:scikit-surprise模块无法安装的原因是系统没有Microsoft Visual C Build Tools,需要先安装Microsoft Visual C Build

阿抽哥哥

2018-11-20

0.0000 0 4
  • 关注作者
  • 收藏

sklearn中随机森林有哪些重要的参数

使模型预测效果更好的特征: n_estimators:随机森林里子树的数量,通常数量越大,效果越好,但是计算时间也会随之增加。 此外要注意,当树的数量超过一个临界值之后,算法的效果并不会很显著地变好。 max_features:分割节点时考虑的特征的随机子集的大小。这个值越低,方差减小得越多,但是偏差的增大也越多。根据经验,回归问题中使用 max_features = n_features,分类问

阿抽哥哥

2018-11-16

0.0000 0 3
  • 关注作者
  • 收藏

sklearn最近邻算法leaf_size的影响

构造时间 leaf_size越大,树的构建时间越快 查询时间 不同的 leaf_size 大小会改变查询成本的优次,当 leaf_size 接近 1 时,遍历节点所涉及的开销大大减慢了查询时间。当 leaf_size 接近训练集的大小,查询本质上变成了暴力搜索(brute force)。在这之间的一个很好的妥协是 leaf_size = 30,这是该参数的默认值。 内存 随着 leaf_siz

阿抽哥哥

2018-11-16

0.0000 0 4
  • 关注作者
  • 收藏

最近邻算法的选择

对于给定数据集,K近邻的最优算法选择(algorithm)取决于多个因素: 样本数量N 和 维度D: brute force 查询时间以O[DN]增长。 ball tree 查询时间大约以O[Dlog(N)]增长。 k-d tree 的查询时间变化是很难精确描述的,对于较小的D(小于20)的成本大约是O[Dlog(N)],并且 k-d tree 更加有效。对于较大的D成本的增加接近O[DN],由于

阿抽哥哥

2018-11-16

0.0000 0 3
  • 关注作者
  • 收藏

sklearn的KNN最近邻算法中algorithm参数是啥

Nearest Neighbor Algorithms 最近邻算法的选择可通过关键字‘algorithm’来控制,其参数有[‘auto’,‘brute’,‘kd_tree’,‘ball_tree’],默认使用‘auto’时算法尝试从训练数据中确定最佳方法。 Brute Force brute forse也称暴力计算, 是最简单的近邻搜索的实现,即数据集中所有成对点之间距离的暴力计算,对于D维度中的

阿抽哥哥

2018-11-16

0.0000 0 6
  • 关注作者
  • 收藏

tensorflow版本号不对

为啥找不到对应的tensorflow版本? 此时对应的Python版本为3.7.0: 方法一:目前tensorflow不支持win7的3.7.x,需要重新安装3.6.x的版本再pip install一下。 方法二:去找一些对应版本的tensorflow,安装其指定版本,例如网站:https://www.lfd.uci.edu/~gohlke/pythonlibs/ ,在里边找到ten

阿抽哥哥

2018-11-09

0.0000 0 3
  • 关注作者
  • 收藏

啥是Scikit-Learn?

问:刚学ML,不太懂sklearn是什么? 答:Python目前有不少实现机器学习算法的程序库,Scikit-Learn(简称:sklearn)是最流行的程序包之一,它为各种常用机器学习算法提供了高效的版本,是简单高效的数据挖掘和数据分析工具。Scikit-Learn建立在NumPy、SciPy以及Matplotlib之上,其干净、统一、管道命令式的API独具特色,内部实现了各种成熟的ML算法,

阿抽哥哥

2018-11-08

0.0000 0 5
  • 关注作者
  • 收藏

准确率与召回率是啥?

对于分类任务,可将样例根据真实类别与学习器预测类别的组合划分为,真正例(True Positive):将正类预测为正类、假正例(False Positive):将正类预测为反类、真反例(True Negative):将反类预测为反类、假反例(False Negative):将反类预测为正类四种情况,见下表: 我们常常使用精确度(accuracy)来度量分类精度,精确度是分类正确的样本数占样本

阿抽哥哥

2018-11-08

0.0000 0 0
  • 关注作者
  • 收藏

if__name__='__main__'怎么用啊?

if__name__='__main__'相当于程序的入口,当 if__name__='__main__' 在一个后缀“.py”的Python文件中, 如果直接执行此“.py”的Python文件,则 if__name__='__main__' 后的代码块将被执行;若此“.py”的Python文件被以模块形式导入,则不执行 if__name__='__main__' 后的代码块。

阿抽哥哥

2018-11-07

0.0000 0 1
  • 关注作者
  • 收藏
1235>