赵娜0418

泛化误差的估计有哪些?

泛化误差的估计有哪些? 答:(1)乐观估计(决策树归纳算法简单的选择产生最低训练误差的模型作为最终的模型)(2)悲观误差估计(使用训练误差与模型复杂度罚项的和计算泛化误差)(3)最小描述长度原则(模型编码的开销加上误分类记录编码的开销)(4)估计统计上界(泛化误差可以用训练误差的统计修正来估计,因为泛化误差倾向于比训练误差大,所以统计修正通常是计算训练误差的上界)(4)使用确认集(如2/3的训练集

赵娜0418

2020-02-22

0.7194 2 0
  • 关注作者
  • 收藏

造成过拟合的原因是什么?

造成过拟合的原因是什么? 答:造成原因有:(1)噪声造成的过分拟合(因为它拟合了误标记的训练记录,导致了对检验集中记录的误分类);(2)根据少量训练记录做出分类决策的模型也容易受过分拟合的影响。(由于训练数据缺乏具有代表性的样本,在没有多少训练记录的情况下,学习算法仍然继续细化模型就会产生这样的模型,当决策树的叶节点没有足够的代表性样本时,很可能做出错误的预测)(3)多重比较也可能会导致过分拟合(

赵娜0418

2020-02-22

0.8933 2 3
  • 关注作者
  • 收藏

BBN的特点问题

朴素贝叶斯没有学习的过程,那么是否可以说朴素贝叶斯是消极学习法分类? 答:(1)朴素贝叶斯只是贝叶斯分类的一种实现形式,而实现形式还有贝叶斯网络但是贝叶斯网络是有学习过程的。所以不能说贝叶斯分类时消极学习法。 (2)其实朴素贝叶斯是消极学习方法

赵娜0418

2020-02-22

0.9769 2 0
  • 关注作者
  • 收藏

置信度为95%的置信区间什么意思

置信度为95%的置信区间什么意思? 答:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。   置信区间是总体参数所在的可能范围,95%置信区间就是总体参数在这个范围的可

赵娜0418

2020-02-22

0.9516 2 2
  • 关注作者
  • 收藏

Python中的字符串该怎么截取?

Python中的字符串该怎么截取? 答: str = ‘0123456789’ print str[0:3] #截取第一位到第三位的字符 print str[:] #截取字符串的全部字符 print str[6:] #截取第七个字符到结尾 print str[:-3] #截取从头开始到倒数第三个字符之前 print str[2] #截取第三个字符 print str[-1] #截取倒数第一个字符

赵娜0418

2020-02-21

27.5426 2 1
  • 关注作者
  • 收藏

python如何一次性输入多行字符串?

python如何一次性输入多行字符串? 答:Python 2 的 raw_input()以及 Python 3 的 input()获取的是整行的字符串。 那么对于一行输入多值,例如: 输入为一行,包括用空格分隔的三个整数,分别为 a、b、c 方法一:a, b, c = map(int, raw_input('请输入3个整数, 用空格分隔:').split()) # 如果是Python 3, 自行替

赵娜0418

2020-02-21

0.2698 1 3
  • 关注作者
  • 收藏

Excel中sumproduct函数的用法

Excel中sumproduct函数的用法 答:sumproduct函数共有9中用法 1、简单数组求和 2、单一条件计数 3、比sumifs简单的多条件数据求和 4、比countifs实用的多条件记和 5、综合多参数综合权重排名 6、不同条件下跨列数求和 7、快速拆分数据 8、求排名前几的总销量 9、求总共出仓多少种产品等

赵娜0418

2020-02-21

3.1520 2 3
  • 关注作者
  • 收藏

和操作系统相关的调用有哪些?

和操作系统相关的调用有哪些? 答:和操作系统相关的调用   系统相关的信息模块 import sys sys.argv是一个list,包含所有的命令行参数. sys.stdout sys.stdin sys.stderr 分别表示标准输入输出,错误输出的文件对象. sys.stdin.readline() 从标准输入读一行 sys.stdout.write("a") 屏幕输出a sys.e

赵娜0418

2020-02-21

0.2698 1 4
  • 关注作者
  • 收藏

Python中常用的内置函数有哪些?

Python中常用的内置函数有哪些? 答:1.常用内置函数:(不用import就可以直接使用)   help(obj) 在线帮助, obj可是任何类型   callable(obj) 查看一个obj是不是可以像函数一样调用   repr(obj) 得到obj的表示字符串,可以利用这个字符串eval重建该对象的一个拷贝   eval_r(str) 表示合法的python表达式,返回这个表达式   d

赵娜0418

2020-02-21

0.2698 1 3
  • 关注作者
  • 收藏

Python中range函数的用法

Python中range函数的用法 答:Python提供的range函数可以让for循环从0到10计数,或者从10到100每次递增5。range函数的语法如下: range(start, end, step=1) range会返回一个整数序列,statr为整数序列的起始值,end为整数序列的结束值,在生成的整数序列中,不包含结束值。step为整数序列中递增的步长,默认为1。

赵娜0418

2020-02-21

0.2698 1 6
  • 关注作者
  • 收藏

Python中for循环的用法

Python中for循环的用法 答:Python的for循环语句类似于shell或是脚本语言中的foreach循环,可以迭代序列对象。使用range函数可以让Python的for循环提供类似于传统的for循环功能 1、 使用序列项迭代序列对象 通过for循环可以迭代序列对象的所有成员,并在迭代结束后,自动结束循环,其语法如下: for iter_var in list: 语句块; 其中,iter_

赵娜0418

2020-02-21

0.2698 1 0
  • 关注作者
  • 收藏

Python中merge,join,concat的区别

Python中merge,join,concat区别和用法 答:1、使用merge合并时,两个数据集的合并条件是类型须一致。默认是内连接,也可以按照需求选择outer,left,right等外连接方式 2、合并两个数据集,可在行或者列上合并(用axis调节,默认axis=0) 3、索引上的合并,是增加列而不是增加行,当合并的数据表列名字相同,通过lsuffix='', rsuffix='' 区分相

赵娜0418

2020-02-21

0.2698 1 0
  • 关注作者
  • 收藏

MySQL忘记密码

MySQL忘记密码 答:就按住window键加R,之后输入services.msc,找到Microsoft安装服务,鼠标右击选择启动

赵娜0418

2020-02-21

27.5426 2 1
  • 关注作者
  • 收藏

Python中=和==的区别

Python中=和==的区别 答:他们之间的区别就是代表的含义有所不同。 一个等号代表的含义是赋值,将某一数值赋给某个变量,比如a=3,将3这个数值赋予给a。 两个等号是判断是否相等,返回True或False,比如1==1。他们是相等的,那么就返回true。1==2,他们是不相等的,那么就返回false。

赵娜0418

2020-02-21

27.5426 2 4
  • 关注作者
  • 收藏

order()参数中"C"和"F"有什么区别?

order()参数中"C"和"F"有什么区别? 答:order参数的C和F是numpy中数组元素存储区域的两种排列格式,也就是C语言格式和Fortran语言格式

赵娜0418

2020-02-21

1.3919 2 7
  • 关注作者
  • 收藏

评分卡案例中测试集是否需要按照按训练集的分箱结果进行?

评分卡案例中测试集是否需要按照按训练集的分箱结果进行? 答:测试集不需要做分箱,直接按照训练集的分箱结果来做,因为测试集合数据集有可能分箱的结果不一样,但是模型是根据训练集的分箱结果而来的,所以说数据预处理中训练集做的数据清洗操作要在测试集做相同的操作,直接用WOE的值来进行预测即可

赵娜0418

2020-02-21

1.3919 2 2
  • 关注作者
  • 收藏

SMOTE重采样后是不是各个类都均匀分布?

SMOTE重采样后是不是各个类都均匀分布? 答:SMOTE重采样只针对的是二分类变量,所以0,1就是平均分布,它们就是均衡的,多分类是不能够做重采样的。

赵娜0418

2020-02-21

1.3919 2 3
  • 关注作者
  • 收藏

python在数据列上添加变量名

python在数据列上添加变量名 答:data.columns=['字段名','字段名','字段名','字段名','字段名','字段名','字段名']

赵娜0418

2020-02-20

1.3919 2 1
  • 关注作者
  • 收藏

相关系数与p值检验的关系

如果相关系数的0.1,但是p值检验是0.00001这个说明什么?如果相关系数是0.8,p值检验确实0.5呢? 答:一般来说,相关系数检验是变量与变量之间的相关性,如果你的相关系数是0.8,但是你之前没有剔除,而在做变量筛选的时候,p值检验确实超出0.5的范围,导致当前的特征不显著,这时就应该删除,因为相关系数并不能检验出它是否对模型有影响,但是p检验能计算出它是否对模型有影响,相关系数是0.1,p

赵娜0418

2020-02-20

1.3919 2 0
  • 关注作者
  • 收藏

距离相关系数是用在什么情况?

距离相关系数是用在什么情况呢? 答:文本的相似性 余弦相关系数、斯皮尔曼相关系数

赵娜0418

2020-02-20

1.3919 2 5
  • 关注作者
  • 收藏