分箱的原因:1、模型稳定:在一般情况下建立分类模型是,需要对连续变量进行离散化,离散后的特征能够去除噪声,对异常值不再敏感,使得模型可以更加的稳定。2、简化模型:降低样本中的个别信息对模型的影响,降低过拟合的风险。分箱的目的:1、离散特征的增加和减少很容易,易于模型的快速迭代。2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展。3、列表内容离散化后的特征对异常数据有很强的鲁棒性。【离散化后
zhongxn
2020-08-23
分箱的原因:1、模型稳定:在一般情况下建立分类模型是,需要对连续变量进行离散化,离散后的特征能够去除噪声,对异常值不再敏感,使得模型可以更加的稳定。2、简化模型:降低样本中的个别信息对模型的影响,降低过拟合的风险。分箱的目的:1、离散特征的增加和减少很容易,易于模型的快速迭代。2、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展。3、列表内容离散化后的特征对异常数据有很强的鲁棒性。【离散化后
zhongxn
2020-08-23
有序序列:可索引无序序列:不可索引可变序列:能增删改,也就是该对象所指向的内存中的值可以被改变,即地址改变不可变序列:不能增删改,该对象所指向的内存中的值可以被改变,当改变某个元素时,所指向的值不能被改变,相当于把原来的值复制后改变,指向新地址。
zhongxn
2020-07-05
#判断两个数那个大a = 1b = 2if a > b: c = aelse: c = b #简写c = a if a > b else b# 值1 if 条件 else 值2 # 如果条件为真输出 值1, 如果为假 输出值2 。
zhongxn
2020-07-01
假设 HO:一胎的性别对生育二胎无影响 H1:一胎的性别对生育二胎有影响注:从上图可知,总数=30<40,存在0个预期计数<5,所以看费希尔精确检验结果,P值=0.002<0.05,拒绝原假设,故可认为一胎的性别对是否生育二胎有影响。由PHI=0.573可知,一胎的性别与是否生育二胎有较强的相关。操作步骤:step 1:step 2:step 3:step 4:就可得到上面的结果图
zhongxn
2020-06-27
step 1:添加自定义列,提取身份证第十七位数(索引从0开始) step 2:转换为整数 step 3: 找到信息,选偶数,偶数为TRUE,奇数为FALSE step 4: step 5: 将false替换为男 结果
zhongxn
2020-06-16
为更好的展示代码,选择在csdn码字,指路我的csdn博文连接https://blog.csdn.net/weixin_43288829/article/details/106591231 欢迎各位一起交流学习。 注:牛客网的在线编程是基于SQLite的,所以有些地方的语法会与其他的数据库有些许不同之处。
zhongxn
2020-06-06
筛选与拆分组 原数据 step 1: step 2: step 3: step 4: 结果:筛选销售区域可得到该区域所有销售员的销售业绩情况,而不是只出现第一个单元格内的值
zhongxn
2020-06-03
step1:选择适合的图表 step2:调整数据 step3:调整细节 将数据条起始调至从纵坐标开始 若该项目跨月,则根据实际情况可以修改坐标格式中的格式代码、以及间隔单位
zhongxn
2020-05-31
step1:选中数据--插入所有图表--选择饼图--选择字母饼图 step2:右击母饼图中任一一个部分--设置数据点格式--第二绘图区改为3 step3:设置你喜欢的颜色 step4:设置辅助列 step4:右击字母饼图--添加数据标签--设置数据标签格式--后面操作按下图所示
zhongxn
2020-05-31