zengweiak47

7月28日

#特征值筛选(Filter过滤法) --业务上不重要的从已有的指标,再去选一些指标fit.get_support(indices=True)找到留下变量的位置用回归评价分数,percentile保留多少百分比,建议保留70%,f_regression建议留下50%创新变量留下1-2个就不错了第一次删除30%,第二次删除50%表格太大画图sns.heatmap(data53.corr())共线性需要

zengweiak47

2020-07-28

30.9170 3 2
  • 关注作者
  • 收藏

7月27日

#y的缺失在百分十几以上必须要模型填补,超过20%则比较严重#x的缺失在20到50可以容忍,达到50视为缺失严重,缺失达到70-80%则没有必要填补一般模型填补比较准,中位数较为不准,时间不允许,使用中位数模型2天可以跑完,算是可以接受y缺失有点多,使用模型来填模型准确度每提高一个百分点,都是非常可贵.不要小看百分之一.MissForest 无脑选用,随机森林KNNImputer 填充比较慢随机森

zengweiak47

2020-07-27

30.8409 1 0
  • 关注作者
  • 收藏

7月24日

打卡水经验

zengweiak47

2020-07-24

25.9772 4 0
  • 关注作者
  • 收藏

7月22日

data_info = pd.read_clipboard()直接从剪切板读取.map是Series特有的方法.且必须每个函数必须要有返回值#最大显示行数pd.set_option('display.max_rows', 200)# 提取所有浮点型movie.select_dtypes(include='float')

zengweiak47

2020-07-22

36.6480 5 5
  • 关注作者
  • 收藏

7月21日

在pandas中对数据的操作,分两种一种是生成一个副本(视图)(看是否有out输出) 缺点是有点耗费内存还有一种直接在原数据上修改(缺点不安全,但节省内存,速度快)and & 与or | 或not ~ 非

zengweiak47

2020-07-21

25.1982 2 1
  • 关注作者
  • 收藏

7月20日

pandas是基于numpy去进行开发的.numpy数学运算:开发一个算法,写一个算法,做一些数学运算,实现一些公式.每个array只能装一种数据类型传递的数据包含小数和整数,自动转换为小数向上转换(字符串 高于 浮点型 高于 整数)改变数据类型a.astype("需改变的数据类型")矢量,向量:既有大小又有方向的一个变量np.nan为空值(浮点型),np.inf为无穷大random.randn(

zengweiak47

2020-07-20

27.5558 3 2
  • 关注作者
  • 收藏

7月17日

SET集合1.无序的, 可变的, 只有key的字典2.所以集合里面的数据类型要求, 和字典的key相同. 必须是不可变的3.集合里面只能储存 布尔, 数值, 字符串, 元组4.不能有重复值局部变量与全局变量(字符串,数值,元组,不可用在函数中直接修改)在函数外边定义的变量叫做全局变量全局变量能够在所有的函数中进行访问如果在函数中修改全局变量,那么就需要使用global进行声明,否则出错如果全局变量

zengweiak47

2020-07-17

40.8447 2 3
  • 关注作者
  • 收藏

7月14日

打卡水经验,冲鸭!

zengweiak47

2020-07-14

13.5512 2 1
  • 关注作者
  • 收藏

7月10日

打卡水经验冲鸭!

zengweiak47

2020-07-10

24.3340 2 5
  • 关注作者
  • 收藏

7月9日

.二、高等数学(微积分)。1.导数。概念、几何意义。运算。三、高等数学(线性代数)。1.行列式。对角线法则(二阶、三阶)。总公式法(n阶)。性质计算法s降维法(展开法则) +2.矩阵。概念、特殊矩阵+运算。加、减。乘:数乘、矩阵相乘(满足前一个矩阵的行数=后一个矩阵的列数)。除:逆。转置+行列式s分块矩阵小初等变换:交换两行或两列、非零数k乘以某一行或某- - -列、某一行(列)乘以k加到另一行(

zengweiak47

2020-07-09

18.8746 3 4
  • 关注作者
  • 收藏

7月8日

导数导数的几何意义线性代数行列式在n阶行列式副对角线不一定是负号mdeterm excel用行列式的本质是一个数计算方法一:对角线法则(主对角线-副对角线)(就仅适用于2阶,3阶) 计算方法二:计算通式 计算方法三:利用行列式的性质转换计算 计算方法四:展开法则(核心降维)电脑采用计算通式计算矩阵本质是一个数表.矩阵的运算特有运算-- 转置运算,行列式运算

zengweiak47

2020-07-08

21.3220 3 1
  • 关注作者
  • 收藏

7月7日

推断统计1.估计(什么都不知道)2.检验(知道一点但不知是否正确,需要检验)3.预测(我都知道了)参数估计在已知或假定系统模型分布(结构)时,用系统的输入和输出数据计算系统模型参数的过程.一,选定参数二,选定统计量三,抽样分布使用F分布使用大的除与小的事前描述用概率,事后用置信水平.标准差 有标准误差(standard eroor SE预测考80分,实际考了60分,误差20分,涉及到同一个主体)和

zengweiak47

2020-07-07

21.5410 4 3
  • 关注作者
  • 收藏

7月6日

人工智能 = 计算机科学 + 统计学统计学是一门收集,处理,分析,解释数据比从中得出结论的科学.核心:数据.收集数据-处理数据-分析数据-解释数据.描述性分析方法总体规模,对比关系,集中趋势,离散程度,偏态,峰态....推断性分析方法估计,假设检验,列联分析,方差分析,相关分析,回归分析,....数据类型决定方法.数据两种形式:文字和数字区分文字和数字:是否可以运算.将数据按计量尺度不同分1.分类

zengweiak47

2020-07-06

19.8337 4 4
  • 关注作者
  • 收藏

7月2日

今天打卡,冲鸭!

zengweiak47

2020-07-02

21.0019 4 3
  • 关注作者
  • 收藏

7月1日

了解的数据结构5W2H5W(What,why,where,when,who)2H(How to do,How much)ERT系统管理企业内部的系统CRM客户关系管理系统(销售阶段)销售漏斗模型 - 关系型销售业务中最有效的销售方法,他是将销售业务与数据分析完美结合的产物.华为的销售漏斗叫L2C(Leads to Cash)IBM的销售漏斗叫O2C(Opptunity to Close)发现的商机

zengweiak47

2020-07-01

23.1723 3 1
  • 关注作者
  • 收藏

6月30日

进和存是产生成本,销是产生效益的.销直接决定进和存.价格相对透明,只能以服务,精准运营.sku最小产品数.小卖场 2万sku左右中型卖场 4万sku左右大型卖场 8-12万sku左右经销商利润率一般2%-5%.4000sku的经销商基本上需要负责一个二线城市的线下卖场.客单价与运转速度经销商在客单价一定的情况下,倾向于加快运转速度.运转次数应该适中(物流成本,人员成本)销售模式:关系型销售模式 (

zengweiak47

2020-06-30

24.9977 4 1
  • 关注作者
  • 收藏

6月29日

客户价值分析案例PQ:1. 检查数据类型2. 从Orderinfo表中提取小时信息3. 通过合并操作为orderinfo表分别补充不同层级的区域名称信息4. 在orderdetail表中求出产品购买金额建议在数据处理,数据计算,列值计算合并操作都在PQ操作.PQ做的内容,PP也可以使用.PP做的内容,PQ无法使用.餐饮案例优秀的餐饮企业利润率(8%-15%)龙头企业一般的餐饮企业利润率(5%-8%

zengweiak47

2020-06-29

19.5483 5 2
  • 关注作者
  • 收藏

6月28日

mdateadd函数点:1. 可以参照时间点2. 位移量:往前移动一个月3. 返回值的跨度是多长:返回一个月前对应日期的值段:dateadd(日期字段,-1,month)1. 可以参照时间段2. 位移量:前后点各往前移动一个月3. 返回值的跨度是多长:前后点移动后构成的时间段下的汇总值1/1 - 1/17: 空白 1月是起始月,上个月没数所以返回空白2/1- 2/28: 310 返回值是1/1 -

zengweiak47

2020-06-28

24.6545 1 0
  • 关注作者
  • 收藏

6月24日

DAX表达式switch函数只能将准确数字,转换成文字描述.无法进行范围判断.related函数用于连接calculate函数在power BI 下,在条件汇总情况下使用calculate.filter(表,筛选条件)DAX创建的对象有表,度量值,列值.表(不常用)列值(新建列,保存度量值)度量值(规则,主要使用)字段列表前面无图标为文本类型计算机图标为度量值连加符号为数值类型带fx的图标为列值.

zengweiak47

2020-06-24

30.3673 4 2
  • 关注作者
  • 收藏

6月23日

=后面的参数加双引号为文本,不加双引号为名称使用双引号前必须加#好才为字段名去记录中的记录使用中括号加名称调用表分为隐式字段表,显示字段表隐式列表创建的名称要使用引号(用文本值指定),不需要指定数据类型,数据类型靠字段决定显示列表的字段名要用记录来创建表中取值使用的是大括号取表中数据,可以先指定行,再指定列,调换行列也可取值解决信息孤岛问题.多维数据模型与多维数学模型完全不同.主键是一,非主键为多

zengweiak47

2020-06-23

30.3468 3 2
  • 关注作者
  • 收藏

上一页123>