刘思婵

SEMMA范式

e.g. 常见的数据分析路径之一是SAS公司提出的SEMMA范式:1. Sample,数据抽样,保证数据的效度和信度;效度是指数据的准确性,也指选择的数据和分析目标及业务目标是吻合的;信度是指数据的稳定性,要保证样本数据有代表性,且在一定周期内不能有过大的波动(否则模型不稳定);2. Explore,数据特征探索及预处理,e.g. 看数据的分布情况、对数据进行标准化等;3. Modefy,明确问题

38.5549 1 0
  • 关注作者
  • 收藏
liting李

什么是ABC分析法?

ABC分析法是企业管理中一种常见的分析方法,也是一个有效的教练工具。 ABC代表着Action goal(行动目标)、Behavior(行为)、Consequence(后果)。传统分析法或思维模式往往是出现了问题再寻找原因。而ABC分析法的思路是:出现了问题,不寻找原因,而是反过来看后果,后果才是对行为的强化性因素。ABC分析法的使用方法:步骤1:跟进行动目标。行动目标是关键价值链上的关键行为所达

35.2889 1 0
  • 关注作者
  • 收藏
三角函数1

电商和餐饮案例分析思路

电商和餐饮案例分析思路

35.7240 2 0
  • 关注作者
  • 收藏
马敏11

sklearn的train_test_split()各函数参数含义解释(非常全)

在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下:X_train,X_test, y_train, y_test =sklearn.model_selection.train_test_split(train_data,train_target,test_size=0

35.2889 1 0
  • 关注作者
  • 收藏
wangxishi

关于python字符串拆分成列

如图,取数的时候一列里面有字符串,每个字符串是日期+数字格式,一共有3个不同日期分别对应3个数字,想拆分成3列日期和3列数字,请问怎么拆分?原始数据已上传测试数据.xlsx

35.7240 1 5
  • 关注作者
  • 收藏
s1223452840

jupyter notepook写代码tab键为啥不能代码补全?

主要原因是 anaconda版本问题 , anaconda2020 2月的版本会出现这个问题 , 大家可以选择其他版本安装

35.9174 2 0
  • 关注作者
  • 收藏
s1223452840

训练集,测试集,验证集的区别?

一般机器学习我们的数据集可以分为 训练集 和 测试集 : 测试集的数据和训练集数据 严格分开但有时 , 我们也会把训练数据分为 训练集合测试集 , 但是模型会根据测试集数据的反馈调整参数,此时验证集就充当了之前测试集的地位.

38.8713 2 0
  • 关注作者
  • 收藏
三角函数1

python列表问题汇总

python列表问题汇总

47.5998 2 0
  • 关注作者
  • 收藏
s1223452840

pandas生成时间戳范围常用的两种方法?

有时候,我们可能想要生成某个范围内的时间戳。例如,我想要生成 "2018-6-26" 这一天之后的8天时间戳,如何完成呢?我们可以使用 date_range 和bdate_range 来完成时间戳范围的生成。1 pd.date_range()pd.date_range(['start = None','end = None','periods = None','freq = None','tz =

47.5998 2 0
  • 关注作者
  • 收藏
cda讲师号

pandas生成时间戳范围常用的两种方法?

有时候,我们可能想要生成某个范围内的时间戳。例如,我想要生成 "2018-6-26" 这一天之后的8天时间戳,如何完成呢?我们可以使用 date_range 和bdate_range 来完成时间戳范围的生成。1 pd.date_range()pd.date_range(['start = None','end = None','periods = None','freq = None','tz

47.5998 2 0
  • 关注作者
  • 收藏
马敏11

python中统计分析的最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。原理在我们研究两个变量(x,y)之间的相互关系时,通常可以得到一系列成对的数据(x1,y1.x2,y2... xm,y

42.4478 2 0
  • 关注作者
  • 收藏
赵娜0418

实例化如何理解?

从类中具体出的一个对象出来,类的具体化,例如狗这一类,创造出具体的哈士奇,博美,比熊等等,这就是实例化

45.3496 7 0
  • 关注作者
  • 收藏
赵娜0418

安装目录插件的时候无法选择插件选项如何解决?

安装目录插件的时候,有的电脑安装成功后显示上图所示的界面,不能点选插件选项,如果是这样的情况,只需点选下图中的小对勾即可

43.9350 5 0
  • 关注作者
  • 收藏
s1223452840

[*range(1,10,2)] range前面的 * 是什么作用?

* 就是解包的作用, 可以把 range(10) 当做一个压缩包然后*range(10) 就把里面的东西解压出来

42.3741 2 0
  • 关注作者
  • 收藏
s1223452840

怎样能把ipynb文件转换成pdf?

鼠标按file ----> 导出pdf,如下图:

42.3741 2 0
  • 关注作者
  • 收藏
三角函数1

python变量赋值规则汇总

python变量赋值规则汇总

126.6452 5 0
  • 关注作者
  • 收藏
s1223452840

jupyter notebook文件读取报错的原因一般有哪些?

路径问题 : 绝对路径, 相对路径文件格式问题没有读入某些模块,如 pandas可能其他代码正在使用此文件

74.2690 6 0
  • 关注作者
  • 收藏
cda讲师号

jupyter notebook文件读取报错的原因一般有哪些?

路径问题 : 绝对路径, 相对路径文件格式问题没有读入某些模块,如 pandas可能其他代码正在使用此文件

73.8962 3 0
  • 关注作者
  • 收藏
三角函数1

mysql简介

mysql简介

73.8962 3 0
  • 关注作者
  • 收藏
马敏11

Pandas 对DataFrame的缺失值NA值处理4种方法总结

数据清洗是一项复杂且繁琐的工作,有人说一个分析项目80%的时间都是在清洗数据数据清洗的目的有两个,第一是通过清洗让数据可用。第二是让数据变的更适合进行后续的分析工作。换句话说就是有”脏”数据要洗,干净的数据也要洗目录1. 相关函数2. 删除缺失值:dropna函数3. 替换缺失值:fillna函数4. 判断缺失值:isna函数5. 判断缺失值:notna函数1. 相关函数删除缺失值:df.drop

38.0029 5 0
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
ermutuxia
16679.2293
02
赵娜0418
4609.8550
03
LXM21
2332.2255
04
詹惠儿
2266.2293
05
liting李
1853.8097
06
shauna570392
1723.3883
07
809669515
1568.1469
08
zxq997
1294.5294
09
wangjuju123
1053.9269
10
kejiayuan0806
1043.7696
11
291294878
898.3582
12
啊啊啊啊啊吖
829.9862
13
YinXingDeCB
802.6396
14
85691082
792.1677
15
马锦涛
737.4932
16
逐梦的太阳
688.4824
17
9047_1575431266
450.7450
18
你应该是一阵风丫
406.6661
19
阿抽哥哥
393.2401
20
newbbs
369.4609
21
PGC123
354.5935
22
叶yyf
243.2771
23
yw172716
237.5205
24
s1223452840
219.0868
25
有福有德
198.7249
26
wangxishi
185.1553
27
田先生1
178.8732
28
永洪科技
160.8858
29
18192654262
136.4909
30
东方祥
131.0324
31
Jason-童
87.7232
32
CDA-13252713001
87.6608
33
曹翔888
85.9227
34
岳松同学
85.7920
35
诗人都在海底
85.3680
36
Hsail
85.3680
37
宋俊花
75.4509
38
admin
63.7223
39
r1cky
59.8276
40
贾小鱼Nicola
51.8544
41
宁波分校王玉萍
51.8544
42
andrea666
48.7962
43
读童话的狼
47.7625
44
18339955385
43.2788
45
飞呀不死鸟
29.8122
46
k_0711
4.8482
47
仙人掌宝贝
4.1304
48
1027670370
1.2391
49
ceshi777
0.5809
50
bigdata~
0.5463