clbe2x2

推荐Professor Andrew Ng 的coursera机器学习课程

深入浅出了解机器学习

clbe2x2

2020-07-23

25.3185 2 2
  • 关注作者
  • 收藏

算法ols法与梯度下降法、统计法、正则化相比

多元回归中,ols可以处理多个自变量的情况,寻求残差平方和最小化;计算变量的统计量,如均值、标准差、样本量等,依据这些信息就可以直接计算(一元)线性回归的系数;大型的行和列不会写入内存。

clbe2x2

2020-07-22

36.2958 3 2
  • 关注作者
  • 收藏

机器学习简单流程小谈。

大致查看数据,导入数据。查看数据类型,删除无用字段如id,调整y标签位置。查看缺失值,查看缺失值占比,提取空值数据类型,查看数据离散或者连续,根据不同数据类型填充空值。删除重复值。数据编码,包括离散型和连续性数据。使用图表大致查看数据关系。建立模型,大致查看得分,模型调参使用gsearch查找最优解。模型评估与混淆矩阵。

clbe2x2

2020-07-20

27.6695 4 2
  • 关注作者
  • 收藏

ser.fillna(ser.mode()[0])

使用众数填充数据集的时候,注意,众数不唯一,如果直接使用mode()填充很可能导致填充失败,所以要再mode()后加上一个索引[0]

clbe2x2

2020-07-18

104.2395 4 2
  • 关注作者
  • 收藏

如何理解过拟合?

过拟合就是对于训练集中的数据过于详细的学习,导致在测试集中表现得很差。比如在决策树中,利用类似用户id的数据对数据进行学习,导致最后的分类在训练集中表现得非常好,但是实际运用中毫无意义。所以说,适当的修剪树枝对于数据挖掘算法来说也是很重要的。

clbe2x2

2020-07-17

44.8573 4 1
  • 关注作者
  • 收藏

参数模型与非参数模型

在统计学中,参数模型通常假设总体(随机变量)服从某一个分布,该分布由一些参数确定(比如正太分布由均值和方差确定),在此基础上构建的模型称为参数模型;非参数模型对于总体的分布不做任何假设,只是知道总体是一个随机变量,其分布是存在的(分布中也可能存在参数),但是无法知道其分布的形式,更不知道分布的相关参数,只有在给定一些样本的条件下,能够依据非参数统计的方法进行推断。从上述的区别中可以看出,问题中有没

clbe2x2

2020-07-16

19.8803 2 1
  • 关注作者
  • 收藏

收藏 Kmeans迭代的核心思想是

1.保持质心点不变更新类别2.保持类别不变更新质心点

clbe2x2

2020-07-16

19.9112 3 0
  • 关注作者
  • 收藏

对于KMeans来说正确的是

Kmeans是无监督学习,Kmeans是一种不断的迭代的算法,Kmeans会产生中间结果。

clbe2x2

2020-07-16

19.9112 3 1
  • 关注作者
  • 收藏

这..网站是被黑了吗

这..网站是被黑了吗?

clbe2x2

2020-07-14

13.7934 4 6
  • 关注作者
  • 收藏

xind破解版分享,亲测好用。

链接:https://pan.baidu.com/s/1ezoQ0M6IAfbZhqyFjAsobA提取码:mecl虽然免费试用版也不错,但是完整版能够插入图片/插入附件等等,更多内容等你解锁。

clbe2x2

2020-07-12

34.8602 1 2
  • 关注作者
  • 收藏

以下说法是错误的:因为元组是不可变数据类型,所以当一个列表作为元组的元素时, 此时该列表变得不可修改。

当列表作为元祖的元素的时,列表中的元素是可以改变的, 元祖的不可变是指, 该位置所指向的永远是该列表本身, 这个指向是不会改变的。所以是错误的。

clbe2x2

2020-07-07

21.2427 4 1
  • 关注作者
  • 收藏

普华永道--2019.8月行业分析资料

普华永道.png(148KB) 2017至2019年行业分析报告,文件的所有内容全部来自公开渠道,并不涉及版权问题。 分享链接:https://pan.baidu.com/share/init?surl=mxYfotjpLG_zuVBayf1o5g 密码:0gtn

clbe2x2

2020-06-11

16.6172 5 6
  • 关注作者
  • 收藏

分享:SQLzoo一个非常经典纯实操刷题的网站

传送链接:SQLzoo 理论: 实操:★★★★★ 难度:★★★ 推荐:★★★★ 分享来自阿震:一个非常经典纯实操刷题的网站,没什么好说的了,学会了上面的视频就使劲刷。尽量做到举一反三,面试任何公司数据分析师职位sql基本不成问题。当然如果你要做sql开发sql数据库管理员这个就太浅了。 Sqlzoo答案全集:https://https://blog.csdn.net/q370835062/arti

clbe2x2

2020-06-05

15.1654 3 3
  • 关注作者
  • 收藏

分享转发:清华大学-数据挖掘:理论与算法

传送链接:清华大学-数据挖掘:理论与算法 理论:★★★★★ 实操:★ 难度:★★★★ 推荐:★★★ 清华博导的数据挖掘课。都说想去做数据,那什么叫大数据,什么叫数据挖掘。最近很火爆的AI人工智能和数据又是什么关系?如果各位有时间不紧的话建议看完,收获非常大。当然这是个开给清华数学硕士的理论课,对于数学不好的同学会有点困难。

clbe2x2

2020-06-03

18.0475 3 2
  • 关注作者
  • 收藏

帮助你提高学习专注度——专注白噪音

会不会因为周围环境的嘈杂无法集中注意力,带上耳机听音乐又被音乐声所吸引?试试看专注白噪音吧,音频为20~20000赫兹的白噪音能够帮助你过滤掉周围其他环境噪音,稳定平和的声音带你进入一个专注的世界。歌名:Sunrise Comes to the Jungle Nature; White Noise: Standing Fan;White Noise: Standing Fan;White Nois

clbe2x2

2020-05-29

16.7107 3 1
  • 关注作者
  • 收藏

数据分析师分析流程

数据分析的流程,简单来说分为以下六个步骤: 明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题,提供清晰的指引方向。 数据采集。收集原始数据,数据来源可能是丰富多样的,一般有数据库、互联网、市场调查等。具体办法可以通过加入“埋点”代码,或者使用第三方的数据统计工具。 数据处理。对收集到的原始数据进行数据加工,主要包括数据清洗、数据分组、数据检索、数据抽取

clbe2x2

2020-05-29

16.5251 2 3
  • 关注作者
  • 收藏

数据分析常用分析维度

1.对比分析 | 从时间、空间、标准等维度进行对比 明确同比、环比、定基比的概念。同比是指本月第一周和上个月第一周进行对比;环比是指本周和上周进行对比;定基比是指所有数据同今年第一周进行对比。 2.细分分析 逐步分析:比如把某个市进一步拆解为区。 维度交叉分析:比如分析付费SEM的新访客获取渠道和用户所在区域。 3.漏斗分析 分析是否出现不必要的过程,造成转化主进程受到伤害。 是否有泄漏点,通过分

clbe2x2

2020-05-28

16.5295 4 4
  • 关注作者
  • 收藏

分享一个免费获得数据的网站!持续分享中~

https://www.fxbaogao.com/ 包括对行业的研究、企业信息、宏观战略等,是你学习分析思维和拓展自己视野的不错网站。已收录2,049,565篇行业/公司/宏观研究报告。

clbe2x2

2020-05-27

8.7821 3 5
  • 关注作者
  • 收藏