赵娜0418

txt文本文档中写好的Python函数或类,保存并修改文件后缀另存为

问:在txt文本文档中写好的Python函数或类,保存并修改文件后缀另存为".py"文件作为模块导入时失败了,为什么?答:写好函数或类需要另存为文件后缀为".py"的Python文件时,一定要注意转码为"UTF-8"格式,否则在导入时会导入失败。

36.8747 3 0
  • 关注作者
  • 收藏
你应该是一阵风丫

KNN中使用Scikit-learn基本建模流程

基本流程:

40.3643 6 0
  • 关注作者
  • 收藏
你应该是一阵风丫

机器学习

机器学习:

40.2556 3 0
  • 关注作者
  • 收藏
赵娜0418

Mac系统无法安装WordCloud

Mac系统字体文件路径不同,需要下载simhei.ftt,具体链接如下。然后修改WordCloud(font_path=指向字体文件所在的路径)http://www.font5.com.cn/font_download.php?id=151&part=1237887120

41.7274 6 0
  • 关注作者
  • 收藏
读童话的狼

one-hot编码与哑变量编码有什么区别?

one-hot的基本思想:将离散型特征的每一种取值都看成一种状态,若你的这一特征中有N个不相同的取值,那么我们就可以将该特征抽象成N种不同的状态,one-hot编码保证了每一个取值只会使得一种状态处于“激活态”,也就是说这N种状态中只有一个状态位值为1,其他状态位都是0。举个例子,假设我们以学历为例,我们想要研究的类别为小学、中学、大学、硕士、博士五种类别,我们使用one-hot对其编码就会得到:

41.6749 3 0
  • 关注作者
  • 收藏
刘思婵

优化

分析的最终目标无非两种:寻找解决方案,寻找更好的解决方案。第一步是保证数据的准确性和稳定性,第二步就是优化,提高准确性、提高效率和效益。优化包含两部分的内容:缩小当前和目标的差距,直到达成并超越目标;在成本或者预算固定的前提下,使收益最大化。 1、缩小当前和目标的差距 e.g. 全公司各部门各业务线的同事们都在追逐和超越KPI的路上;e.g. 机器学习建模时,尝试多种方案,调试各种参数,使模型的精

38.7939 2 0
  • 关注作者
  • 收藏
刘思婵

层级2

5.2自下而上的组合 就是将个体组成群体,将小的指标组合成一个综合指标。e.g. 用户的标签分为基础标签和复合标签,基础标签就是单个用户属性来定义的(例如性别、婚否等),复合标签则是考虑多个基础标签的组合(例如,某个典型的用户群体画像是:女性+单身+白领+一线城市);e.g. 规划用户标签时,先用头脑风暴想出一批指标,然后进行归类、筛选、组合;e.g. 风控业务中累计坏账计提的计算,是将不同的逾期

38.7939 2 0
  • 关注作者
  • 收藏
刘思婵

层级1

要有结构化、系统化的思维,对影响因素自上而下的拆解和自下而上的组合。 5.1自上而下的拆解 可以理解为“分级钻取”,如同金字塔结构一样,先从总体看到二级分支,然后再看更细的分支。e.g. 支付成功率的影响,可以对新老客、订单来源、支付方式、银行通道一层一层拆解,细化各个分支对整体变化的贡献率; e.g. 销售额 = 下单人数*客单价 (a)从登录到下单是层层转化后的,所以下单人数 = 访客人数

38.5549 1 0
  • 关注作者
  • 收藏
刘思婵

延时关联

延时关联现象的产生可能存在延迟效应,要考虑当前现象(环节)的前置的“因”和后置的“果”。e.g. 今天上线的营销方案可能在几天甚至几十天后才会有显著的效应,今天交易量上出现的波动也可能是因为一段时间前产品或者运营策略上有改动。

44.4249 1 0
  • 关注作者
  • 收藏
刘思婵

关联

看数据指标不要只看一个“点”,还要看一条“线”上的前后连接的环节,进而从“面”或“体”的角度去看整个大环境中都有哪些因素相互作用。对现象的分析可以参考简单的调节模型: 其中:X是自变量,Y是因变量,M是调节变量。寻找关联关系时,不仅仅要找出对Y有直接影响的X(一个或者多个),还要找出影响X对Y作用的调节因素M。 关联也可以分为同时关联和延时关联两类。 4.1同时关联 即多个因素(X)同时发生作用

0.0000 0 0
  • 关注作者
  • 收藏
刘思婵

纵向对比

纵向对比 横向是和其他对象比较,纵向则是和自己的历史数据对比。常见的纵向对比有同比和环比,对比的周期根据实际情况可以按日、周、月、季、年等。 注:一个常用的多组对比柱状图 对比的时候,除了比较相对量,也要看绝对量,以合理地评估数据差异的大小。e.g. 0.5%的波动是大还是小,需要找参考点,如果历史波动最高也就0.1%,那么这个波动就很大。e.g. 公众号关注人数昨日环比增长20%(看着还不错),

44.4249 1 0
  • 关注作者
  • 收藏
刘思婵

横向对比

和同类(竞品)比较,e.g. 对比不同品牌的女装的销售情况,不同销售渠道(地区)的交易情况;实验对比,设置实验组和对比组,对比两组或多组之间的差异,以确定人为干预(实验、方案)的效应。e.g. 比较不同的产品或运营方案的效果差异时,常采用AB Test,需要确保对比的两组或者多组在数量和结构上要具有可比性(e.g. 用户的来源、等级等需要匹配);和整体比较,e.g. 华东地区的销售情况和全国总体销

44.4249 1 0
  • 关注作者
  • 收藏
刘思婵

对比

“痛苦来自比较之中”(没有比较就没有伤害),其实幸福也来自比较之中,痛苦还是幸福,取决于选择的参照点是高于还是低于你。对比就是找一个参照点,来发现两个数据间的差异量Δ大小如何。对比可以分为两类:横向对比、纵向对比。

38.5549 1 0
  • 关注作者
  • 收藏
刘思婵

分类

互联网时代最核心的经营理念是深耕客群,通过差异化运营提升ARPU值(Average Revenue Per User,每用户平均收入),而分类无疑是开展这项工作的重要前提。主要有4种分类方法:二分法,非此即彼,e.g. 网站新客、老客,贷款审批结果分为通过申请、拒绝申请等;并列分类,多个分类(子集)构成一个全集,e.g. 用户地域可以按省份划分,按年龄可以将用户分为70后、80后、90后、00后等

0.0000 0 0
  • 关注作者
  • 收藏
刘思婵

闭环迭代

一般的闭环流程包括3部分:事前方案规划,事中执行监控,事后复盘总结。e.g. 营销活动事前:确定目标,选定用户,制定方案,确定检验标准等;事中:实时数据监控(是否达到预期),不同方案赛马,备用方案启用等;事后:对整个流程复盘,总结经验,CSS归类(Continue做先前已验证的正确的事,Stop做错误的事,Start做新的正确的事)常用的闭环迭代框架是PDCA,通过计划(P)、实施(D)、检查(C

0.0000 0 0
  • 关注作者
  • 收藏
刘思婵

分步转化

分步转化要连续完成多个步骤,有的人“浅尝辄止”,有的人“半途而废”,有的人则是“善始善终”。产品转化的每个步骤都会有用户流失,好比100个人参加有9个关卡的淘汰游戏,每个关卡会淘汰10个人,整个游戏最终会剩下10个获胜者,把这个游戏看作产品,那么该产品的全流程转化率就是10%(游戏获胜率)。 e.g. 常见的电商流程如下:注册-->登录-->浏览商品-->加购物车-->支付-->售后将上述步骤整理

0.0000 0 0
  • 关注作者
  • 收藏
刘思婵

CRISP-DM

1. 商业理解:确定业务目标,评估现有资源,确定分析目标,制定解决方案;2. 数据理解:数据采集,探索分析,数据质量验证;3. 数据准备:筛选数据,数据清洗,整合数据,变量衍生;4. 建立模型:模型选择,检验设计,模型建立,结果评估;5. 模型评估:分析结果和业务目标匹配度确认,检查1-4步的执行过程,确定下一步行动;6. 结果部署:规划部署方案、监控和维护方案,输出项目报告,项目复盘;e.g.

38.5549 1 0
  • 关注作者
  • 收藏
刘思婵

SEMMA范式

e.g. 常见的数据分析路径之一是SAS公司提出的SEMMA范式:1. Sample,数据抽样,保证数据的效度和信度;效度是指数据的准确性,也指选择的数据和分析目标及业务目标是吻合的;信度是指数据的稳定性,要保证样本数据有代表性,且在一定周期内不能有过大的波动(否则模型不稳定);2. Explore,数据特征探索及预处理,e.g. 看数据的分布情况、对数据进行标准化等;3. Modefy,明确问题

38.5549 1 0
  • 关注作者
  • 收藏
liting李

什么是ABC分析法?

ABC分析法是企业管理中一种常见的分析方法,也是一个有效的教练工具。 ABC代表着Action goal(行动目标)、Behavior(行为)、Consequence(后果)。传统分析法或思维模式往往是出现了问题再寻找原因。而ABC分析法的思路是:出现了问题,不寻找原因,而是反过来看后果,后果才是对行为的强化性因素。ABC分析法的使用方法:步骤1:跟进行动目标。行动目标是关键价值链上的关键行为所达

35.2889 1 0
  • 关注作者
  • 收藏
三角函数1

电商和餐饮案例分析思路

电商和餐饮案例分析思路

35.7240 2 0
  • 关注作者
  • 收藏
123299>

热门用户 换一批

本月PGC排行 换一批

01
ermutuxia
15619.8283
02
詹惠儿
3994.1802
03
liting李
3878.1320
04
开花结果02
2828.8315
05
LXM21
2466.5649
06
shauna570392
1925.8413
07
s1223452840
1693.2503
08
赵娜0418
1467.4869
09
读童话的狼
1240.7391
10
18192654262
596.2669
11
宋俊花
417.7947
12
bigdata~
416.5680
13
wangxishi
410.9150
14
隋东芝
389.3198
15
马锦涛
378.6177
16
你应该是一阵风丫
362.0340
17
永洪科技
326.7076
18
zhxiaol
322.0296
19
我是大魔王哈哈
307.7717
20
85691082
291.5308
21
梁程晴
244.7252
22
东方祥
237.4341
23
PanHero_龙宝宝
231.9958
24
陈yy123
222.3672
25
曹翔888
193.1606
26
gracejpw1117
174.8793
27
1530553748
167.2216
28
Zxmzxm11
165.2367
29
ALEXSONG_JY
162.4142
30
-黄纬
155.5404
31
WXlJ1l5
151.5480
32
叶yyf
150.4722
33
13285917268
118.0985
34
田先生1
109.0227
35
admin
101.5527
36
k_0711
100.6867
37
hunter.Z
100.4091
38
fuli2020
97.3386
39
M15828292569
72.9557
40
cda讲师号
72.8814
41
PGC123
72.3793
42
小朱520
63.2051
43
aralexu
62.1749
44
觉得是快乐
53.9994
45
291294878
43.9832
46
jojogigi
42.2674
47
liujie01-09
42.1503
48
zzfcda
41.2856
49
姚慧扬
40.3583
50
Zzyh12
39.8657