Aran刘跃然

Python数据可视化精简笔记

一、使用 matplotlib 包:1.import matplotlib as plt2.#查看都有什么风格plt.style.available#设置风格plt.style.use("seaborn")3.# windows电脑 Matplotlib 支持中文plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicod

Aran刘跃然

2020-08-14

47.5818 2 2
  • 关注作者
  • 收藏

Pandas数据处理精简笔记

(win,grade为例表)一、文本数据处理:1.str.2.常用:len 字符长度lower 转换成小写upper 转换成大写islower 判断是否小写isupper 判断是否大写find 查找count 统计个数strip 去除两边split 分裂replace 替换3.替换:wine.商品名称.str.replace('ml',"ML")4.查找:contains 包含 : 判断字符串中是

Aran刘跃然

2020-08-12

22.3108 3 2
  • 关注作者
  • 收藏

Pandas-描述统计精简笔记

(grade为例表)1.查看基本统计值:grade.describe(percentiles=None, include=None, exclude=None)2.每个值出现的次数:imdb.genre.value_counts()3.等距分箱:等分:pd.cut(grade.数学,4,labels=["差","中","良","优秀"])自定义:grade['数学等级'] = pd.cut(gra

Aran刘跃然

2020-08-12

22.3108 4 1
  • 关注作者
  • 收藏

Pandas精简笔记

Pandas:-Series:一、操作:1.Series:带有名称和索引的一维数组。2.构建:pd.Series(data) / pd.Series(data ,name=' ' , index= ['']) data.index.name = ""3.提取:s.name # 提取名称s.index # 提取 索引s.values # 提取 值s.dtype # 提取 数

Aran刘跃然

2020-08-11

34.9110 3 3
  • 关注作者
  • 收藏

Numpy精简笔记

Numpy:一、是什么:1.Numpy 的核心是 ndarray ( n-dimension-array )对象,这个对象封装了同质数据类型的n维数组。2.ndarray:只能有一种数据类型,而且每个元素占用内存空间大小相同。3.转化为np.array(object, dtype=None):np.array(),自动服从向上转化原则(整数<小数<字符串),也可以规定dtype强制转化。4.查看数

Aran刘跃然

2020-08-10

34.4450 4 2
  • 关注作者
  • 收藏

“import this” ——‘’python 之禅‘’

The Zen of Python, by Tim PetersBeautiful is better than ugly.Explicit is better than implicit.Simple is better than complex.Complex is better than complicated.Flat is better than nested.Sparse is bet

Aran刘跃然

2020-08-07

32.3851 4 2
  • 关注作者
  • 收藏

python常见异常(收藏查找)

BaseException所有异常的基类SystemExit解释器请求退出KeyboardInterrupt用户中断执行(通常是输入^C)Exception常规错误的基类StopIteration迭代器没有更多的值GeneratorExit生成器(generator)发生异常来通知退出StandardError所有的内建标准异常的基类ArithmeticError所有数值计算错误的基类Floati

Aran刘跃然

2020-08-06

22.6115 3 4
  • 关注作者
  • 收藏

统计学精简笔记(常用分析方法)

一、列联分析(用于分析定性数据对定性数据的影响)(本质上是比较不同总体的比例是否有差异)(一)原理与步骤:1.提出假设:H0:没有差异,没有影响;H1:有差异,有影响2.构造边缘分布表3.计算期望频数4.构造χ2分布,比较实际频数与期望频数,自由度:(行数-1)(列数-1)5.查临界值,得出结论(二)相关测量1. φ相关系数二、方差分析(用于分析定性数据对定量数据的影响)(本质上是比较不同总体的均

Aran刘跃然

2020-07-30

30.6626 3 0
  • 关注作者
  • 收藏

统计学精简笔记(推断性统计)

估计:总体参数未知检验:总体参数已知但不知其是否正确预测:总体参数确定去预测未来(也可认为是估计的一种)一、估计1.证明:经验法则与切比雪夫不等式证明了均值、比例、标准差包含了一组数据的大部分主要信息,并且可以用这些信息进行总体估计的可能性。2..分类:已参数估计为基础,衍生出非参数估计与半参数估计,共三种估计方法。3.步骤:选定参数-选定统计量-抽样分布-估计(一)选定参数——确定需要估计的参数

Aran刘跃然

2020-07-27

51.4883 4 2
  • 关注作者
  • 收藏

统计学精简笔记(描述性统计)

一、数据:高级数据可转化为低级数据(定量数据可转化为定性数据),推出一个重要规律:一个重要的规律:低级数据的方法高级数据可以用,但高级数据的 方法低级数据不可以用二、描述统计:(五个角度分析) 1.总体规模的描述——总量指标 • 按内容分:单位总量指标(人、物、…)、标志总量指标 (营业额、利润、…) • 按时间不同分:时期指标、时点指标• 按计量不同分:实物指标、价值指标、劳动量指标2..对比关

Aran刘跃然

2020-07-24

26.0788 5 3
  • 关注作者
  • 收藏

使用DAX函数创建日期表(通用代码,可收藏保存)

前言:在使用时间智能函数时,除了在PQ中创建日期表,也可以在PP中直接创建日期表,这也是我推荐的方式,因为只需要两个步骤:1.新建表;2.复制一段DAX公式。日期表DAX公式如下:日期表 = ADDCOLUMNS( CALENDAR(date(2020,1,1),date(2020,12,31)),

Aran刘跃然

2020-07-19

27.5996 3 2
  • 关注作者
  • 收藏

Power BI电商案例

电商黄金公式: 销售额 = 流量 * 转化率 * 客单价流量数量重要指标: • 访客数(UV):到达店铺页面的非重复用户数 • 浏览量(PV):店铺内浏览和查看页面的累加次数 • 访问次数(Visits):一个会话内被用户连续访问的次数 • 新访客数: 新进访客数分析:1.UV高PV低:新用户:投放失败,非目标用户老用户:产品可能有问题2.UV低PV高:新用户:引流渠道触达率低或产品市场需求低;渠

Aran刘跃然

2020-07-17

28.3596 3 3
  • 关注作者
  • 收藏

DAX时间智能函数

时间智能函数:1.TOTALMTD、TOTALQTD 、TOTALYTD :选取时间点2.PREVIOUSDAY PREVIOUSMONTH PREVIOUSQUARTER PREVIOUSYEAR :选取时间点,返回时间段的值3.DATEADD:当选取时间点时,返回ADD后的时间点的值;当选取时间段时,返回两个时间节点ADD后之间的累计值。(当选取时间点为当月最后一天时,返回ADD后月份最后一天

Aran刘跃然

2020-07-15

13.5855 2 1
  • 关注作者
  • 收藏

常用M函数介绍(附件)

有需要可以收藏一个。常用M函数语法介绍.pdf

Aran刘跃然

2020-07-14

13.9022 5 0
  • 关注作者
  • 收藏

汇总逻辑梳理(1)

业务知识>分析方法 >工具使用业务知识:1.指标和指标体系2.模型和分析方法3.流程和行为BI分析:战略战术:1.改善业务流程;2.优化业务行为。 (经验驱动,数据驱动)一、通用指标体系:一级指标:求和、平均、技术、最大最小值二级指标:(比较用的指标)基准比:实际值/基准值,EG考试水平均比:实际值/总平均值,EG产品平均水平标准比:实际值/标准值,EG车间工人绩效目标比:实

Aran刘跃然

2020-07-14

13.6618 3 5
  • 关注作者
  • 收藏

power pivot汇总方式解析

Power Pivot表链接分析:1.一对一(主键对主键):最不可能出现2.一对多(主键对非主键):一表出维度,多表出度量3.多对多(非主键对非主键):无法进行统计,不会用TIPS:主键表为主表,非主键表为副表;以度量表(多表)去寻找维度表(一表)。筛选器方向:筛选:维度汇总度量的能力交叉链接只有一条路径有效,其他路径失效如何正确选择汇总方式:连接方式T1(一表出维度,多表出度量):维度下对度量进

Aran刘跃然

2020-07-14

13.5512 2 2
  • 关注作者
  • 收藏

数据分析表达式 (DAX) 概述

数据分析表达式 (DAX) 语言是一种公式语言,允许用户在 PowerPivot 表(“计算列”)和 Excel 数据透视表(“度量值”)中定义自定义计算。 DAX 包含一些在 Excel 公式中使用的函数,此外还包含其他设计用于处理关系数据和执行动态聚合的函数。本部分解释以下概念:DAX 公式的使用位置如何创建 DAX 公式通过 DAX 可以执行的操作类型DAX 公式概述DAX 公式与 Exce

Aran刘跃然

2020-07-14

13.5415 1 3
  • 关注作者
  • 收藏

Power Query(核心理解:结构化数据)

没有字段名但有多行值——列表;有字段名但只有一行值——记录;既有字段名,又有多行值——表;表用字段名和多行值进行定义,其中多行值均用二维列表创建(不管几行值,哪怕只有一行,也是用二维列表创建),字段名可用列表(隐式)或者记录(显示)创建;以“,”进行分割,前面为字段名,后面为多行值。

Aran刘跃然

2020-07-13

13.6509 4 1
  • 关注作者
  • 收藏

SQL进阶练习school题型解题分析(个人总结)

同一个表中的数据进行比较:连接+筛选表中包含某个条件的集合:拼接+筛选最大值:+MAX函数同时满足包含两个条件:拼接+筛选+集合判断一维转二维:分类扫描+SUM百分比:拼接+分组+AVG排名:开窗 dense_rank() over()前几名:7的基础上加where

Aran刘跃然

2020-07-09

18.6814 4 3
  • 关注作者
  • 收藏

sql执行顺序及性能优化(重点推荐)

前言:一定程度地理解SQL的执行顺序可以帮助我们更好地掌握和理解SQL,知道其运行原理建立心理表征后,不仅对语句书写大有裨益,而且在实际工作中能帮助我们提高提取效率。对于我们初学者而言,本篇分析毕比较到位,让我收获良多,重点推荐给大家。sql语句的执行步骤: 1)语法分析,分析语句的语法是否符合规范,衡量语句中各表达式的意义。 2)语义分析,检查

Aran刘跃然

2020-07-07

19.6871 6 1
  • 关注作者
  • 收藏
12>