我们为什么要做数据清洗?回答:(1)如果我们想要让数据有效的⽀持我们的⼯作和决策 ,数据必须可靠, 无误,能够准确地反应现实世界的状况。(2) 数据是信息的基础,好的数据质量是各种数据分析如OLAP、数据挖掘 等有效应⽤的基本条件。
-黄纬
2020-09-12
想要得到如下图所示的99乘法表回答:i=1while i<=9: j=1 while j<=i: print("{}*{}={}".format(j,i,j*i),end=" ") j+=1 i+=1 print(" ") #达到换行输出的目的
-黄纬
2020-09-05
# 设置全部行输出from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all"
-黄纬
2020-09-02
(1)基本原理:小概率原理小概率:概率很小小概率事件:发生概率很小的事件小概率原理: 在一次试验中,小概率事件是不可能发生的; 如果发生,我们就认为该事件是假的; 如果真的发生了,我们则认为犯错误了,统计学中把这种错误称为“统计学所犯的错误”
-黄纬
2020-08-29
(1)定义:事先对总体参数或分布形式做出某种假设,然后利用样本信息来判断原假设是否成立;(2)地位:是统计方法(描述性统计和推断性统计)中推断性统计(参数估计和假设检验)的两大方法之一;(3)应用:常用于产品生产中,产品质量的检验等问题上。
-黄纬
2020-08-29
1140 改变系统供电状态的尝试被另一应用程序或驱动程序否决。 1141 系统 BIOS 改变系统供电状态的尝试失败。 1142 试图在一文件上创建超过系统允许数额的链接。 1150 指定程序要求更新的 Windows 版本。 1151 指定程序不是 Windows 或 MS-DOS 程序。 1152 只能启动该指定程序的一个实例。 1153 该指定程序适用于旧的 Windows 版本。 1154
-黄纬
2020-08-23
数据库的增删选查• 查看数据库: show databases;• 创建数据库: create database 数据库名称;命名规则:字符(中文/英文)、数字(不能出现在首位)和_(不能单独使用),不需要加引号• 选择使用数据库: use 数据库名称;• 删除数据库: drop database 数据库名称; 数据库基本结构• 数据库:存储数据的容器, • 表:数据以表的形式存储在数据库中, •
-黄纬
2020-08-19
记录(Record):记录用来定义字段和给字段赋值,一个字段由字段名以及字段内的值组成,字段名是唯一的文本值,是字段的标识符。字段名可以不用引号引用,字段名有两种表达形式:> 不加""的表达形式、例如OrderID> 加#和""的表达形式、例如#"Today's data is:"记录中的内容写在[]括号内, []括号同样用于在记录中取特定字段的值。例1:定义字以及显示记录内所有内容let Sou
-黄纬
2020-08-18
M函数的注释:单行注释符为//多行注释符为/*…..*/M函数基本表达式:let…in…结构:let用于封装计算结果, 并为计算结果命名。in用于显示结果例:letSource = Text.Proper("hello world")inSource解说: 通过let语句将Text.Proper(“hello world”)函数的计算结果封装到名叫Source的变量中, 再通过in语句显示Sour
-黄纬
2020-08-18
数据分析表达式 (DAX) 包括时间智能函数,这些时间智能函数通过使您能够使用时间段(包括日、月、季度和年)对数据进行操作,然后生成和比较针对这些时段的计算,支持商业智能分析的需要。 在 DAX 中提供以下时间智能函数。 时间智能函数的使用可以参照网址:https://docs.microsoft.com/zh-cn/previous-versions/sql/sq
-黄纬
2020-08-14
1、多维数据模型又叫多维数据集、立方体,指的是相互间通过某种联系被关联在一起的不同类别的数据集合 。多维数据模型:在咨询公司以及BI工具厂商的介绍性资料中又被称为“立方体(Cube)”,在这些资料中常以一个立体正方形的形式出现。多维数据集可以从多角度用数据全面映射某业务的实际状况。2、搭建多维数据集搭建方法:1. 明确表与表之间用于匹配的关键字段 2. 在关系图视图
-黄纬
2020-08-12
1、对比类:柱状图、条形图、折线图、雷达图(1)柱形图:反映一段时间内数据的变化,或者不同项目之间的对比。(2)条形图:条形图是显示各个项目之间的对比,其分类轴设置在横轴上。(3)折线图:折线图反映一段时间内,统计内容的变化趋势,往往结合时间维度使用。 (4)雷达图:雷达图反映指定维度下类别间的差异 注:为不影响图表内容的表达,维度控制在10个内,类别控制在4个内( 2个为最佳) 2、构成类:饼
-黄纬
2020-08-08
RFM模型是根据用户历史行为数据,结合业务理解,实现用户分类,助力用户的精准营销。其核心是数据分类。1、RFM作用:帮助企业判断哪些用户有异动,是否有流失的预兆,从而增加相应的运营措施 2、维度选择: (1)最近一次消费(Recency):基于当前时点,统计用户最近一次消费时点和当前时点的时间差 (2)消费频次(Frequenc
-黄纬
2020-08-07
帕累托分析又称为二八法则,即百分之八十的问题是百分之二十的原因造成的。在项目管理中主要用于找出核心问题。主要特点:1、柱形图的数据按数值的降序排列,折线图上的数据有累积百分比数据,并在次坐标轴显示;2、折线图的起点数值为0%,并且位于柱形图第一个柱子的最左下角;3、折线图的第二个点位于柱形图第一个柱子的最右上角 ;4、折线图最后一个点数值为100%,位于整张图形的最右上角 。制作帕累托图:1.确定
-黄纬
2020-08-06
漏斗图由堆积条形图修改而来:1、首先准备数据需要添加辅助列,为了保证图形对称,辅助列数据需要利用原来数据计算得来。2、选中数据选择堆积条形图,修改图表格式3、漏斗图辅助线:在设计选项卡下添加图表元素,选中线条,选择系列线下图为某活动从发券至用券购买各阶段转化情况图表展示
-黄纬
2020-08-06
维度 :公司、部门、个人、月指标:出勤率、加班强度比率、月薪、周末加班费、平时加班费、直接生产人员工资比率、计算规则:1、出勤率(病假不计入出勤) :出勤天数÷规定的月工作日×100% 2、加班强度比率:当月加班时数÷当月总工作时数×100% 3、每日工资=月固定工资/21.75天 4、月基础工资=每日
-黄纬
2020-08-05
1、指标的作用 :结合业务快速定位数据中的核心问题,发现业务强弱点。2、指标的特点:(1)、指标是游离态的,无法单独实现数据统计,如总销售额、总销售量; (2)、需与统计维度结合,明确统计指标的对象,如产品维度下,所有产品的销售额; (3)、指标间可自由组合形成新指标,灵活适应多变的业务环境 3、指
-黄纬
2020-08-05
1、我们在进行图表制作时,需要思考什么样的图表才能清晰的解读数据?图表结论怎样锋利的指向业务问题?图表细节如何调整成想要的样式?2、子弹图:因形似子弹而得名,用于反映各类别的完成情况,如下图各员工销售目标完成情况:
-黄纬
2020-08-04