数据科学专业问答社区，好文章，一字千金--CDA答疑社区

什么是泛化能力

泛化能力（generalization ability）是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律，对具有同一规律的学习集以外的数据，经过训练的网络也能给出合适的输出，该能力称为泛化能力。定义：概括地说，泛化能力（generalization ability）是指机器学习算法对新鲜样本的适应能力，简而言之是在原有的数据集上添加新的数据集，通过训练输出一个合理的结果性

1309_1565582599

2020-08-05

29.7565 3 5

在Jupyter notebook中插入图片的四种方法

第一种![title](img/python.png)Markdown格式下路径是相对路径，不能是绝对路径。不能改变图形大小第二种from IPython.display import ImageImage(filename = 'G:/workspace/test/python.jpg', width=100, height=60)第三种%%html

1309_1565582599

2020-07-16

20.0127 4 3

make_blobs函数及相应参数简介

make_blobs方法sklearn.datasets.make_blobs(n_samples=100,n_features=2,centers=3, cluster_std=1.0,center_box=(-10.0,10.0),shuffle=True,random_state=None)make_blobs函数是为聚类产生数据集，产生一个数据集和相应的标签n_samples:表示数据样本

1309_1565582599

2020-07-14

13.5415 1 2

监督学习的分类

有监督、无监督、半监督

1309_1565582599

2020-07-14

13.6228 2 0

py中如何安装目录插件

在jupyter notebook里先要显示如上图所示的目录需要安装目录插件，具体安装方式如下（在anaconda prompt里运行如下代码）：第一步：更新pip python -m pip install --upgrade pip第二步：更新Jupyter pip install --upgrade jupyter第三步：安装 jupyter_contrib_nbextensions pip

1309_1565582599

2020-07-03

24.1638 5 1

py中倒序与逆置的区别

py中倒序与逆置的区别：倒序即降序，逆置是将列表中的元素倒过来排列

1309_1565582599

2020-07-02

22.8554 2 1

Power BI常用指标汇总

指标作为决策者观察数据的窗口，在我们对某个项目进行数据分析时，必须得先了解这个行业所涉及到的指标有哪些。指标分为：业务指标和财务指标财务指标在目前的学习中不会涉及到，可以根据自己的需求自行了解财务的基础知识。业务指标：用汇总值来呈现业务场景的获取:与决策者访谈，看这些指标是怎么来的关注在业务流程业务场景，通用指标：常用的1级指标有：求和，平均，计数，最大值和最小值得来的叫一级指标（在原始数据上直接

1309_1565582599

2020-06-18

14.1454 1 3

Power BI 常用指标汇总

指标作为决策者观察数据的窗口，在我们对某个项目进行数据分析时，必须得先了解这个行业所涉及到的指标有哪些。指标分为：业务指标和财务指标财务指标在目前的学习中不会涉及到，可以根据自己的需求自行了解财务的基础知识。业务指标：用汇总值来呈现业务场景的获取:与决策者访谈，看这些指标是怎么来的关注在业务流程业务场景，通用指标：常用的1级指标有：求和，平均，计数，最大值和最小值得来的叫一级指标（在原始数据上直接

1309_1565582599

2020-06-18

14.1454 1 6

新建列与新建度量值的区别

https://mp.weixin.qq.com/s/QbzPGFaLqP2p9ZUvRvX7uQ

1309_1565582599

2020-06-18

14.1454 1 4

Power Pivot 中DAX表达式的练习

（一）DAX表达式概念（二）DAX表达式练习要求及步骤（三）具体步骤实现 1.打开PBD--导入数据--DAX表达式练习数据.xlsx 2.主页--转换数据--进入PQ--检查数据类型，提升标题行--关闭并应用思考：什么样的数据需要将第一行提升为标题行？ -->当一个表中所有的字段类型都是b文本型时，PBD会默认将第一行作为标题行，这种情况不需要我们单独操作一次； -->反

1309_1565582599

2020-06-18

14.1456 2 4

Power BI各表汇总连接规则总结

1.变量的分类 a 2.影响表连接结果的三个属性：方向性、主附关系、对应关系 3.连接关系的分类 a 判断原则：连接用关键字段里有重复值的叫多表，没有重复值的叫一表各种连接关系的比较：多对多（非主键对非主键），重复项下翻倍，得不到汇总结果一对一（主键对主键），少用（出现频率小），跟业务意义不符 4.表连接本质：维度对度量的汇总。（1）汇总方式： ①类型1：维度直接汇总度量。

1309_1565582599

2020-06-15

18.9512 3 2

Power BI 各表汇总连接规则

1.变量的分类 a 2.影响表连接结果的三个属性：方向性、主附关系、对应关系 3.连接关系的分类 a 判断原则：连接用关键字段里有重复值的叫多表，没有重复值的叫一表各种连接关系的比较：多对多（非主键对非主键），重复项下翻倍，得不到汇总结果一对一（主键对主键），少用（出现频率小），跟业务意义不符 4.表连接本质：维度对度量的汇总。（1）汇总方式： ①类型1：维度直接汇总度量。

1309_1565582599

2020-06-15

0.0000 0 0

在power Pivot中创建多维数据透视表

要求：（一）关联左侧四表 1.打开PBD--主页--获取数据--Excel--到对应文件夹下选择数据 2.数据导入以后，在导航器选中需要用到的4个工作表 3.主页--转换数据--进入PQ--目的是检查数据类型是否发生改变，以及提升标题行 4.在PQ中检查4个表的数据类型，将第一行用作标题 5.完成后点击关闭并应用进入主界面 6.进入模型界面，检查各表的连接关系是否正

1309_1565582599

2020-06-15

0.0484 1 4

在Power BI中爬取NBA指定球队名称下的球队常规赛历史数据

1.打开PBD--转换数据--进入PQ 2.主页--新建源--空查询 3.在高级编辑器输入自定义参数 4.在返回的查询中输入任意球队名称--调用即可得到对应球队的常规赛数据

1309_1565582599

2020-06-15

18.6869 2 1

在Power BI中爬取各城市大气质量数据

获取网页信息思维过程（1）确定要获取信息所在网站（2）解析网址（3）明确应使用什么函数爬数（4）明确所要数据在网址全部数据中的什么位置（5）创建参数表或自定义函数，批量或灵活爬取所要信息（一）首先以爬取北京市大气质量为例 1.首先知道要爬网页的网址：http://www.air-level.com/air/beijing/ #蓝色为固定部分，红色为可变部分 2.进入PBD，主

1309_1565582599

2020-06-15

18.6385 1 1

爬取各城市大气质量

获取网页信息思维过程（1）确定要获取信息所在网站（2）解析网址（3）明确应使用什么函数爬数（4）明确所要数据在网址全部数据中的什么位置（5）创建参数表或自定义函数，批量或灵活爬取所要信息（一）首先以爬取北京市大气质量为例 1.首先知道要爬网页的网址：http://www.air-level.com/air/beijing/ #蓝色为固定部分，红色为可变部分 2.进入PBD，主

1309_1565582599

2020-06-15

0.0000 0 0

M函数中一些常用运算符

一个完整的计算表达式由计算数与运算符两部分组成，例如在计算表达式1 2中，1和2是计算数而就是运算符。M函数中运算符的含义有时取决于参与计算的计算数的数据类型，下边是主要运算符列表，供参考：

1309_1565582599

2020-06-15

18.6385 1 1

Power Query基础知识

（一）M函数相关知识 1.M函数的注释：单行注释符为// 多行注释符为/*…..*/ 2.M函数基本表达式： let…in…结构： let用于封装计算结果，并为计算结果命名。 in用于显示结果 eg: let 源 = #table( {"客户id","客户名称"}, { {"aa","赵大"},

1309_1565582599

2020-06-14

62.0891 5 0

Power BI各表汇总连接规则总结

1.变量的分类 2.影响表连接结果的三个属性：方向性、主附关系、对应关系 3.连接关系的分类判断原则：连接用关键字段里有重复值的叫多表，没有重复值的叫一表各种连接关系的比较：多对多（非主键对非主键），重复项下翻倍，得不到汇总结果一对一（主键对主键），少用（出现频率小），跟业务意义不符 4.表连接本质：维度对度量的汇总。（1）汇总方式： ①类型1：维度直接汇总度量。

1309_1565582599

2020-06-11

16.7504 9 1

Power Query中的结构化数据：列表/记录/表（含隐式字段表和显式字段表的区别）

（一）结构化数据 – 列表列表是扩在花括号中的一组数据，列表中每个数据都有属于自己的序号以便自己能够被检索到，列表中的数据序号从0开始按照排列顺序依次整数递增，大列表内还可以嵌套子列表、记录等。花括号除了用来括起列表内的所有数据还用来指定列表内数据的序号，通过指定数据序号可以从列表内找到并获取所需的数据值。（二）结构化数据 – 记录记录用来定义字段和给字段赋值，一个

1309_1565582599

2020-06-10

13.5189 9 6