泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。定义:概括地说,泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力,简而言之是在原有的数据集上添加新的数据集,通过训练输出一个合理的结果性
1309_1565582599
2020-08-05
第一种![title](img/python.png)Markdown格式下路径是相对路径,不能是绝对路径。不能改变图形大小第二种from IPython.display import ImageImage(filename = 'G:/workspace/test/python.jpg', width=100, height=60)第三种%%html
1309_1565582599
2020-07-16
make_blobs方法sklearn.datasets.make_blobs(n_samples=100,n_features=2,centers=3, cluster_std=1.0,center_box=(-10.0,10.0),shuffle=True,random_state=None)make_blobs函数是为聚类产生数据集,产生一个数据集和相应的标签n_samples:表示数据样本
1309_1565582599
2020-07-14
在jupyter notebook里先要显示如上图所示的目录需要安装目录插件,具体安装方式如下(在anaconda prompt里运行如下代码):第一步:更新pip python -m pip install --upgrade pip第二步:更新Jupyter pip install --upgrade jupyter第三步:安装 jupyter_contrib_nbextensions pip
1309_1565582599
2020-07-03
指标作为决策者观察数据的窗口,在我们对某个项目进行数据分析时,必须得先了解这个行业所涉及到的指标有哪些。指标分为:业务指标和财务指标财务指标在目前的学习中不会涉及到,可以根据自己的需求自行了解财务的基础知识。业务指标:用汇总值来呈现业务场景的获取:与决策者访谈,看这些指标是怎么来的关注在业务流程业务场景,通用指标:常用的1级指标有:求和,平均,计数,最大值和最小值得来的叫一级指标(在原始数据上直接
1309_1565582599
2020-06-18
指标作为决策者观察数据的窗口,在我们对某个项目进行数据分析时,必须得先了解这个行业所涉及到的指标有哪些。指标分为:业务指标和财务指标财务指标在目前的学习中不会涉及到,可以根据自己的需求自行了解财务的基础知识。业务指标:用汇总值来呈现业务场景的获取:与决策者访谈,看这些指标是怎么来的关注在业务流程业务场景,通用指标:常用的1级指标有:求和,平均,计数,最大值和最小值得来的叫一级指标(在原始数据上直接
1309_1565582599
2020-06-18
(一)DAX表达式概念 (二)DAX表达式练习要求及步骤 (三)具体步骤实现 1.打开PBD--导入数据--DAX表达式练习数据.xlsx 2.主页--转换数据--进入PQ--检查数据类型,提升标题行--关闭并应用 思考:什么样的数据需要将第一行提升为标题行? -->当一个表中所有的字段类型都是b文本型时,PBD会默认将第一行作为标题行,这种情况不需要我们单独操作一次; -->反
1309_1565582599
2020-06-18
1.变量的分类 a 2.影响表连接结果的三个属性:方向性、主附关系、对应关系 3.连接关系的分类 a 判断原则:连接用关键字段里有重复值的叫多表,没有重复值的叫一表 各种连接关系的比较: 多对多(非主键对非主键),重复项下翻倍,得不到汇总结果 一对一(主键对主键),少用(出现频率小),跟业务意义不符 4.表连接本质:维度对度量的汇总。 (1)汇总方式: ①类型1:维度直接汇总度量。
1309_1565582599
2020-06-15
1.变量的分类 a 2.影响表连接结果的三个属性:方向性、主附关系、对应关系 3.连接关系的分类 a 判断原则:连接用关键字段里有重复值的叫多表,没有重复值的叫一表 各种连接关系的比较: 多对多(非主键对非主键),重复项下翻倍,得不到汇总结果 一对一(主键对主键),少用(出现频率小),跟业务意义不符 4.表连接本质:维度对度量的汇总。 (1)汇总方式: ①类型1:维度直接汇总度量。
1309_1565582599
2020-06-15
要求: (一)关联左侧四表 1.打开PBD--主页--获取数据--Excel--到对应文件夹下选择数据 2.数据导入以后,在导航器选中需要用到的4个工作表 3.主页--转换数据--进入PQ--目的是检查数据类型是否发生改变,以及提升标题行 4.在PQ中检查4个表的数据类型,将第一行用作标题 5.完成后点击关闭并应用进入主界面 6.进入模型界面,检查各表的连接关系是否正
1309_1565582599
2020-06-15
1.打开PBD--转换数据--进入PQ 2.主页--新建源--空查询 3.在高级编辑器输入自定义参数 4.在返回的查询中输入任意球队名称--调用 即可得到对应球队的常规赛数据
1309_1565582599
2020-06-15
获取网页信息思维过程 (1)确定要获取信息所在网站 (2)解析网址 (3)明确应使用什么函数爬数 (4)明确所要数据在网址全部数据中的什么位置 (5)创建参数表或自定义函数,批量或灵活爬取所要信息 (一)首先以爬取北京市大气质量为例 1.首先知道要爬网页的网址:http://www.air-level.com/air/beijing/ #蓝色为固定部分,红色为可变部分 2.进入PBD,主
1309_1565582599
2020-06-15
获取网页信息思维过程 (1)确定要获取信息所在网站 (2)解析网址 (3)明确应使用什么函数爬数 (4)明确所要数据在网址全部数据中的什么位置 (5)创建参数表或自定义函数,批量或灵活爬取所要信息 (一)首先以爬取北京市大气质量为例 1.首先知道要爬网页的网址:http://www.air-level.com/air/beijing/ #蓝色为固定部分,红色为可变部分 2.进入PBD,主
1309_1565582599
2020-06-15
一个完整的计算表达式由计算数与运算符两部分组成,例如在计算表达式1 2中,1和2是计 算数而 就是运算符。M函数中运算符的含义有时取决于参与计算的计算数的数据类型,下 边是主要运算符列表,供参考:
1309_1565582599
2020-06-15
(一)M函数相关知识 1.M函数的注释: 单行注释符为// 多行注释符为/*…..*/ 2.M函数基本表达式: let…in…结构: let用于封装计算结果,并为计算结果命名。 in用于显示结果 eg: let 源 = #table( {"客户id","客户名称"}, { {"aa","赵大"},
1309_1565582599
2020-06-14
1.变量的分类 2.影响表连接结果的三个属性:方向性、主附关系、对应关系 3.连接关系的分类 判断原则:连接用关键字段里有重复值的叫多表,没有重复值的叫一表 各种连接关系的比较: 多对多(非主键对非主键),重复项下翻倍,得不到汇总结果 一对一(主键对主键),少用(出现频率小),跟业务意义不符 4.表连接本质:维度对度量的汇总。 (1)汇总方式: ①类型1:维度直接汇总度量。
1309_1565582599
2020-06-11
(一)结构化数据 – 列表 列表是扩在花括号中的一组数据,列表中每个数据都有属于自己的序号以便自己能够被检索到,列表中的数据序号从0开始按照排列顺序依次整数递增,大列表内还可以嵌套子列表、记录等。 花括号除了用来括起列表内的所有数据还用来指定列表内数据的序号,通过指定数据序号可以从列表内找到并获取所需的数据值。 (二)结构化数据 – 记录 记录用来定义字段和给字段赋值,一个
1309_1565582599
2020-06-10