宋俊花

Numpy 和Pandas 在读取txt 文件时的不同

读取逗号分割的txt 文件,原文件显示如下:用numpy 读取结果如下:你会发现第一列数据M,F全变成了nan而用pandas读取格式完美,内容不会出错,而且pandas速度还快。Numpy这个问题要解决,只能加dtype参数,因为它默认都是以float格式读取

0.0000 0 0
  • 关注作者
  • 收藏
gracejpw1117

pandas操作excel中各列内容:合并、拆列、去重、日期格式转换等

import pandas as pddf=pd.read_excel(r'D:\CDA\CDA_PGC\datas.xlsx',sheetname='Sheet1')df['日期']=df['日期'].dt.date #去掉‘时分秒’(从excel导入的日期数据默认00:00:00)df['合并列']=df['编号'].map(str)+','+df['日期'].map(str) #将panda

30.9477 1 0
  • 关注作者
  • 收藏
gracejpw1117

python筛选excel中各列内容均相同的数据中的日期格式处理

In [19]:import pandas as pddf=pd.read_excel(r'D:\CDA\CDA_PGC\datas.xlsx',sheetname='Sheet1')dfOut[19]:编号日期01232020-09-0911232020-09-0823452020-09-0933452020-09-0843452020-09-0951232020-09-09In [20]:df

30.9477 1 0
  • 关注作者
  • 收藏
bigdata~

逻辑回归与SVM的区别

第一,本质上是其loss function不同。不同的loss function代表了不同的假设前提,也就代表了不同的分类原理,也就代表了一切!!!简单来说,逻辑回归方法基于概率理论,假设样本为1的概率可以用sigmoid函数来表示,然后通过极大似然估计的方法估计出参数的值,支持向量机基于几何间隔最大化原理,认为存在最大几何间隔的分类面为最优分类面,第二,支持向量机只考虑局部的边界线附近的点,而逻

30.9477 1 0
  • 关注作者
  • 收藏
bigdata~

线性SVM推导及求解

目标:找到分类间隔最大的超平面,优化对象,优化决策面两个约束条件:决策面能够把正负样本分开;分类的间隔(所有的样本点最小的间隔,最小的间隔最大化,点是支持向量上的点)第一个约束条件融合到一个不等式中,第二个条件推出w的平方最小求解过程: 1.引入拉格朗日函数,把约束条件融合进目标函数,把有约束条件的最优化问题转化为无约束条件的最优化问题 2.利用拉格朗日函数对偶(需要满足KKT条件) 3.

31.0354 2 0
  • 关注作者
  • 收藏
LXM21

excel怎么用条件把区域内每行数的最小值突出颜色

问题:怎么用条件把区域内每行数的最小值突出颜色回答:方法一:如图:=H8是因为每个单元格要跟它求出的每行的最小值判断一下,是最小值,就突出显示格式;首行首单元格,是因为从第一个单元格开始判断方法二:条件格式 =A1=MIN(IF($A1:$H1=0,9^9,$A1:$H1))在单元格中该公式的计算步骤第一步先运算了A1:H1单元格的值是不是等于0 ,返回了一串逻辑值true和fales第二步,计

0.0000 0 0
  • 关注作者
  • 收藏
LXM21

mysql中的float(m,d)数据类型

问题:如果float(8,4),显示一般是1234.5678,但是如果实际写入数字是123,最终会显示成123.0000还是0123.0000?回答:123float(m,d)-m表示的是最大长度,d表示的显示的小数位数。1.小数位超过设定值,按四舍五入保存2.小数位如果都是0,则不保存小数位

0.0000 0 0
  • 关注作者
  • 收藏
詹惠儿

powerBI打开文件时显示版本不兼容错误,怎么解决?

问:powerBI打开文件时显示版本不兼容错误,怎么解决?答:这是因为打开的BI文件版本高于电脑当前安装的powerBI desktop版本,此时点击提示框右上角的‘X’关闭提示即可正常打开,注意不是点击‘关闭’。

0.0769 1 0
  • 关注作者
  • 收藏
詹惠儿

powerBI中的切片器视图如何修改显示的字段名?

问:powerBI中的切片器视图如何修改显示的字段名?如下图所示,想把‘新增用户类别’改成‘用户分类’答:操作方法如下:选中该切片器视图,在【格式】选项卡中,将【切片器标头】关闭将【标题】选项打开,并在【标题文本】中填上【客户分类】即可。

0.0769 1 0
  • 关注作者
  • 收藏
詹惠儿

excel如何根据固定位置来自动填充

问:这个怎么可以让它每逢10自动重新算答:可以通过借助辅助列和if函数实现,具体步骤如下:添加辅助列,在G1单元格输入10,在G2单元格输入公式:=IF($F2=10,10,$G1+10),回车,然后把鼠标放在该单元格右下角,直至鼠标符号变成+,双击进行填充即可。

0.0769 1 0
  • 关注作者
  • 收藏
詹惠儿

电商项目中为啥单纯找拜耳市场增长点的时候显示的是灭鼠的主要产品,而到达分析竞争市场的时候却是蟑螂

问:电商项目中为啥单纯找拜耳市场增长点的时候显示的是灭鼠的主要产品,而到达分析竞争市场的时候却是蟑螂答:拜耳的主营产品是灭蟑灭蚁,第一个截图中的饼图分析的是整个市场的类别分类,而不是拜耳公司的,一级市场中灭鼠驱虫占比较大,其细分市场中灭鼠产品占比较大。

0.0769 1 0
  • 关注作者
  • 收藏
詹惠儿

mysql表连接实现为什么设置表别名不管用

问:mysql表连接实现为什么设置表别名不管用答:这是因为max函数用法不对,max函数作为数据显示的形式,并不是一个字段,不能放在表.后面,表.后需要接字段名

0.0769 1 0
  • 关注作者
  • 收藏
詹惠儿

python导入第三方时的from和import有什么区别?

问:有些资料的代码是下图这样,什么时候用from,什么时候用import呢?两者有什么区别?答:from pandas as pd 这种用法是错误的,一般是import 模块 或者 from 模块 import 某个函数或方法,第一个是调用整个模块,使用该模块下的函数时需要在函数前加模块前缀,也就是:模块.函数,第二个是仅调用模块下的某个函数,使用该函数时可以直接用函数名,也就是:函数()

0.0769 1 0
  • 关注作者
  • 收藏
詹惠儿

mysql导入数据报错:Error Code 1290

问:mysql导入数据报错:Error Code 1290. The MySQL server is running with the --secure-file-priv option so it cannot execute this statement答:这是因为mysql8.0对数据导入导出加了安全限制,解决方法是:执行命令 show variables like '%secure%';

0.0000 0 0
  • 关注作者
  • 收藏
詹惠儿

python报错:graphviz.backend.ExecutableNotFound: failed to execute ['dot', '-Tpng', '-O', 't est.gv']

问:python绘制决策树图时出现报错:graphviz.backend.ExecutableNotFound: failed to execute ['dot', '-Tpng', '-O', 't est.gv']答:python绘制决策树图除了需要安装graphviz包,还进行环境配置后才能调用,具体方法如下:找到 控制面板——》系统——》高级系统设置——》系统属性——》高级——》环境变量—

0.0000 0 0
  • 关注作者
  • 收藏
开花结果02

powerbi安装好以后,打开时报错

问题:powerbi安装好以后,启动报错:出了点问题 调用的目标出现了异常解答:解决方法:1、回到桌面,鼠标左击开始,点击运行;2、在运行输入框内输入regedit,按回车键打开注册表;3、在注册表中找到HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Lsa项;4、点击Lsa项,点击下方跳出的FipsAlgorithmPolicy项,右侧表内

0.0000 0 0
  • 关注作者
  • 收藏
开花结果02

如何激活office

问题:如何激活office解答:1.运行注册机软件2、点下图所示按钮3、运行完毕后检查excel是否激活成功,若未激活检查有没开防火墙或安全文件,并将该软件多运行几次。

0.0000 0 0
  • 关注作者
  • 收藏
开花结果02

powerbi :度量值和列值有什么区别

问题:度量值和列值有什么区别度量值就是汇总值,列值是返回一列的值1.针对某个字段每一行进行的操作叫做列值,这时候就需要选择主页选项卡下的新建列比如:将赢单率的级别用文字来表示成高中低,这就是对每一行进行操作,返回一列多行的值2针对所有字段 所有行 创建统一的汇总规则 叫做度量值,这个不会在表中直接返回值,需要将字段引用,才会有结果。通过调整左侧的主表里面的表名,可以决定将这个度量值建立在哪个表下面

0.0000 0 0
  • 关注作者
  • 收藏
wangxishi

python对两列数据进行处理

想用python查找出两列分别相同的值,怎么操作呢,如图:

30.9477 1 8
  • 关注作者
  • 收藏
小朱520

数据清洗的一些小技巧

批量读取数据防止中文乱码的现象类似于.format文本处理中的去除非中英文字符

30.9477 1 1
  • 关注作者
  • 收藏
123898>

热门用户 换一批

本月PGC排行 换一批

01
ermutuxia
6291.9225
02
LXM21
1415.3362
03
shauna570392
1146.4901
04
liting李
1144.7224
05
开花结果02
941.9709
06
詹惠儿
766.2914
07
s1223452840
740.2551
08
读童话的狼
692.6596
09
18192654262
450.6033
10
赵娜0418
368.2448
11
隋东芝
322.7001
12
zhxiaol
322.0296
13
陈yy123
222.3672
14
宋俊花
170.1311
15
1530553748
167.2216
16
ALEXSONG_JY
162.4142
17
WXlJ1l5
151.5480
18
bigdata~
146.1921
19
永洪科技
138.8313
20
曹翔888
136.5274
21
wangxishi
135.4384
22
我是大魔王哈哈
134.8675
23
梁程晴
134.4508
24
13285917268
118.0985
25
你应该是一阵风丫
108.2495
26
PanHero_龙宝宝
104.2832
27
fuli2020
97.3386
28
-黄纬
90.5231
29
叶yyf
83.9692
30
PGC123
72.3793
31
小朱520
63.2051
32
aralexu
62.1749
33
gracejpw1117
61.8954
34
觉得是快乐
53.9994
35
Zxmzxm11
53.9385
36
admin
46.4328
37
liujie01-09
42.1503
38
zzfcda
41.2856
39
姚慧扬
40.3583
40
Zzyh12
39.8657
41
周柃君
32.6876
42
daishi36
32.2574
43
85691082
30.8139
44
刘爱诗啊
27.5479
45
291294878
16.6996
46
wo5656500
4.2883
47
星野
1.4859
48
k_0711
1.3135
49
cda讲师号
1.0566
50
michelle.qin
0.6518