白璐123

那些python里面让人头秃的数据类型:序列,numpy.ndarray, matrix,pandas.dataframe

根据粗浅的十几天的学习,个人感觉对python中的各种数据类型一头的问号,通过几天的梳理和理解,下面为个人浅见。在进入python基础学习的时候,我们开始学习的数据类型就是序列,里面存在可变序列和不可变序列。有序序列和无序序列。后我们开始接触python清洗课程,在课程中我们接触到了python清洗第一个包numpy,numpy中对应的数据类型就是ndarray了,此时不禁会问,这个ndarray

0.0000 0 0
  • 关注作者
  • 收藏
ermutuxia

用sklearn做完线性回归后如何查看可决系数

#导入库import pandas as pdimport numpy as np#模拟一些数据data=pd.DataFrame(np.random.randn(10,3),columns=["y","x1","x2"])#导入线性回归类from sklearn.linear_model import LinearRegression#开始建模估计回归系数#实例化一个回归模型regmodel =

0.2813 2 0
  • 关注作者
  • 收藏
ermutuxia

用matlotlib画图的时候如何在一个折线图中为各个值添加数值标签?

我想实现画图出来看到每个点的值,怎么实现呢import pandas as pdimport numpy as npimport matplotlib.pyplot as plt#导入数据data=pd.DataFrame(np.random.randint(1,10,(5,3)),columns=["x1","x2","x3"], index=["a","b",

0.2813 2 0
  • 关注作者
  • 收藏
LXM21

python传入参数的数据类型

回复:传入列表时,会变成 0+[1,2,3],报错提示不支持 'int'和'list'类型运算

57.1533 3 0
  • 关注作者
  • 收藏
LXM21

python传参

回复:定义的时候只定义了两个参数,一个是默认参数,不加中括号是传入了5个值,加入中括号是传入一个值,所以下面报错sum2()只有1-2个参数,但是被传入了5个值

57.1963 4 1
  • 关注作者
  • 收藏
liting李

python计算,指定的日期,后n天,前n天是哪一天

import datetimedef getday(y=2017,m=8,d=15,n=0): the_date = datetime.datetime(y,m,d) result_date = the_date + datetime.timedelta(days=1) d = result_date.strftime('%Y-%m-%d') return d print

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

常用的Python 对象的命名规范有哪些?

模块:尽量使用小写,单词太多用下划线分割。类:使用驼峰命名,单词首字母大写,不使用下划线。函数:全部使用小写,单词太多用下划线链接,私有函数前添加一个下划线。变量:全部使用小写,常量全部使用大写,均用下划线链接。

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

解释型和编译型编程语言的区别

答:编译型语言是将代码编译成机器码,然后执行,通过编译可以使得程序直接以机器码的形式进行工作。通俗一点就是将整个程序一次性编译后再执行。解释型语言则是编译一句执行一句,编译到哪里执行到哪里,每次执行前都要逐句编译。通常情况下编译型语言执行速度比解释型快,但是现在的解释器经常会针对语言进行优化,所以有时候解释型语言速度反而比编译型快。解释性语言===吃火锅==煮完再吃编译性语言===吃菜==边上边吃

56.8986 1 0
  • 关注作者
  • 收藏
马锦涛

Python3 和 Python2 之间的区别?

1、print由关键字变为了函数。2、Python3默认使用utf-8,解决了Python2中使用ACSII导致的中文乱码问题。3、将xrange与range进行合并,在Python3中只存在range一种写法,本质上是xrange。

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

html和xml区别

在html中不区分大小写,在xml中严格区分大小写在html中,在某些情况可以省略闭合标签。在xml中,绝对不能省略任何标记。在xml中,单标签结尾处需要加’/’。xml文档中,空白部分不会被解析器自动删除,但是html是过滤掉空格的在xml中,属性值必须封装在引号中。在html中,引号可用可不用。在html中属性名可以不带属性值,xml必须带属性值而且不能为空

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

爬虫是代理有什么作用

1、突破自身IP 访问限制, 访问一些平时不能访问的站点。2、访问一些单位或团体内部资源: 比如使用教育网内地址段免费代理服务器, 就可以用于对教育网开放的各类FTP 下载上传, 以及各类资料查询共享等服务。3、提高访问速度: 通常代理服务器都设置一个较大的硬盘缓冲区, 当有外界的信息通过时, 同时也将其保存到缓冲区中, 当其他用户再访问相同的信息时, 则直接由缓冲区中取屮信息传给用户, 以提高访

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

一个HTML响应包括哪些内容?

scheme:协议(例如:http, http, ftp)host/ip:服务器的IP地址或者域名port:服务器的端口(如果是走协议默认端口,缺省端口80),用来从互联网进入电脑path:访问资源的路径,就是为了在电脑中找到对应的资源路径query-string:参数,发送给http服务器的数据anchor:锚(跳转到网页的指定锚点位置)

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

服务器响应有哪些?

组成:状态行,响应头,空行,响应正文。Content-Type:text/html;资源文件的类型,还有字符编码Content-Length:响应长度Content-Size响应大小Content-Encoding告诉客户端,服务端发送的资源是采用什么编码的。Connection:keep-alive这个字段作为回应客户端的Connection:keep-alive,告诉客户端服务器的tcp连接也

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

客户端请求get和post区别?

get是从服务器获取数据 post是向服务器提交数据get参数拼接在url后面,这样是明文传输,很不安全。 post的参数放在body体内,相比get比较安全get提交可以被浏览器缓存 post不会被浏览器缓存get产生一个TCP数据包(对于GET方式的请求,浏览器会把http header和data一并发送出去,服务器响应200(返回数据)) POST产生两个TCP数据包(而对于POST,浏览器

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

http协议和https协议的区别

1、http协议是使用明文数据传输的网络协议,明文传输会让用户存在一个非常大的安全隐患。端口802、HTTPS协议可以理解为HTTP协议的安全升级版,就是在HTTP的基础上增加了数据加密。端口443 3、HTTPS 协议是由 SSL+HTTP 协议构建的可进行加密传输、身份认证的网络协议 要比http 协议安全

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

一些反爬及其应对措施

( 1)通过user-agent来判断是否是爬虫。解决方案:可以通过伪装请求头中的user-agent来解决。若user-agent被检测到,可以找大量的user-agent,放入列表,然后进行更换(2)将ip进行封杀。解决方案:可以通过代理来伪装ip(3)通过访问频率来判断是否是一个爬虫。解决方案:可以通过设置请求间隔,和爬取间隔。(4)当一定时间内的总请求数超过上限,弹出验证码解决方案:对于简

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

爬虫可以分为哪几类?

通用爬虫:搜索引擎的主要组成,作用就是将互联网的上页面整体的爬取下来之后,保存到本地。 聚焦爬虫:聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。 通用爬虫和聚焦爬虫的区别:聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

如何处理封IP的反爬 ?

因为网络上的免费代理平台可用的IP数量太少,所以自己写一个模块去抓取平台的IP来维护是没有什么意义的。我选择的是付费代理,通过使用平台的api在本地动态维护一个IP缓存池来供给分布式架构的爬虫节点使用。这个缓存池不需要做IP有效性验证,因为我的爬虫若下载某个Request彻底失败后会把这个Request重新放回Request队列,而且选择一个好的代理平台可以大大提高代理IP质量。我常用的是快代理。

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

可以直接作用于for循环的数据类型有哪些?

一类是集合数据类型,如list、tuple、dict、set、str等;一类是generator,包括生成器和带yield的generator function。 这些可以直接作用于for循环的对象统称为可迭代对象:Iterable。 可以使用isinstance()判断一个对象是否是Iterable对象:

0.0000 0 0
  • 关注作者
  • 收藏
马锦涛

列表生成式和生成器的区别 ?

列表生成式直接生成一个列表,所有元素对象被立即创建在内存中,当元素过多时,势必会占用过多内存, 不可取,要用到生成器,它即时创建一个生成器对象,未创建任何元素 生成器来生成一个列表,它不会立即创建大量的对象在内存中

56.8986 1 0
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
ermutuxia
20081.4306
02
赵娜0418
8220.0651
03
詹惠儿
6704.7217
04
liting李
4040.3540
05
LXM21
2376.1543
06
读童话的狼
1714.7376
07
PGC123
1480.3813
08
马锦涛
1047.6925
09
Dragon男爵
623.3936
10
235239
598.4692
11
17国本二
583.1929
12
心盛待花开
565.2293
13
樊江龙
501.6627
14
闪呀闪
435.3966
15
孙媛呀
418.1414
16
wangxishi
414.6179
17
18192654262
284.1543
18
SUKI-ZY
228.3905
19
85691082
220.7702
20
Sasyo
209.4047
21
永洪科技
173.3812
22
15119939905120
156.9421
23
Mosquito-
150.0168
24
yaolily
138.0199
25
16637023243
124.3920
26
r1cky
120.8189
27
白璐123
99.5190
28
野娃子
99.5190
29
Chin。
95.4506
30
BOBOLEYOUYOU
81.1556
31
hunter.Z
77.4616
32
杨谋
74.9150
33
kgdpesai
73.6167
34
1027670370
65.7718
35
wanghuijie2222
65.3341
36
soulspirits
50.5485
37
CDA-18810556009
45.3245
38
骆逸铭
42.4651
39
yw172716
40.5263
40
icey小媛
40.0812
41
我是大魔王哈哈
40.0623
42
刘圣杰
37.8449
43
CDA-13917481347
37.4575
44
星!
36.8621
45
201701010305
35.3692
46
夏光军
35.3585
47
291294878
23.8664
48
-黄纬
2.1889
49
星野
1.6439
50
9047_1575431266
0.8079