gracejpw1117

2020-09-08   阅读量: 971

pandas操作excel中各列内容:合并、拆列、去重、日期格式转换等

扫码加入数据分析学习群
import pandas as pd
df=pd.read_excel(r'D:\CDA\CDA_PGC\datas.xlsx',sheetname='Sheet1')
df['日期']=df['日期'].dt.date #去掉‘时分秒’(从excel导入的日期数据默认00:00:00)
df['合并列']=df['编号'].map(str)+','+df['日期'].map(str) #将pandas默认的pandas默认的int64类型转为字符串
df

Out[15]:


编号日期合并列
01232020-09-09123,2020-09-09
11232020-09-08123,2020-09-08
23452020-09-09345,2020-09-09
33452020-09-08345,2020-09-08
43452020-09-09345,2020-09-09
51232020-09-09123,2020-09-09

In [16]:

df.drop_duplicates('合并列',inplace=True)
df

Out[16]:


编号日期合并列
01232020-09-09123,2020-09-09
11232020-09-08123,2020-09-08
23452020-09-09345,2020-09-09
33452020-09-08345,2020-09-08

In [17]:

df.drop(labels=['编号','日期'],axis=1,inplace=True)
df

Out[17]:


合并列
0123,2020-09-09
1123,2020-09-08
2345,2020-09-09
3345,2020-09-08

In [18]:

df['编号'],df['日期']=df['合并列'].str.split(',',1).str 
df

Out[18]:


合并列编号日期
0123,2020-09-091232020-09-09
1123,2020-09-081232020-09-08
2345,2020-09-093452020-09-09
3345,2020-09-083452020-09-08

In [19]:

df=df.drop(labels=['合并列'],axis=1)
df

Out[19]:


编号日期
01232020-09-09
11232020-09-08
23452020-09-09
33452020-09-08

In [20]:

df.to_excel(r'D:\CDA\CDA_PGC\datas2.xlsx',index=None)#删除index列


77.5233 3 0 关注作者 收藏

评论(0)


暂无数据

推荐课程