田先生1

2020-08-09   阅读量: 5018

POWER BI 中的替换问题

扫码加入数据分析学习群
近期有个小伙伴问我一个问题,有一张数据表,想对其中一列的某些字段进行替换,有没有什么办法。


我一想,这不就是数据清洗的东西吗,正好最近小白也在学,就答应帮他试试,下面我们一起来看下我的成果吧。

首先看下数据,一个简单的场景,有若干衣服的型号,比如女装L码,女装M码,男士XL码,男士XXL码,儿童80,儿童100等尺码,现在需要把尺码去掉,只展示衣服是男装还是女装或者童装。


先说下思路,通过观察这份数据可以发现数据都是女装加尺码、男士加尺码或者童加尺码格式。

所以我的思路是对这一列进行拆分,把衣服的品类和尺码分开,这样就可以得到衣服的品类了,下面来具体操作一下。

02

操作演示



首先,点击替换值,在“女装”后面加一个中横线“-”作为分隔符,之后来看一下,之前的“女装XL”变成了“女装-XL”



之后重复上述操作,对男装和童装进行修改:


修改完成后看一下我们的数据已经在衣服品类和尺码之间加上了分隔符“-”,这样就完成了第一步,之后再根据分隔符“-”把这一列拆开

点击拆分列,选择按分隔符,按中横线“-”来拆分,由于在实际的数据中也可能存在中横线“-”,所以我们只拆分最右侧的中横线“-”


之后我们得到了如下结果:


此时我们已经基本完成了处理,之后再稍微修饰一下格式,把我们不需要的尺码列去掉,再把品类列的列名称改一下即可,最后我们得到了这样一张表:


03

知识延伸



除上面给出的方法外,小白再提供一种方法,这种方法就需要借助M函数来实现了,首先我们把数据恢复到最原始的状态,之后我们新建一个自定义列:



以如下函数来新建列:


Text.Remove([品类] , {"A".."z","0".."9"})


之后我们得到新建列如下:


此时已经完成了我们的需求,再把数据进行一下修缮即可,删除之前的列,再将新建列的列名进行修改最终得到如下数据:


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
31.7286 5 2 关注作者 收藏

评论(1)

陈yy123
2020-08-10

图片加载不出来,文章写的很好,很清晰

0.0000 0 0 回复

推荐课程