陈革007
2020-06-14 阅读量: 1451
爬虫 + jieba + 正则 + wordcloud
抓住周总新歌的热度,来一波图表制作
1.爬取 某音乐平台的评论, 25000条,但是电脑配置有限, 运行的结果中 只有 1800条
2.jieba库分词 + 正则, 清除不必要的字段
3.wordcloud 绘制
需要相关代码的私
清除不必要字段怎么操作呀
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar
SQL(结构化查询语言)是一种数据库语言,按照功能分类,有DDL、DQL、DML、DCL、TCL 五大类型,简单了解一下它们分别是做什么用的:(1)DDL(Data Definition Language) DDL是数据定义语言,主要用来定义或者改变表的结构。例如:create、alter、drop、truncate等语句。(2)DQL(Data Query Language) DQL是数据查询语
时间序列回归模型是用于分析时间序列数据的一种模型,主要用于探索数据之间的动态关系和时序特征。以下是时间序列回归模型的主要步骤和要点:1. **数据收集和准备**:首先需要收集时间序列数据,并进行数据清洗和准备工作,包括处理缺失值、异常值和平稳性检验等。2. **建立模型**:确定时间序列回归模型的形式,根据数据特点选择适当的模型,如自回归模型(AR)、滑动平均模型(MA)、自回归滑动平均模型(AR