QQ聊天记录导出并备份到百度云操作方法:
打开QQ主面板,点击消息图标。
右键需要保存聊天记录的分组,点导出消息记录。
选择要保存的文件类型后点保存。
打开百度云客户端后点上传。
找到导出的聊天记录文件,点存入百度云。
这个项目的github地址。
最近准备开始学习python,写一个综合一点的小demo练练手~
读取文件
编写清洗函数,清洗聊天数据。主要是需要清洗掉一些无用的关键词:
分词,分词结果如果出现一些特有的词语截了一半或者截多了几个字符的情况,可以手动添加分词词库。
根据关键词数据,建立pandas的DataFrame,通过停词词库过滤掉一些中文中不适合做关键词的词语,进行关键词数统计并根据次数排序。
词云属性解释
调整成120之后就好看很多,有很明显的差别。
设置图片为可爱的莫古力
根据这个莫古力的颜色分布,生成的词云如下,我这个不是特别好看,大家可以选择轮廓明显一点的图片来生成。
相比默认的模式,
关于更详细的词云配置可以看这篇文章,这个作者对wordcloud的配置讲解的十分详细。
在你想导出的人或群处右键,点导出消息记录,
然后选择txt格式
主料:文本(QQ聊天记录)
辅料:WordArt,jieba(python包)
安装并使用 jieba 流程,具体参考前一篇博客
【传送门】:
介绍制作词云的两种方法:
WordArt 是一款十分好用的在线制作词云的软件。但是,需要付费得到更高清的结果。对于我们普通用户,在网站上申请自己的账号,做几张图娱乐一下就行了。没必要花很多钱去买会员。
下面是国外的网友的一些作品:
想要制作自己的词云图,首先要准备好自己的文本材料(在这里,我以qq聊天记录为例子进行演示): 有关 qq聊天记录的提取和分词 请翻看前篇BLOG ( 传送门 )
注册登录账户,创建( CREATE NOW )自己的项目以后,WordA如图选项栏分为:文本、形状、字体、布局以及风格。
是不是很棒呀~赶快行动起来吧!!!
手]使用WordCloud模块将qq聊天记录生成炫酷的关键词云这个项目的github地址。 最近准备开始学习python,写一个综合一点的小demo练练手~ 读取文件 编写清洗函数,清洗聊天数据。主要是需要清洗掉一些无用的关键词: 分词,分词结果如果出现一
thon练手]使用WordCloud模块将qq聊天记录生成炫酷的关键词云这个项目的github地址。 最近准备开始学习python,写一个综合一点的小demo练练手~ 读取文件 编写清洗函数,清洗聊天数据。主要是需要清洗掉一些无用的关键词: 分词
开始学习python,写一个综合一点的小demo练练手~ 读取文件 编写清洗函数,清洗聊天数据。主要是需要清洗掉一些无用的关键词: 分词,分词结果如果出现一些特有的词语截了一半或者截多了