stylecloud:简洁易用的词云库

栏目: IT技术 · 发布时间: 5年前

内容简介:stylecloud基于wordcloud库,使用方法更简单一些。该库的特点有csv为词频统计结果,两个字段,分别为今天准备了两个csv

预祝全国考生:鲤鱼跃龙门,门门考高分~

stylecloud基于wordcloud库,使用方法更简单一些。该库的特点有

  • 支持词云图图标形状设置

  • 可直接读取csv文件(csv有两列,word和freq)

  • 可调色

  • ...

安装

pip install stylecloud

数据

csv为词频统计结果,两个字段,分别为 word和freq

今天准备了两个csv

  • data/高考.csv

  • data/股市.csv

import pandas as pd

df1 = pd.read_csv('data/高考.csv')
df1.head()
word freq
0 高考 2198
1 未来 1549
2 决定 1443
3 一个 806
4 可以 644
df2 = pd.read_csv('data/股市.csv')
df2.head()
word freq
0 牛市 1993
1 图片 649
2 市场 530
3 A股 527
4 股市 520

快速上手

import stylecloud

stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/高考.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/高考1.png',
                          size=500,
                          custom_stopwords=stopwords)

stylecloud:简洁易用的词云库

import stylecloud
stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/股市.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/股市1.png',
                          size=500,
                          custom_stopwords=stopwords)

stylecloud:简洁易用的词云库

stylecloud参数介绍

  • file_path:CSV的文件路径,需要注意的是csv文件格式为两列(word, freq)

  • size:词云图尺寸[默认值:512]

  • custom_stopwords:自定义停用词列表

  • output_name:输出的词云图路径

  • font_path:字体路径

  • icon_name:图标名(fas fa-iconname)只需要改iconname,[默认值: fas fa-flag]

  • palette:调色板(通过 palettable 实现)[默认值:cartocolors.qualitative.Bold_6]

  • background_color:词云图背景色[默认值:white]

  • max_font_size:词云图最大字号[默认值:200]

  • random_state:控制单词和颜色的随机状态,如不设置,每次运行的效果会发生变化

图形设置

icon_name参数的模板【fas fa-iconname】只需要改动iconname即可。

iconname并不是随便起的,必须能在https://fontawesome.com/license/free 搜到才可以。

stylecloud:简洁易用的词云库

比如以 高考 为例,我会在搜索框搜索跟 教育 相关的关键词

  • university

  • education 等

截图中找到最能体现文本主题的图标 user-graduate

所以icon_name = 'fas fa-user-graduate'

import stylecloud
stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/高考.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/高考2.png',
                          icon_name='fas fa-user-graduate',
                          size=500,
                          custom_stopwords=stopwords)

stylecloud:简洁易用的词云库

import stylecloud
stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/股市.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/股市2.png',
                          icon_name='fas fa-question-circle',
                          size=500,
                          custom_stopwords=stopwords)

stylecloud:简洁易用的词云库

往期文章

小案例: Pandas的apply方法 

Python 绘制近20年地方财政收入变迁史视频

Python语法快速入门

Python网络爬虫与文本数据分析

读完本文你就了解什么是文本分析

文本分析在经管领域中的应用概述

综述:文本分析在市场营销研究中的应用

从记者的Twitter关注看他们稿件的党派倾向?

Pandas时间序列数据操作

70G上市公司定期报告数据集

文本数据清洗之正则表达式

shreport库: 批量下载上海证券交易所上市公司年报

Numpy和Pandas性能改善的方法和技巧

漂亮~pandas可以无缝衔接Bokeh

YelpDaset: 酒店管理类数据集10+G

公众号后台回复关键词【stylecloud】即可下载本文数据代码

分享 ”和“ 在看 ”是更好的支持!


以上所述就是小编给大家介绍的《stylecloud:简洁易用的词云库》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

程序员代码面试指南:IT名企算法与数据结构题目最优解

程序员代码面试指南:IT名企算法与数据结构题目最优解

左程云 / 电子工业出版社 / 2015-9 / 79.00元

这是一本程序员面试宝典!书中对IT名企代码面试各类题目的最优解进行了总结,并提供了相关代码实现。针对当前程序员面试缺乏权威题目汇总这一痛点,本书选取将近200道真实出现过的经典代码面试题,帮助广大程序员的面试准备做到万无一失。“刷”完本书后,你就是“题王”!__eol__本书采用题目+解答的方式组织内容,并把面试题类型相近或者解法相近的题目尽量放在一起,读者在学习本书时很容易看出面试题解法之间的联......一起来看看 《程序员代码面试指南:IT名企算法与数据结构题目最优解》 这本书的介绍吧!

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具