經(jīng)常做數(shù)據(jù)分析的人肯定不會(huì)對詞云圖感到陌生,尤其是近幾年來非常流行,不管是發(fā)布會(huì)、行業(yè)報(bào)告還是新聞,都喜歡使用詞云這種形式,將信息的關(guān)鍵詞組成形象生動(dòng)的圖案,一下子就能抓住生人眼球,因?yàn)樵~云圖這種可視化圖表給人的第一印象就是足夠裝逼,足夠亮眼!
羅振宇的跨年演講中用到詞云
但是詞語云圖的最大優(yōu)點(diǎn),其實(shí)并不是它的顏值,而是它能夠能夠直觀地展示數(shù)據(jù)頻率,對出現(xiàn)頻率較高的關(guān)鍵詞予以重點(diǎn)突出,從而過濾掉大量的文本信息,幫助我們進(jìn)行數(shù)據(jù)分析。
而且,如果能夠親手做一個(gè)詞云圖,發(fā)到朋友圈里豈不是能夠帥到?jīng)]朋友?
網(wǎng)上有很多線上詞云制作網(wǎng)站,但是基本上很難實(shí)現(xiàn)對數(shù)據(jù)的篩選和過濾,僅僅是有著好看的皮囊而已。對于數(shù)據(jù)分析人而言,還是要借助專業(yè)的分析工具,下面我就用Python和FineBI這兩個(gè)常用的數(shù)據(jù)分析工具,分別實(shí)操一下如何制作炫酷又裝逼的詞云。
Pyhton
1、安裝Python運(yùn)行環(huán)境和套裝
這個(gè)不必多說,推薦下載的套裝是anaconda,做詞云很好用。下載完畢后,配置好運(yùn)營環(huán)境后,執(zhí)行安裝文件就行了。
2、準(zhǔn)備數(shù)據(jù)
下面是我隨便找了一篇英文文章,作為要進(jìn)行詞云制作的數(shù)據(jù)基礎(chǔ)
我把其中的正文文字部分拷貝了下來,存儲(chǔ)為一個(gè)文本文件,叫做yes-minister.txt,把這個(gè)文件挪動(dòng)到我們的工作目錄demo里,這樣數(shù)據(jù)就準(zhǔn)備好了。
3、開始做詞云了
做詞云的核心步驟只有兩個(gè)——輸入文本和呼喚詞云包。
首先,在命令行下,輸入:
jupyter notebook
瀏覽器會(huì)自動(dòng)開啟,并且顯示如下界面——Jupyter的主頁面,我們點(diǎn)擊New按鈕,選擇Python 2選項(xiàng)。
然后就出現(xiàn)了一個(gè)空白的筆記本,供我們使用了。我們在網(wǎng)頁里唯一的代碼文本框里,輸入以下3條語句,輸入后,按Shift+Enter鍵,就可以執(zhí)行了。
filename = "yes-minister.txt"with open(filename) as f: mytext = f.read()
文本就出現(xiàn)了,然后我們呼喚(import)詞云包,利用mytext中存儲(chǔ)的文本內(nèi)容來制造詞云。
from wordcloud import WordCloudwordcloud = WordCloud().generate(mytext)
此時(shí),制作詞云最核心的兩步就完成了。
4、調(diào)出詞云,完成
輸入下面4行語句:
%pylab inlineimport matplotlib.pyplot as pltplt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")
這樣一個(gè)簡單的詞云圖就做好了,想要將詞云圖做的更加美觀,還需要調(diào)節(jié)各種參數(shù),這里就不一一講解了,感興趣地可以自己慢慢去探索。
FineBI
相比于Python,用FineBI最大的好處就是不用編寫代碼,簡單易用,毫無數(shù)據(jù)和編程基礎(chǔ)的人都能夠輕松做出好看的詞云。
1、下載安裝FineBI,準(zhǔn)備數(shù)據(jù)
下載地址可以私聊我“FineBI”獲得免費(fèi)下載鏈接,為了方便起見,我這里就直接用FineBI自帶的數(shù)據(jù)了。
2、組件設(shè)置
新建組件并選擇樣式數(shù)據(jù)業(yè)務(wù)包下的搜索詞匯統(tǒng)計(jì)表,將待分析區(qū)域維度下的字段“搜索詞”拖入橫軸中,將指標(biāo)下的字段“搜索次數(shù)”拖入縱軸中,在圖表類型下選擇詞云圖。
3、大小、文本、顏色的優(yōu)化
選擇該圖表類型后,圖形屬性下形狀自動(dòng)切換為文字,維度字段被添加到文本中,指標(biāo)字段添加到大小屬性中
4、詞云完成
總結(jié)
通過進(jìn)行詞云分析,我們可以看的出來哪些數(shù)據(jù)是出現(xiàn)頻次最多的,我們的關(guān)注點(diǎn)是哪些。這次我演示做的詞云也很簡單,后續(xù)在研究研究讓它更美觀一些,精準(zhǔn)一些。