Word Cloudとは,テキストマイニング結果を可視化する技法の一つで,重要度の高い順に単語のサイズを大きくすると共に,中心から周辺へと配置するというものです。WebサービスとしてWord cloudを作る機能を提供しているところもあり,例えば,こちらのサイトを使って情報学部のトップページをWord cloudにすると次のようになります。
同様に,MATLABでもWord cloudを描く機能が最新版の2017bから追加されたようです。wordcloud関数一発で描けるということなので,早速やってみました。次の1行で十分です。
wordcloud(eraseTags(urlread('http://informatics.sist.ac.jp/')));
これで生成した図が下記のものになります。
形態素解析を使っておらず,助詞が混じってしまっていますが,そこそこまともなものができています。きちんとやりたい人は,MeCabやYahoo!のサービスを使ったりして助詞を省く必要があります。