入門:Steamレビューテキストアナリシス【頻度編】


I want to analyze a Steam game reviews dataset from Kaggle, mainly focusing on frequency analysis in text mining.


勝手にKaggleに参戦したるわ。

Kaggleに掲載されている全てのSteamゲームレビューの頻度語解析

すべてのゲームレビューのテキストを解析するとこんな具合で頻出語が出た。よく使われる上位層ではポジティブワードが軒を連ねていて下位層にネガティブワードがよくよく見て取れる。例えばfun playとかが上位に出ていてゲームは楽しむものだというレビュー層の言葉がJK良く出ているように思う。若干それよか下位の層にhack bannedとかそういう細やかな批判ワードが出ていて興味深い。単語による頻出格差も相当デカい。総合的に見てみた感じはこう。