YouTubeの動画から字幕を起こしてテキストマイニングする世界一単純な方法


How to text mine specific YouTube video subtitles. This method is very simple thanks to recent advancements in AI.


これは実はとても簡単。AIの進歩とコモディティ化によってこれぐらいの作業は半自動することが出来る。

YouTube to TextをChromeに入れる

②当該動画のURLでChromeで開き文字起こしボタンを押す

③クリップボードにコピーボタンをクリックする

④コピーしたものをテキストエディタに貼り付ける

⑤テキストファイルをクレンジングする

AIテキストマイニング by ユーザーローカルにかける(この部分はご自由に)

例えば、有名な荻野先生の動画を文字起こししてTMにかけるとこうなる。…とその前にTMにかけたテキストファイルの様子。

頻出語・ネガポジ・時系列ネガポジ・感情分析・時系列感情分析の順に図を示すNE。

※解析結果

まぁ、当然ですが荻野先生怒ってるねw相当怒ってます。規則みたいな単語が多いね。んで、ほとんどがレッドゾーンで如実に怒りが示唆されている。で、唯一、恐怖示図が時系列の最後の方に若干出てますが、ここは荻野先生が引いて自らを論じている部分だからだと思われます。つまり、「俺はこういう人間だ」「正直言って自分は変わらない」「一回我慢しようと思ったんだが」「どうしても本音を言ってしまう」とかなりの丁寧口調になっていて、客観的に自分の意見を踏まえて論じている部分です。だから、そのテキスト部分が恐怖に分類されたものと思われます。ですが、発言全体は紛れもなく怒り口調で、ポジティブな要素はほとんどないということが、(動画の内容も踏まえると当然なんですが…)分かったように思います。

【出典表記】 ユーザーローカルAIテキストマイニングによる分析( https://textmining.userlocal.jp/ )