西野カナの歌詞スクレイピングしてみたよー

3ヶ月前くらいの話です。
GithubGistに公開したのでブログ更新します!!!

なぜ西野カナスクレイピングをしようと思ったかと言うと, PyData.Okinawa #20であったRNN(リカレントニューラルネットワーク)で 次にくる文字を予測というのがあり誰かの歌詞を予測してみようということから西野カナの歌詞をスクレイピングしてみました。

歌詞の情報をスクレイピングできるサイトは限られています。
※正直コードは汚いです。