ツイートデータと見る坂道冠番組 2019/02/04【乃木中、けやかけ、がな推し】
はじめに
乃木坂46、欅坂46、けやき坂46の冠番組へのツイートを使って簡単な解析をしました。
- 番組のオンエア中に投稿されたツイートデータを収集しました。
- ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象としました。
- RTは対象としておらず、ツイート数等にに含んでいません。
乃木坂工事中 #192 (2019/02/04 00:00 ~ 00:30)
総ツイート数: 24604
欅って書けない #166 (2019/02/04 00:35 ~ 01:05)
総ツイート数: 8033
ひらがな推し #42 (2019/02/04 01:05 ~ 01:35)
総ツイート数: 8798
乃木坂46・欅坂46・けやき坂46のブログから単語分散表現を学習
1. はじめに
特定ドメインのテキストから単語分散表現を学習することに興味があったので実験しました。
今回実施した内容
- 乃木坂46・欅坂46・けやき坂46のブログを収集してテキストへ前処理をする
- fastTextにより収集したブログのテキストから単語分散表現を学習する
- 学習した単語分散表現による類似単語の検索や2次元空間へのプロットの結果を確認する
2. 単語分散表現とは
単語分散表現は、文書から学習される単語の意味を表すベクトルです。 学習されたベクトルが「“King” – “Man” + “Woman” = “Queen”」のような足し算、引き算ができることで話題になりました。 この話題になったミコロフの論文が発表されたのは2013年でした。そこから早6年、学術領域でその方法論や応用が盛んに議論されております。*1
fastText
今回採用したfastTextは、Facebookにより提案された分散表現の学習手法の1つです。 こちらの手法は、Subword modelというモデルを組み込むことにより、出現単語の文脈のみでな字面の類似性を考慮することを可能とします。 *2
以下の記事の解説がとても分かりやすいです。
3. Fasttextによる学習
実装コード
言語: Python
使用ライブラリ: Mecab, gensim, neologdnなど
GitHubリポジトリ:
github.com
3-1. 学習データについて
収集した記事について
使用した記事数は以下の通りです。
ブログの収集方法はこちらの記事の通りです。
前処理
- 括弧などの記号やURLなどの除去
- neologdで紹介されている前処理
- 名詞、動詞、形容詞のみを使用する
上の処理を順番に実施しました。詳細はコードで確認できます。
ただこちらにも書いていますが、良い方法である自信はありません。
3-2. 学習方法
gensimを使って以下のよう学習しました。
# learn fasttext from gensim.models import FastText model = FastText(size=100, sg=1, workers=4, window=10, min_count=10) model.build_vocab(sentences) model.train(sentences, total_examples=model.corpus_count, epochs=model.epochs)
パラメータはかなり適当です。
3-3. 学習した単語分散表現の確認
類似単語の検索
学習した分散表現が類似する単語を探索すると、下のような結果になりました。
model.wv.most_similar("てち") --- [('友梨奈', 0.7058396935462952), ('平手友梨奈', 0.6936807036399841), ('平手', 0.6837375164031982), ('波布茶', 0.6804182529449463), ('ゆう', 0.6743236780166626), ('ネル', 0.6728752255439758), ('鈴本', 0.6586591005325317), ('理佐', 0.645741879940033), ('まなか', 0.6427689790725708), ('あかね', 0.6317785978317261)] model.wv.most_similar("キャプテン") --- [('キャプ', 0.7702136039733887), ('暫定', 0.6804853677749634), ('就任', 0.6307018399238586), ('正式', 0.6078504323959351), ('れいか', 0.6019401550292969), ('桜井', 0.557970404624939), ('大役', 0.5572315454483032), ('任命', 0.5523629188537598), ('責任感', 0.5509008169174194), ('頼り', 0.5480058193206787)] model.wv.most_similar("佐々木久美") --- [('佐々木希', 0.7091835737228394), ('加藤史帆', 0.6711205244064331), ('東村', 0.644331693649292), ('佐々木', 0.6436366438865662), ('柿崎芽実', 0.6401069760322571), ('東村芽依', 0.639634907245636), ('佐々木美玲', 0.6213143467903137), ('久美', 0.6100345849990845), ('きくちゃん', 0.5945029258728027), ('柿崎', 0.5900822281837463)]
- 「てち」は「平手友梨奈」の愛称であり、「平手」や「友梨奈」と共に上位に含まれている。
- 「キャプテン」のことを乃木坂メンバは同義後として「キャプ」と呼ぶこともある。また、乃木坂46のキャプテンである桜井玲香を表す「桜井」「れいか」が含まれている。一方で、欅坂46, けやき坂46のキャプテンは含まれていなかった。
- 「佐々木久美」の愛称「久美」「きくちゃん」が含まれいる。「佐々木希」は字面の類似性に引っ張られたと思われる。
メンバおよび番組MCを2次元空間へプロット
以下の図は、各人物名の分散表現をTSNEにより2次元へ次元削減したものです。
- 各グループ毎と番組MCにうまく分離されており、分散表現がそれぞれの所属グループの情報を含んでいることが確認できる。
- また、乃木坂46の1, 2, 3期やけやき坂の1, 2期もうまく分かれている
4. 終わりに
確認方法は、人物名など特定の単語のみでしたが、それなりにうまく学習できたかなという風に考えています。
ただ、やっていていこれでいいのかなと思うところもいくつかありました。
気になった点
- 前処理について
- 上述のように学習前のテキストへ前処理を行いましたが、やり方は自信が無いです。調査不足ではありますが、日本語の分散表現の学習で前処理がどの程度必要なのかが分かりませんでした。いくつかの記事では日本語Wikipediaから学習するとき、分かち書きだけしたもので学習してたようでしたが、それはWikipediaがある程度綺麗な文書だからなのか?など、結構疑問がありました。
学習時のパラメータについて
- これらは評価指標を定義して、ある程度実験的に探索する必要があるとは思いますが、今回のような特定ドメインに対して実施するときのコツとかあれば知りたい。
- 次元数と考慮するサブワードの範囲が最も重要であるとFasttextのドキュメントに書かれていました。
- fasttext.cc
The most important parameters of the model are its dimension and the range of size for the subwords. The dimension (dim) controls the size of the vectors, the larger they are the more information they can capture but requires more data to be learned. But, if they are too large, they are harder and slower to train. By default, we use 100 dimensions, but any value in the 100-300 range is as popular. The subwords are all the substrings contained in a word between the minimum size (minn) and the maximal size (maxn)
今後の課題
今後は以下の点を検証したいと思っています。
学習した単語分散表現を応用
学習データの追加
他の学習方法との比較
*1:先日話題になっていたMLタスクの論文・コードがまとめられたサイトpaperswithcodeでは「179 papers with code」が登録されていました。
*2:日本語の分散表現を学習している記事がいくつかあり、その辺も安心感があったのでこちらを採用しました。
僕が欅坂46に急激に好きになるまでの経緯
はじめに
2018年11月頃から現在までに、僕は欅坂46・けやき坂46(ひらがなけやき)に急激にハマりました。 その間、どんなコンテンツを浴びて、どのような感想を抱き、このグループのファンになったかを辿ります。 *1
以下では、今でも思い出せる印象に残っているタイミングに注目して振り返ります。
背景 (欅坂46を好きになる前)
- ハロプロ好き
- 乃木坂46は、乃木坂工事中は時々見てた程度
- 欅坂46は、サイレントマジョリティーは聴いたことある、他のシングル表題曲も聞いたことあったかも?
- けやき坂46(ひらがなけやき)は、全く知らない、最初混乱した
▼ 2018/11 YouTube Musicで欅坂46を聞きまくる
下記のツイートをしている2018年11月中旬にYouTube Premiumが開始し、それに登録し、副産物的にYouTube Musicが利用可能となり色んな楽曲が聴き放題になり、色々聴くようになりました。
YouTube Musicはこんな感じで結構J-POP聴けます pic.twitter.com/rj0Ply82p9
— まうん (@myaunraitau) 2018年11月18日
その中で、前からちょろっと知っていた欅坂46の楽曲も聴いてみました。
抱いた感想1: 曲めちゃめちゃかっこいい!好き!
YouTube Musicの「プレイリスト・欅坂46」では下の画像のようにシングル表題曲が最初に再生されるので超豪華な並びになります。
特に、僕は最新であったシングルの「アンビバレント」が印象に残っていました。下の歌詞が社会人なりたての自分にめちゃくちゃ刺さった。
あっちを立てる気もないし こっちを立てる気だってまるでない 人間関係面倒で及び腰 話を聞けば巻き込まれる いいことなんかあるわけないじゃない それでも誰かがいなけりゃダメなんだ
▼ 2018/11 「アンビバレント」のミュージックビデオ
上のようにYouTube Musicを通して、「アンビバレント」が好きになります。 気になる要因の1つにYouTube Musicのプレイリストの再生画面に表示される↓の画像がかっこよすぎるというのもありました。
そして、満を持して「アンビバレント」のミュージックビデオを見ました。
抱いた感想2: ダンス好き!衣装好き!平手さんと高身長超美人コンビがヤバい!
高身長超美人コンビとは、土生瑞穂さん、渡邉理佐さんです。髪が明るめで衣装似合いすぎで神!って感じでした。
今でもアンビバレントのMVが1番好きなのです。その思いは別途記事にしたいほど長くなるので略。
▼ 2018/12 風邪中に「欅って書けない」等の動画を見まくる。
僕は病気になったり精神的に弱るとアイドルの動画を見る癖があります。それで風邪になってYouTube等で沢山動画を見ました。 ※ テレビ東京さんごめんなさい。今は、毎週録画して見てるので許して下さい。
抱いた感想3: 人間臭くて好き!
特に、以下の場面の人間臭さが印象に残っています。
- 相関図の回で、斎藤ふーちゃんがぺーを好きって話で泣いちゃう尾関
- 運動会で負けたときのの守屋あかねん(守屋の泣く回は全部好き、「破っていいですか」とか)
- 織田奈那の「女としてみてないじゃん」
▼ 2019/01 「欅共和国2017」買う。見る。泣く。
当然の流れで購入しました。欅坂46はこれしか映像作品を販売しておらず、故に迷いなく名盤のみ購入できました。(そういう戦略かもしれない)
年末年始で楽曲検索のためのデータ解析しようとした結果の進捗です pic.twitter.com/Cj6znmWLQt
— まうん (@myaunraitau) 2019年1月6日
抱いた感想4: 圧倒的な多幸感!好き!
本作品の色んなところで泣きましたが、「世界には愛しかない」が最も泣きました。 理由は分からないですが、たぶん圧倒的な多幸感にエモが揺さぶられたと思われます。
▼ 2019/01 ファンクラブ入会。メッセージアプリを登録する。
ここまでBlu-ray以外無課金でしたが、ここから半永久定額課金生活が始まります。 宗教上の理由で握手会には行かないと思うので、僕の課金チャンスはこれらがメインです。ライブは行ってみたいと思っています。
抱いた感想5 完全な沼。ここから先は危険かもしれない。
最近読んだ記事でファンの人の良い言葉がありました。「確かに」と思いました。
月6000円で毎日ハッピーなら実質的無料だよ keyakizaka46matomemory.net
現在
欅坂46 > 仕事 > 他の趣味の状態。頭の中の時計での1週間は「欅って書けない」の日曜日深夜を基準に測られている状態です。
社会人になって初めて仕事があって良かったと思いました。仕事があるおかげで、ハマりながらもなんだかんだちゃんとした生活を送れています。無かったら、完全に時間の使い方が欅坂に支配されていた可能性があります。
終わりに
他のファンのハマったきっかけが分からないですが、結構典型的なパターンなのかなと思っています。
アイドルにハマって、飽きるのは刹那的なもの(アイドル自体が刹那的ですが)なので、今思ったことを書いておきたいと思って書きました。
*1:ガチ日記、ガチポエムなので、変わり者以外は読むだけ時間の無駄です
ブログ解析による欅坂46メンバの相関図作成
はじめに
- 欅坂46メンバの公式ブログを解析し、メンバ間の関係を抽出して相関図を作成しました。
- データの収集から解析まで、基本的にPythonです。コードも公開してます。
- 趣味爆発の記事ですが、欅坂46分からなくても(たぶん)楽しめるよ!
解析方法
以下の4つの手順で解析しました。
こちらの解析のコードにGitHubにupしており、以下URLで確認可能です。(ちょっと違うかもですが)
1. ブログを収集
- 公式サイトからスクレイピングすることにより取得
- 収集方法はこちらの記事の通りです。
- qiita.com
- 今回は漢字欅メンバ(卒業メンバを除く18名)の記事のみを対象としました。
- 総記事数は9196件
- 収集した記事の一部です。(Pandas DataFrame)
2. 各メンバのブログ文章から他メンバへの言及を抽出
下の画像のように、各メンバのブログの文章からメンバの名前を抽出します。
ただし、ブログではメンバの名前を愛称で呼ぶことが多いため、通常のMeCab等の形態素解析ツールの辞書ではメンバの言及を抽出することができません。
- 平手友梨奈 -> てち, てちこ, ...
- 渡辺 梨加 -> べりか, ぺー..., など
これを解決するため、Mecabの辞書へメンバの愛称を追加語彙として追加します。
- メンバの愛称はこちらのサイトから拝借しました。
- 欅坂46ブログメンバー呼び名一覧
- MeCabへの語彙の追加は以下の記事の通りです。
- qiita.com
3. 全ブログから言及関係数を集計
- [2. 各メンバのブログ文章から他メンバへの言及を抽出]の処理を全9196件のブログへ適用しました。
fromメンバ toメンバの回数を行列にし、ヒートマップにしました。
ただし、メンバ毎に投稿してる記事の本数が大きくことなるため、そのままの値では、メンバの関係が観測しづらい場合があります。
メンバ毎に記事の本数で正規化(min-max normalization)した場合は、ヒートマップは以下のようになります。これによりメンバ間の関係が観測しやすくなりました。
4. 関係を可視化
- [3. 全ブログから言及関係数を集計]の時点で、見つけたい関係を観測できましたが、より直観的に全体の関係を確認するために、グラフによる可視化を試しました。(格好をつけたかった)
- ノード間エッジ(線)の太さが関係の強さを表しています。
- 可視化のためにツールはCytoscapeを使いました。
- cytoscape.org
解析結果について
欅坂46を応援しているファンが見ると、納得できる結果だとは思います。
何か正確なもの(?)と比較するために、欅坂46の冠バラエティ番組「欅って書けない」の企画で検証されていた相関図と比較してみました。
- 番組相関図にもブログ相関図にもある関係
- 番組相関図にはないが、ブログ相関図にある関係
終わりに
結論
- 簡単な方法ではあったが、1ファンの感覚として腑に落ちる結果が得られた。
- 「織田奈那」「斎藤冬優花」は最重要メンバであり精神的支柱
- 番組の企画の相関図と比較しても割と似ているところが多かった。
今後の課題
- 対象メンバの拡大
- 時系列解析
- 期間毎の言及数の変化に注目し解析を行う
感想
- 好きなデータを弄る趣味解析は超楽しい、データサイエンスはドメインへの愛が1番大事だと思う
- 実際、欅坂46メンバの愛称の語彙を公開してくださっていたサイトがMVP 欅坂46ブログメンバー呼び名一覧
- 日本語NLPは精度の高い辞書を作ることが超大事
- 可視化の部分でカッコよくしたかったのですが、結局大したことができなかったので、ちょっとフロントエンドの部分やデザイン(Infographics)も勉強してみたいと思った。
ツイートデータと見る坂道冠番組 2019/01/28【乃木中、けやかけ、がな推し】
解析方法
- 番組のオンエア中に投稿されたツイートデータを収集しました。
- ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象としました。
- RTは対象としておらず、ツイート数等にに含んでいません。
今週の新規点
乃木坂工事中 #191 (2019/01/28 00:00 ~ 00:30)
各時間のツイート数 (総数: 24991)
最もツイートされた場面
0時22分頃: 北川悠理さん紹介パートでの和田まあやさんのヤバい翻訳
各時間のツイートされたワード
0時 0分 tweet_num:1091 -> keywords: [('さくらちゃん', 86), ('遠藤', 47), ('乃木中', 43), ('4期生', 39), ('4期', 16), ('ドン', 9), ('キター', 9), ('1週間', 9), ('リアタイ', 8), ('乃木坂46', 7)] 0時 1分 tweet_num:986 -> keywords: [('さくらちゃん', 148), ('蕎麦屋', 142), ('遠藤', 127), ('乃木中', 26), ('4期生', 21), ('愛知', 19), ('乃木坂46', 17), ('そば屋', 13), ('田村', 13), ('4期', 13)] 0時 2分 tweet_num:1066 -> keywords: [('みなみ', 201), ('さくらちゃん', 90), ('遠藤', 81), ('設楽', 70), ('蕎麦屋', 67), ('ここじゃないどこか', 48), ('乃木中', 17), ('日村', 12), ('乃木坂46', 11), ('吹奏楽部', 10)] 0時 3分 tweet_num:801 -> keywords: [('みなみ', 95), ('設楽', 49), ('遠藤', 38), ('さくらちゃん', 37), ('ローストビーフ', 23), ('乃木坂46', 19), ('蕎麦屋', 18), ('4期生', 12), ('なお', 12), ('乃木中', 11)] 0時 4分 tweet_num:756 -> keywords: [('設楽', 40), ('みたらし団子', 39), ('さくらちゃん', 30), ('みなみ', 26), ('遠藤', 21), ('トマト', 16), ('乃木坂46', 12), ('まいちゅん', 12), ('乃木中', 11), ('中田', 11)] 0時 5分 tweet_num:704 -> keywords: [('設楽', 132), ('みなみ', 76), ('さくらちゃん', 20), ('遠藤', 19), ('カイザー', 19), ('乃木坂46', 12), ('みたらし団子', 10), ('トマト', 9), ('蕎麦屋', 7), ('ω', 6)] 0時 6分 tweet_num:1090 -> keywords: [('日村', 227), ('あやめ', 78), ('顔芸', 48), ('みなみ', 31), ('遠藤', 30), ('さくらちゃん', 29), ('与田', 25), ('設楽', 24), ('筒井', 21), ('乃木坂46', 16)] 0時 7分 tweet_num:1034 -> keywords: [('与田', 173), ('あやめ', 103), ('筒井', 56), ('日村', 45), ('みなみ', 36), ('申年', 35), ('さくらちゃん', 27), ('遠藤', 25), ('14歳', 17), ('乃木坂46', 15)] 0時 8分 tweet_num:851 -> keywords: [('みなみ', 100), ('あやめ', 86), ('与田', 72), ('14歳', 69), ('飛鳥', 56), ('筒井', 38), ('まあや', 28), ('段の上', 16), ('尾関', 14), ('星野みなみ', 12)] 0時 9分 tweet_num:655 -> keywords: [('tee', 44), ('あやめ', 43), ('与田', 38), ('the alfee', 25), ('筒井', 23), ('みなみ', 22), ('14歳', 19), ('日村', 15), ('東京03', 15), ('乃木坂46', 11)] 0時10分 tweet_num:1090 -> keywords: [('与田', 344), ('スティッチ', 68), ('スティービーワンダー', 61), ('スシロー', 44), ('あやめ', 37), ('tee', 23), ('筒井', 21), ('乃木坂46', 18), ('乃木中', 12), ('14歳', 11)] 0時11分 tweet_num:727 -> keywords: [('与田', 144), ('あやめ', 75), ('スティッチ', 68), ('筒井', 29), ('14歳', 17), ('日村', 11), ('乃木中', 10), ('4期生', 10), ('乃木坂46', 9), ('女子力', 9)] 0時12分 tweet_num:829 -> keywords: [('日村', 100), ('あやめ', 56), ('与田', 44), ('ニット帽', 40), ('筒井', 31), ('飛鳥', 28), ('皆川', 26), ('go', 19), ('14歳', 16), ('4期生', 16)] 0時13分 tweet_num:597 -> keywords: [('あやめ', 51), ('飛鳥', 39), ('与田', 35), ('日村', 31), ('筒井', 26), ('4期生', 20), ('金川', 15), ('みなみ', 15), ('さくらちゃん', 14), ('北川', 14)] 0時14分 tweet_num:791 -> keywords: [('北海道', 129), ('飛鳥', 107), ('金川', 77), ('北海道出身', 41), ('紗耶', 26), ('ななみん', 26), ('17年', 23), ('梅澤', 23), ('乃木中', 17), ('北海道産', 16)] 0時15分 tweet_num:1083 -> keywords: [('飛鳥', 387), ('金川', 38), ('北海道', 36), ('梅ちゃん', 34), ('梅澤', 25), ('あすか', 25), ('紗耶', 22), ('乃木坂46', 17), ('運動音痴', 14), ('北海道出身', 12)] 0時16分 tweet_num:863 -> keywords: [('飛鳥', 391), ('あすか', 28), ('神奈川出身', 25), ('金川', 22), ('北海道', 19), ('運動音痴', 16), ('北海道出身', 16), ('齋藤飛鳥', 15), ('紗耶', 13), ('乃木中', 11)] 0時17分 tweet_num:1089 -> keywords: [('飛鳥', 366), ('コラ', 223), ('そだねー', 119), ('北海道弁', 28), ('あすか', 25), ('金川', 23), ('北海道', 19), ('北海道出身', 15), ('齋藤飛鳥', 14), ('設楽', 13)] 0時18分 tweet_num:553 -> keywords: [('飛鳥', 86), ('コラ', 49), ('梅澤', 23), ('金川', 17), ('梅ちゃん', 16), ('北海道', 15), ('北海道弁', 15), ('そだねー', 14), ('設楽', 10), ('乃木中', 10)] 0時19分 tweet_num:904 -> keywords: [('飛鳥', 102), ('梅ちゃん', 92), ('早口言葉', 67), ('金川', 49), ('梅澤', 48), ('滑舌', 47), ('コラ', 17), ('寿司', 13), ('紗耶', 13), ('北海道', 11)] 0時20分 tweet_num:800 -> keywords: [('飛鳥', 139), ('金川', 69), ('早口言葉', 65), ('梅ちゃん', 57), ('まあや', 48), ('滑舌', 37), ('梅澤', 27), ('紗耶', 19), ('北川', 18), ('コラ', 18)] 0時21分 tweet_num:680 -> keywords: [('北川', 66), ('飛鳥', 50), ('未央奈', 31), ('帰国子女', 28), ('堀', 26), ('早口言葉', 23), ('理々杏', 22), ('アメリカ', 21), ('悠理', 20), ('金川', 19)] 0時22分 tweet_num:1290 -> keywords: [('まあや', 164), ('未央奈', 136), ('堀', 98), ('みお', 45), ('北川', 41), ('パライオ', 41), ('飛鳥', 20), ('悠理', 19), ('帰国子女', 18), ('乃木坂46', 17)] 0時23分 tweet_num:886 -> keywords: [('まあや', 171), ('今でしょ', 44), ('未央奈', 38), ('北川', 37), ('日村', 32), ('堀', 25), ('乃木中', 19), ('まいちゅん', 19), ('悠理', 18), ('乃木坂46', 17)] 0時24分 tweet_num:981 -> keywords: [('堀', 166), ('未央奈', 128), ('りり', 58), ('猫耳', 44), ('理々杏', 38), ('北川', 37), ('みお', 35), ('まあや', 30), ('りりあん', 29), ('キキ', 25)] 0時25分 tweet_num:781 -> keywords: [('日村', 134), ('ヒム', 77), ('ヒム子', 57), ('堀', 35), ('未央奈', 32), ('北川', 20), ('りり', 16), ('みお', 15), ('キキ', 13), ('乃木中', 13)] 0時26分 tweet_num:412 -> keywords: [('日村', 45), ('北川', 36), ('堀', 26), ('未央奈', 25), ('4期生', 23), ('ヒム', 16), ('飛鳥', 14), ('ジコチュー', 13), ('悠理', 12), ('乃木中', 11)] 0時27分 tweet_num:374 -> keywords: [('日村', 37), ('パラパラ漫画', 31), ('北川', 27), ('4期生', 13), ('乃木坂46', 11), ('悠理', 11), ('未央奈', 11), ('飛鳥', 10), ('4期', 8), ('堀', 8)] 0時28分 tweet_num:684 -> keywords: [('日村', 44), ('田村', 40), ('4期生', 33), ('北川', 24), ('真佑', 23), ('ウ○コ', 14), ('パラパラ漫画', 13), ('飛鳥', 12), ('悠理', 11), ('乃木中', 11)] 0時29分 tweet_num:543 -> keywords: [('4期生', 43), ('田村', 40), ('掛橋', 24), ('北川', 24), ('真佑', 24), ('飛鳥', 20), ('4期', 20), ('3週', 17), ('乃木中', 17), ('30分', 14)]
欅って書けない #165 (2019/01/28 00:35 ~ 01:05)
各時間のツイート数 (総数: 8436)
最もツイートされた場面
1時3分頃: 8thシングル「黒い羊」 フォーメーション発表
本編の中だと、回答のためにスタジオの3階まで行かなければならないというハンデを背負わされて泣いちゃった守屋さん
1位 (ツイート数:1045) 土生瑞穂
ボケ回答連発の土生さんが堂々の1位。クレイジー、土生ワールド、無双などが頻出
2位 (ツイート数:959) 鈴本美愉
可愛い表情が目立った鈴本さんが2位。...『おしっこ』
3位 (ツイート数:808) 守屋茜
今回の企画の主役である守屋さんが3位。ジャージ、可哀想、軍曹などが頻出
各時間のツイートされたワード
0時35分 tweet_num:253 -> keywords: ['ジャージ', 'あかね', 'けやかけ', '守屋', '宮城', '欅坂46', 'ガチ', '1人', '守屋茜', 'リアタイ'] 0時36分 tweet_num:266 -> keywords: ['ジャージ', 'あかね', '守屋', '1人', '戦闘服', 'ガチ', '宮城', 'けやかけ', '欅坂46', '4人'] 0時37分 tweet_num:302 -> keywords: ['あかね', 'けやかけ', '守屋', '笹かま', '宮城', '4人', 'ジャージ', '欅坂46', '1人', 'mc'] 0時38分 tweet_num:302 -> keywords: ['土生', 'もん', '顔芸', '守屋', '伊達政宗', '宮城', '笹かま', '欅坂46', 'けやかけ', 'あかね'] 0時39分 tweet_num:315 -> keywords: ['土生', 'けやかけ', '伊達政宗', 'もん', '宮城', '欅坂46', 'あかね', '#tvtokyo', '鈴本', '土生瑞穂'] 0時40分 tweet_num:235 -> keywords: ['土生', 'あかね', '守屋', '欅坂46', '石森', '伊達政宗', 'けやかけ', '宮城', 'もん', '土生瑞穂'] 0時41分 tweet_num:238 -> keywords: ['もん', 'あかね', 'スナフキン', 'けやかけ', 'タケちゃんマン', '土生', '欅坂46', '石森', '伊達政宗', '守屋'] 0時42分 tweet_num:239 -> keywords: ['土生', '伊達政宗', 'けやかけ', '欅坂46', 'ニット帽', '宮城', 'もん', 'ちびまる子ちゃん', '守屋', 'みい'] 0時43分 tweet_num:145 -> keywords: ['土生', '伊達政宗', '宮城', 'あかね', 'けやかけ', '守屋', '欅坂46', 'ニット帽', '土生瑞穂', '共和国'] 0時44分 tweet_num:272 -> keywords: ['土生', '宮城', 'けやかけ', '欅坂46', '土生瑞穂', '頭の回転', 'こち星', 'あかね', 'ω', '#tvtokyo'] 0時45分 tweet_num:251 -> keywords: ['土生', '宮城', '群馬', 'けやかけ', '欅坂46', '土生瑞穂', 'むーちゃん', 'こち星', '上村莉菜', '上村'] 0時46分 tweet_num:404 -> keywords: ['3階', 'あかね', '守屋', '土生', '欅坂46', 'けやかけ', '宮城', '1階', '泣かないで', '涙'] 0時47分 tweet_num:365 -> keywords: ['守屋', 'あかね', 'むすび丸', '欅坂46', '茜', '宮城', '涙', 'けやかけ', '守屋茜', 'もん'] 0時48分 tweet_num:285 -> keywords: ['あかね', '守屋', 'けやかけ', '欅坂46', 'むすび丸', '長濱ねる', '茜', '3階', '守谷', '守屋茜'] 0時49分 tweet_num:375 -> keywords: ['もん', '鈴本', '守屋', 'けやかけ', 'ション', '澤部', '欅坂46', '下ネタ', 'ばかちん', '嬉'] 0時50分 tweet_num:294 -> keywords: ['もん', 'ばかちん', 'けやかけ', '守屋', '鈴本', '金八先生', 'あかね', '鈴本美愉', '欅坂46', '美'] 0時51分 tweet_num:220 -> keywords: ['女子力', 'もん', 'グロス', '欅坂46', 'ばかちん', '理佐', 'クロちゃん', '守屋', 'おだ', 'なな'] 0時52分 tweet_num:213 -> keywords: ['理佐', 'りか', '欅坂46', '石森', '梨加', 'りさ', 'けやかけ', '女子力', '渡辺梨加', 'もん'] 0時53分 tweet_num:217 -> keywords: ['土生', 'けやかけ', '欅坂46', '石森', 'もん', '守屋', '愛子', 'フォーメーション', '仙山線', '理佐'] 0時54分 tweet_num:158 -> keywords: ['土生', 'けやかけ', 'usa', '欅坂46', '宮城', 'あかね', '守屋茜', '愛子東', 'もん', '渡辺梨加'] 0時55分 tweet_num:168 -> keywords: ['土生', 'けやかけ', 'usa', '欅坂46', '宮城', 'オダ', 'もん', '愛子', '尾関', '#tvtokyo'] 0時56分 tweet_num:284 -> keywords: ['土生', 'オダ', 'けやかけ', '下ネタ', '土生瑞穂', 'usa', '欅坂46', 'おだ', '???', '織田'] 0時57分 tweet_num:145 -> keywords: ['土生', 'オダ', '欅坂46', '土生瑞穂', 'けやかけ', 'u.', 'むーちゃん', '羽生', '澤部', 'ヤバい'] 0時58分 tweet_num:173 -> keywords: ['土生', '欅坂46', '渡辺梨加', 'けやかけ', 'usa', '守屋', '石森', 'むーちゃん', '梨加', 'ベリカ'] 0時59分 tweet_num:164 -> keywords: ['ウザ', '土生', 'けやかけ', 'もん', 'ウザイ', '欅坂46', '織田', 'お餅', 'dis', 'りさ'] 1時 0分 tweet_num:324 -> keywords: ['お餅', '澤部', 'もん', 'けやかけ', 'スーパーボール', 'ウザ', '欅坂46', '土生', 'おもち', '織田奈那'] 1時 1分 tweet_num:315 -> keywords: ['フォーメーション', 'スーパーボール', 'けやかけ', 'お餅', '選抜発表', '澤部', '菅井', '欅坂46', '神回', '土生'] 1時 2分 tweet_num:504 -> keywords: ['フォーメーション', '3列目', '選抜発表', 'もん', '鈴本', '三列目', 'けやかけ', '欅坂46', 'てち', '8t'] 1時 3分 tweet_num:598 -> keywords: ['てち', 'フォーメーション', '3列目', 'しーちゃん', 'もん', '欅坂46', 'みい', '平手', '鈴本', 'けやかけ'] 1時 4分 tweet_num:412 -> keywords: ['フォーメーション', 'てち', '3列目', 'しーちゃん', '欅坂46', 'もん', '8t', '三列目', '鈴本', '2列目']
ひらがな推し #41 (2019/01/28 01:05 ~ 01:35)
各時間のツイート数 (総数: 7600)
最もツイートされた場面
1時17分頃: ニブモネア、埼玉ギャグでの金村美玖さんのコバトン
(他も接戦だったので、それらの中でも個人的MVPを)
MCオードリー若林さんが斉藤京子さんの「居心地悪く、大人になった」を知っていた場面
各時間のツイートされたワード
1時 5分 tweet_num:329 -> keywords: [('ちゅどーん', 33), ('ちゅ', 6), ('ひなの', 5), ('ひらがな', 5), ('けやき坂46', 4), ('きょん', 4), ('1週間', 3), ('菜緒', 3), ('ツインテール', 3), ('一週間', 2)] 1時 6分 tweet_num:230 -> keywords: [('井口', 18), ('丹生', 14), ('ツインテール', 13), ('さんま御殿', 8), ('ちゅどーん', 7), ('よろしくお願いします', 7), ('さんま', 7), ('けやき坂46', 5), ('若林', 3), ('ひらがなけやき', 3)] 1時 7分 tweet_num:342 -> keywords: [('きょん', 19), ('サンド', 19), ('サンドウィッチマン', 15), ('春日', 13), ('けやき坂46', 8), ('オードリー', 7), ('keyabingo', 6), ('三角関係', 5), ('ウッチャン', 4), ('さんま', 4)] 1時 8分 tweet_num:258 -> keywords: [('エアリー', 32), ('きょん', 10), ('春日', 9), ('小坂菜緒', 7), ('けやき坂46', 7), ('ガヤ', 5), ('サンドウィッチマン', 5), ('サンド', 5), ('ひらがな', 5), ('オードリー', 5)] 1時 9分 tweet_num:300 -> keywords: [('キモ', 58), ('エアリー', 16), ('中邑真輔', 14), ('春日', 13), ('若林', 11), ('中邑', 9), ('けやき坂46', 8), ('林先生', 8), ('ひよ', 7), ('真輔', 7)] 1時10分 tweet_num:235 -> keywords: [('キモ', 41), ('エアリー', 18), ('フレディ', 15), ('中邑真輔', 13), ('若林', 12), ('中邑', 10), ('林先生', 10), ('春日', 6), ('真輔', 6), ('けやき坂46', 5)] 1時11分 tweet_num:244 -> keywords: [('三菱', 37), ('キモ', 20), ('若林', 17), ('中邑真輔', 13), ('ニク', 9), ('中邑', 7), ('井口', 7), ('エアリー', 6), ('入場曲', 5), ('濱岸', 4)] 1時12分 tweet_num:343 -> keywords: [('若林', 75), ('井口', 33), ('春日', 31), ('久美', 13), ('けやき坂46', 7), ('ひらがなけやき', 7), ('キモ', 5), ('#tvtokyo', 4), ('中邑真輔', 4), ('おたけ', 4)] 1時13分 tweet_num:290 -> keywords: [('若林', 59), ('春日', 27), ('久美', 18), ('井口', 14), ('ドッグカフェ', 8), ('佐々木久美', 7), ('むつみ', 7), ('きくちゃん', 6), ('所沢', 6), ('けやき坂46', 5)] 1時14分 tweet_num:205 -> keywords: [('ザキヤマ', 57), ('若林', 17), ('久美', 15), ('オードリー', 11), ('所沢', 9), ('スクール革命', 7), ('けやき坂46', 7), ('春日', 6), ('佐々木久美', 6), ('クミ', 4)] 1時15分 tweet_num:218 -> keywords: [('若林', 32), ('丹生', 30), ('ザキヤマ', 13), ('けやき坂46', 11), ('イロモネア', 8), ('埼玉', 7), ('春日', 6), ('#tvtokyo', 6), ('ひらがなけやき', 5), ('久美', 4)] 1時16分 tweet_num:286 -> keywords: [('丹生', 45), ('コバトン', 32), ('埼玉', 12), ('若林', 12), ('ローラ', 10), ('瞬', 7), ('けやき坂46', 6), ('イロモネア', 6), ('ザキヤマ', 5), ('おすし', 5)] 1時17分 tweet_num:364 -> keywords: [('コバトン', 95), ('丹生', 44), ('埼玉', 20), ('瞬', 18), ('埼玉県民', 11), ('若林', 11), ('おすし', 9), ('美玖', 9), ('けやき坂46', 6), ('きょん', 6)] 1時18分 tweet_num:226 -> keywords: [('コバトン', 25), ('きょん', 19), ('丹生', 14), ('若林', 12), ('けやき坂46', 10), ('小坂菜緒', 9), ('小坂', 8), ('齊藤京子', 7), ('菜緒', 7), ('西野七瀬', 6)] 1時19分 tweet_num:207 -> keywords: [('丹生', 24), ('きょん', 15), ('小坂', 8), ('ヒョウモントカゲモドキ', 7), ('まな', 7), ('けやき坂46', 6), ('コバトン', 6), ('埼玉', 5), ('レオパ', 5), ('小坂菜緒', 5)] 1時20分 tweet_num:250 -> keywords: [('丹生', 38), ('まな', 22), ('きょん', 17), ('ドン引き', 16), ('けやき坂46', 9), ('ひらがなけやき', 6), ('ヒョウモントカゲモドキ', 5), ('小坂', 5), ('ぱん', 5), ('小坂菜緒', 5)] 1時21分 tweet_num:212 -> keywords: [('丹生', 36), ('けやき坂46', 11), ('このちゃん', 11), ('キモ', 8), ('松田', 6), ('イントロ', 6), ('ひらがなけやき', 5), ('若林', 5), ('きょん', 4), ('このか', 4)] 1時22分 tweet_num:285 -> keywords: [('イントロ', 45), ('オードリー', 15), ('このちゃん', 8), ('松田', 7), ('丹生', 5), ('若林', 5), ('けやき坂46', 5), ('2人', 5), ('激おこ', 5), ('ひらがな', 4)] 1時23分 tweet_num:268 -> keywords: [('ジョイマン', 36), ('若林', 31), ('イントロ', 17), ('オードリー', 17), ('ひらがな', 15), ('けやき坂46', 10), ('松田', 9), ('このちゃん', 7), ('ひらがなけやき', 6), ('小坂菜緒', 4)] 1時24分 tweet_num:337 -> keywords: [('若林', 79), ('オードリー', 24), ('きょん', 11), ('ひらがな', 10), ('love', 9), ('春日', 8), ('けやき坂46', 7), ('ジョイマン', 7), ('イントロ', 7), ('ソロ曲', 4)] 1時25分 tweet_num:227 -> keywords: [('若林', 49), ('オードリー', 15), ('ひらがな', 9), ('きょん', 7), ('ちゃる', 7), ('イントロ', 6), ('ひらがなけやき', 5), ('けやき坂46', 5), ('めいちゃん', 5), ('love', 4)] 1時26分 tweet_num:203 -> keywords: [('春日', 22), ('若林', 12), ('めいちゃん', 10), ('逃走中', 10), ('ひらがな', 8), ('けやき坂46', 8), ('きょん', 7), ('ひらがなけやき', 6), ('オードリー', 6), ('ちゃる', 5)] 1時27分 tweet_num:202 -> keywords: [('春日', 9), ('けやき坂46', 7), ('きょん', 4), ('芽依', 3), ('逃走中', 3), ('#tvtokyo', 3), ('若林', 3), ('誰だ', 3), ('絵面', 3), ('ひらがなけやき', 3)] 1時28分 tweet_num:223 -> keywords: [('春日', 19), ('宮田愛', 17), ('まな', 13), ('富田', 8), ('けやき坂46', 6), ('萌', 5), ('愛萌', 5), ('ひらがな', 5), ('めいちゃん', 4), ('宮田', 4)] 1時29分 tweet_num:120 -> keywords: [('春日', 15), ('宮田愛', 6), ('きょん', 5), ('ひらがな', 5), ('逃走中', 4), ('若林', 4), ('乃木坂工事中', 4), ('オードリー', 4), ('けやき坂46', 3), ('パリピ', 3)] 1時30分 tweet_num:272 -> keywords: [('ひなの', 106), ('ひらがな', 15), ('ひなのちゃん', 12), ('このちゃん', 10), ('春日', 7), ('宮田愛', 5), ('松田', 5), ('上村', 5), ('オードリー', 4), ('ひらがなけやき', 4)] 1時31分 tweet_num:266 -> keywords: [('ひなの', 115), ('ひなのちゃん', 21), ('上村', 20), ('ひらがな', 18), ('春日', 10), ('けやき坂46', 9), ('松田', 8), ('オードリー', 6), ('なのなの', 6), ('このちゃん', 5)] 1時32分 tweet_num:127 -> keywords: [('ひなの', 54), ('上村', 10), ('ひなのちゃん', 8), ('ひらがな', 8), ('けやき坂46', 6), ('3期生', 4), ('ひらがなけやき', 3), ('3期', 3), ('な!', 3), ('春日', 3)] 1時33分 tweet_num:322 -> keywords: [('ひなの', 93), ('ひなのちゃん', 34), ('上村', 26), ('ひらがな', 22), ('お小遣い', 14), ('1人', 7), ('3期生', 6), ('けやき坂46', 6), ('乃木坂工事中', 5), ('春日', 5)] 1時34分 tweet_num:209 -> keywords: [('ひなの', 56), ('ひなのちゃん', 18), ('上村', 17), ('ひらがな', 11), ('神回', 10), ('お小遣い', 9), ('武道館', 6), ('乃木坂工事中', 6), ('けやき坂46', 5), ('ドッキリ', 5)]
「NeurIPS2018読み会@PFN」に参加した
はじめに
- 2019/01/26に「NeurIPS2018読み会@PFN」を聴講した
- ので、発表スライド等をまとめながらメモ書きをする
全体感想
NeurIPS2018読み会@PFNを聴講してきました。
— まうん (@myaunraitau) 2019年1月26日
約6時間と長丁場で、頭が疲れたのよく眠れそう。近年のトレンドとそれに対して自分の不勉強な部分が如実に分かってとてもよかった。 #neurips18yomi
- 正直、全体的にちゃんと理論の詳細まで理解できました!みたいなものは少なくて、抽象的な内容や論文のコンセプトがなるほど~と思える程度のものが多かったが、それでも学びは大きかった。
- 中でも、特に「GAN」「強化学習」「GNN (Graph Neural Network)」周りは分からなかったけど、興味を持ったので色々調べて使ってみたい。
テーマ発表1 濱田晃一(DeNA)
- 発表タイトル: "Generative Adversarial Networks and Disentangled Representations @ NeurIPS2018"
- 資料: https://www.slideshare.net/hamadakoichi/gans-disentangled-representations
- メモ
- NeurIPS2018では、「GAN」を主テーマとして含む論文の本数が60本超どんどん増えている(2014:1 -> 2015:1 -> 2016:6 -> 2017->34)
- NeurIPS2018では、生成品質を向上するだけが貢献だけの論文は1本も無く、他の複雑性を説くような課題へ進んでいる
論文紹介1 竹中誠(首都大)
- "On the Dimensionality of Word Embedding"
- 資料: https://www.slideshare.net/MacotoTachenaca/neurips2018pfn-on-the-dimensionality-of-word-embedding
- メモ
- 分散表現の次元数に最適値が存在することを示したらしい
- LSA, Skip-gram, Gloveで実験した
論文紹介2 木村優志(Convergence Lab.)
- "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base"
- 資料: https://speakerdeck.com/mssmkmr/neurips2018du-mihui-at-pfn-dialog-to-action-conversational-question-answering-over-a-large-scale-knowledge-base
論文紹介3 大野健太(PFN)
- "Minimax statistical learning with Wasserstein distances"
- 資料: ?
論文紹介4 岡本大和(オムロン)
- "A Unified Feature Disentangler for Multi-Domain Image Translation and Manipulation"
- 資料: https://www.slideshare.net/yamatookamoto5/neurips2018pfn-a-unified-feature-disentangler-for-multi-domain-image-translation-and-manipulation
テーマ発表2 佐野正太郎(PFN)
- "Automatic Machine Learning @ NeurIPS2018"
- 資料: https://www.slideshare.net/shotarosano5/automl-in-neurips-2018
- メモ
- テーマ的によくわからないかな、と思っていたが非同期SHAの説明が分かりやすくて面白かった
- Optunaにも導入されたらしい
テーマ発表3 亀澤諒亮(DeNA)
- "Neural Networks for Graph Data @ NeurIPS2018"
- 資料: https://www.slideshare.net/emakryo/neural-networks-for-graph-data-neurips2018pfn
- メモ
- CNNにおけるプーリングを、GNNにおいてグラフのソフトクラスタリングとして定義する研究(DIFFPOOL)
- GNNの応用が次の焦点になる
- グラフ生成の応用例として、分子生成(化合物のグラフ構造)があってなるほどとなった
論文紹介6 大元司(ドワンゴ)
- "CatBoost: unbiased boosting with categorical features"
- 資料: https://niconare.nicovideo.jp/watch/kn3831
- メモ
- 新規点がとても分かりやすかった。
- Ordered TSによるカテゴリカルデータの前処理の改善
- Ordered boostingによるブースティングアルゴリズムの改善
論文紹介7 田中潤(ShannonLab)
- "Neural Ordinary Differential Equations"
- 資料: ?
論文紹介8 上月正貴(crcrpar)
- "Sanity Checks for Saliency Maps"
- 資料: https://speakerdeck.com/crcrpar/sanity-checks-for-saliency-maps-explained-in-japanese-language
論文紹介5 白川達也(ABEJA)
- "Hyperbolic Neural Network"
- 資料: https://www.slideshare.net/daynap1204/hyperbolic-neural-networks
論文紹介9 三原千尋 (発表キャンセルでしたがスライドあり)
- "Deep State Space Models for Time Series Forecasting"
- 資料: https://www.slideshare.net/ChihiroKusunoki/deep-state-space-models-for-time-series-forecasting-129296435
- メモ
- モデルの判断根拠推定手法のうちSaliency Methodsにおける課題の検証
- 課題: 手法の正当性を評価する方法が未確立、見た目での検証は確証バイアスに影響される
テーマ発表4 甲野佑(DeNA)
- Reinforcement Learning @ NeurIPS2018
- 資料: https://www.slideshare.net/yukono1/reinforcement-learning-neurips2018
テーマ発表5 比戸将平(PFN)
- Modeling the Physical World @ NeurIPS2018
- 資料: ?
ツイートで見る 「欅坂46 8thシングル 黒い羊 解禁」
ラジオ初解禁時のツイート数推移
以下のハッシュタグでのツイート数の推移を確認
- "#SOL" ... 楽曲の初解禁をしたラジオ番組SCHOOL OF LOCK!のタグ
- "#黒い羊"
- "#欅坂46"
"#SOL"のハッシュタグは、平手友梨奈さんの登場と「そろそろ来るか...」みたいな反応で早い段階で盛り上がっています。
"#黒い羊"・"#欅坂46"は、ラジオでの解禁後も長く盛り上がっており、拡散された楽曲を聞いてぞくぞくとファン達が楽曲の感想をツイートしています。
#SOL
#黒い羊
#欅坂46
みんなの感想をまとめてみる
1. WordCloud
- 2019/01/21 22:30 ~ 2019/01/21 23:59の間に"#黒い羊"が付与されたツイート
- 名詞と形容詞のみ使用
特徴
- 「神曲」「最高」「好き」などポジティブな感想が多い
- 「エキセントリック」「避雷針」などの楽曲を思い起こす?
- 「鳥肌」「感情」「エモい」など感情を揺さぶられた的な感想が多い?