myaun’s blog

ツイートデータと見る坂道冠番組 2019/02/04【乃木中、けやかけ、がな推し】

はじめに

乃木坂46欅坂46けやき坂46冠番組へのツイートを使って簡単な解析をしました。

  • 番組のオンエア中に投稿されたツイートデータを収集しました。
  • ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象としました。
  • RTは対象としておらず、ツイート数等にに含んでいません。

乃木坂工事中 #192 (2019/02/04 00:00 ~ 00:30)

総ツイート数: 24604

f:id:myaun:20190205002900p:plain

欅って書けない #166 (2019/02/04 00:35 ~ 01:05)

総ツイート数: 8033

f:id:myaun:20190205002928p:plain

ひらがな推し #42 (2019/02/04 01:05 ~ 01:35)

総ツイート数: 8798

f:id:myaun:20190205002944p:plain

乃木坂46・欅坂46・けやき坂46のブログから単語分散表現を学習

1. はじめに

特定ドメインのテキストから単語分散表現を学習することに興味があったので実験しました。

今回実施した内容

  • 乃木坂46欅坂46けやき坂46のブログを収集してテキストへ前処理をする
  • fastTextにより収集したブログのテキストから単語分散表現を学習する
  • 学習した単語分散表現による類似単語の検索や2次元空間へのプロットの結果を確認する

2. 単語分散表現とは

単語分散表現は、文書から学習される単語の意味を表すベクトルです。 学習されたベクトルが「“King” – “Man” + “Woman” = “Queen”」のような足し算、引き算ができることで話題になりました。 この話題になったミコロフの論文が発表されたのは2013年でした。そこから早6年、学術領域でその方法論や応用が盛んに議論されております。*1

fastText

今回採用したfastTextは、Facebookにより提案された分散表現の学習手法の1つです。 こちらの手法は、Subword modelというモデルを組み込むことにより、出現単語の文脈のみでな字面の類似性を考慮することを可能とします。 *2

以下の記事の解説がとても分かりやすいです。

3. Fasttextによる学習

実装コード

言語: Python
使用ライブラリ: Mecab, gensim, neologdnなど
GitHubリポジトリ: github.com

3-1. 学習データについて

収集した記事について

使用した記事数は以下の通りです。

ブログの収集方法はこちらの記事の通りです。

qiita.com

前処理

上の処理を順番に実施しました。詳細はコードで確認できます。
ただこちらにも書いていますが、良い方法である自信はありません。

3-2. 学習方法

gensimを使って以下のよう学習しました。

# learn fasttext

from gensim.models import FastText

model = FastText(size=100, sg=1, workers=4, window=10, min_count=10)
model.build_vocab(sentences)
model.train(sentences, total_examples=model.corpus_count, epochs=model.epochs)

パラメータはかなり適当です。

3-3. 学習した単語分散表現の確認

類似単語の検索

学習した分散表現が類似する単語を探索すると、下のような結果になりました。

model.wv.most_similar("てち")
---
[('友梨奈', 0.7058396935462952),
 ('平手友梨奈', 0.6936807036399841),
 ('平手', 0.6837375164031982),
 ('波布茶', 0.6804182529449463),
 ('ゆう', 0.6743236780166626),
 ('ネル', 0.6728752255439758),
 ('鈴本', 0.6586591005325317),
 ('理佐', 0.645741879940033),
 ('まなか', 0.6427689790725708),
 ('あかね', 0.6317785978317261)]

model.wv.most_similar("キャプテン")
---
[('キャプ', 0.7702136039733887),
 ('暫定', 0.6804853677749634),
 ('就任', 0.6307018399238586),
 ('正式', 0.6078504323959351),
 ('れいか', 0.6019401550292969),
 ('桜井', 0.557970404624939),
 ('大役', 0.5572315454483032),
 ('任命', 0.5523629188537598),
 ('責任感', 0.5509008169174194),
 ('頼り', 0.5480058193206787)]

model.wv.most_similar("佐々木久美")
---
[('佐々木希', 0.7091835737228394),
 ('加藤史帆', 0.6711205244064331),
 ('東村', 0.644331693649292),
 ('佐々木', 0.6436366438865662),
 ('柿崎芽実', 0.6401069760322571),
 ('東村芽依', 0.639634907245636),
 ('佐々木美玲', 0.6213143467903137),
 ('久美', 0.6100345849990845),
 ('きくちゃん', 0.5945029258728027),
 ('柿崎', 0.5900822281837463)]
  • 「てち」は「平手友梨奈」の愛称であり、「平手」や「友梨奈」と共に上位に含まれている。
  • 「キャプテン」のことを乃木坂メンバは同義後として「キャプ」と呼ぶこともある。また、乃木坂46のキャプテンである桜井玲香を表す「桜井」「れいか」が含まれている。一方で、欅坂46, けやき坂46のキャプテンは含まれていなかった。
  • 「佐々木久美」の愛称「久美」「きくちゃん」が含まれいる。「佐々木希」は字面の類似性に引っ張られたと思われる。

メンバおよび番組MCを2次元空間へプロット

以下の図は、各人物名の分散表現をTSNEにより2次元へ次元削減したものです。

f:id:myaun:20190204182535p:plain

  • 各グループ毎と番組MCにうまく分離されており、分散表現がそれぞれの所属グループの情報を含んでいることが確認できる。
    • また、乃木坂46の1, 2, 3期やけやき坂の1, 2期もうまく分かれている

4. 終わりに

確認方法は、人物名など特定の単語のみでしたが、それなりにうまく学習できたかなという風に考えています。

ただ、やっていていこれでいいのかなと思うところもいくつかありました。

気になった点

  • 前処理について

    • 上述のように学習前のテキストへ前処理を行いましたが、やり方は自信が無いです。調査不足ではありますが、日本語の分散表現の学習で前処理がどの程度必要なのかが分かりませんでした。いくつかの記事では日本語Wikipediaから学習するとき、分かち書きだけしたもので学習してたようでしたが、それはWikipediaがある程度綺麗な文書だからなのか?など、結構疑問がありました。
  • 学習時のパラメータについて

    • これらは評価指標を定義して、ある程度実験的に探索する必要があるとは思いますが、今回のような特定ドメインに対して実施するときのコツとかあれば知りたい。
    • 次元数と考慮するサブワードの範囲が最も重要であるとFasttextのドキュメントに書かれていました。
      • fasttext.cc
      • The most important parameters of the model are its dimension and the range of size for the subwords. The dimension (dim) controls the size of the vectors, the larger they are the more information they can capture but requires more data to be learned. But, if they are too large, they are harder and slower to train. By default, we use 100 dimensions, but any value in the 100-300 range is as popular. The subwords are all the substrings contained in a word between the minimum size (minn) and the maximal size (maxn)

今後の課題

今後は以下の点を検証したいと思っています。

  • 学習した単語分散表現を応用

    • 学習した分散表現を用いてツイートやブログ記事の特徴量を表現して、分類やクラスタリングなどの応用タスクの実験をしたいと思っています。できれば良い感じの定量評価方法を定義できるものにしたいなと考えています。
  • 学習データの追加

    • 今回使ったブログ記事の数ってデータ量的にどうなんですかね。少なそうかもですが、特定ドメインのための分散表現としては十分だったりするかもと思ったりもしたので検証したいです。
    • 同じドメインのツイートデータ等は収集可能なのですが、ブログに比べて少しノイジーな感じがするので、一緒に学習しても大丈夫か試してみたいです。
  • 他の学習方法との比較

    • 記事が長くなりすぎるのが嫌だったので(定量的な比較もできないし)、本記事では行いませんでしたがword2vec(cbow, skip-gram)やGloveなど代表的な方法と比較してみたかったです。
    • また、以下の記事でも紹介されているSCDV(Sparse Composite Document Vectors)も試したいと思っています。上述の応用の精度向上に貢献しそうな気がします。文書ベクトルの算出に「ソフトクラスタリングに基づく単語のトピック」と「TFIDFにおけるIDF値」を考慮することがメインコンセプト?
    • qiita.com

*1:先日話題になっていたMLタスクの論文・コードがまとめられたサイトpaperswithcodeでは「179 papers with code」が登録されていました。

*2:日本語の分散表現を学習している記事がいくつかあり、その辺も安心感があったのでこちらを採用しました。

僕が欅坂46に急激に好きになるまでの経緯

はじめに

2018年11月頃から現在までに、僕は欅坂46けやき坂46(ひらがなけやき)に急激にハマりました。 その間、どんなコンテンツを浴びて、どのような感想を抱き、このグループのファンになったかを辿ります。 *1

以下では、今でも思い出せる印象に残っているタイミングに注目して振り返ります。

背景 (欅坂46を好きになる前)

▼ 2018/11 YouTube Musicで欅坂46を聞きまくる

下記のツイートをしている2018年11月中旬にYouTube Premiumが開始し、それに登録し、副産物的にYouTube Musicが利用可能となり色んな楽曲が聴き放題になり、色々聴くようになりました。

その中で、前からちょろっと知っていた欅坂46の楽曲も聴いてみました。
抱いた感想1: 曲めちゃめちゃかっこいい!好き!

YouTube Musicの「プレイリスト・欅坂46」では下の画像のようにシングル表題曲が最初に再生されるので超豪華な並びになります。

特に、僕は最新であったシングルの「アンビバレント」が印象に残っていました。下の歌詞が社会人なりたての自分にめちゃくちゃ刺さった。

あっちを立てる気もないし こっちを立てる気だってまるでない 人間関係面倒で及び腰 話を聞けば巻き込まれる いいことなんかあるわけないじゃない それでも誰かがいなけりゃダメなんだ

▼ 2018/11 「アンビバレント」のミュージックビデオ

上のようにYouTube Musicを通して、「アンビバレント」が好きになります。 気になる要因の1つにYouTube Musicのプレイリストの再生画面に表示される↓の画像がかっこよすぎるというのもありました。

f:id:myaun:20190115004607p:plain

そして、満を持して「アンビバレント」のミュージックビデオを見ました。

抱いた感想2: ダンス好き!衣装好き!平手さんと高身長超美人コンビがヤバい!
高身長超美人コンビとは、土生瑞穂さん、渡邉理佐さんです。髪が明るめで衣装似合いすぎで神!って感じでした。

今でもアンビバレントのMVが1番好きなのです。その思いは別途記事にしたいほど長くなるので略。

▼ 2018/12 風邪中に「欅って書けない」等の動画を見まくる。

僕は病気になったり精神的に弱るとアイドルの動画を見る癖があります。それで風邪になってYouTube等で沢山動画を見ました。 ※ テレビ東京さんごめんなさい。今は、毎週録画して見てるので許して下さい。

抱いた感想3: 人間臭くて好き!

特に、以下の場面の人間臭さが印象に残っています。

  • 相関図の回で、斎藤ふーちゃんがぺーを好きって話で泣いちゃう尾関
  • 運動会で負けたときのの守屋あかねん(守屋の泣く回は全部好き、「破っていいですか」とか)
  • 織田奈那の「女としてみてないじゃん」

▼ 2019/01 「欅共和国2017」買う。見る。泣く。

当然の流れで購入しました。欅坂46はこれしか映像作品を販売しておらず、故に迷いなく名盤のみ購入できました。(そういう戦略かもしれない)

抱いた感想4: 圧倒的な多幸感!好き!

本作品の色んなところで泣きましたが、「世界には愛しかない」が最も泣きました。 理由は分からないですが、たぶん圧倒的な多幸感にエモが揺さぶられたと思われます。

▼ 2019/01 ファンクラブ入会。メッセージアプリを登録する。

ここまでBlu-ray以外無課金でしたが、ここから半永久定額課金生活が始まります。 宗教上の理由で握手会には行かないと思うので、僕の課金チャンスはこれらがメインです。ライブは行ってみたいと思っています。

抱いた感想5 完全な沼。ここから先は危険かもしれない。

最近読んだ記事でファンの人の良い言葉がありました。「確かに」と思いました。

月6000円で毎日ハッピーなら実質的無料だよ keyakizaka46matomemory.net

現在

欅坂46 > 仕事 > 他の趣味の状態。頭の中の時計での1週間は「欅って書けない」の日曜日深夜を基準に測られている状態です。

社会人になって初めて仕事があって良かったと思いました。仕事があるおかげで、ハマりながらもなんだかんだちゃんとした生活を送れています。無かったら、完全に時間の使い方が欅坂に支配されていた可能性があります。

終わりに

他のファンのハマったきっかけが分からないですが、結構典型的なパターンなのかなと思っています。

アイドルにハマって、飽きるのは刹那的なもの(アイドル自体が刹那的ですが)なので、今思ったことを書いておきたいと思って書きました。

*1:ガチ日記、ガチポエムなので、変わり者以外は読むだけ時間の無駄です

ブログ解析による欅坂46メンバの相関図作成

はじめに

  • 欅坂46メンバの公式ブログを解析し、メンバ間の関係を抽出して相関図を作成しました。
  • データの収集から解析まで、基本的にPythonです。コードも公開してます。
  • 趣味爆発の記事ですが、欅坂46分からなくても(たぶん)楽しめるよ!

解析方法

以下の4つの手順で解析しました。

こちらの解析のコードにGitHubにupしており、以下URLで確認可能です。(ちょっと違うかもですが)

github.com

1. ブログを収集

  • 公式サイトからスクレイピングすることにより取得
    • 収集方法はこちらの記事の通りです。
    • qiita.com
  • 今回は漢字欅メンバ(卒業メンバを除く18名)の記事のみを対象としました。
    • 総記事数は9196件
    • 収集した記事の一部です。(Pandas DataFrame)
    • f:id:myaun:20190130013406p:plain

2. 各メンバのブログ文章から他メンバへの言及を抽出

  • 下の画像のように、各メンバのブログの文章からメンバの名前を抽出します。

    • f:id:myaun:20190130011404j:plain
  • ただし、ブログではメンバの名前を愛称で呼ぶことが多いため、通常のMeCab等の形態素解析ツールの辞書ではメンバの言及を抽出することができません。

    • 平手友梨奈 -> てち, てちこ, ...
    • 渡辺 梨加 -> べりか, ぺー..., など
  • これを解決するため、Mecabの辞書へメンバの愛称を追加語彙として追加します。

3. 全ブログから言及関係数を集計

  • [2. 各メンバのブログ文章から他メンバへの言及を抽出]の処理を全9196件のブログへ適用しました。
  • fromメンバ toメンバの回数を行列にし、ヒートマップにしました。

    • f:id:myaun:20190129233306p:plain
  • ただし、メンバ毎に投稿してる記事の本数が大きくことなるため、そのままの値では、メンバの関係が観測しづらい場合があります。

    • f:id:myaun:20190129233745p:plain
  • メンバ毎に記事の本数で正規化(min-max normalization)した場合は、ヒートマップは以下のようになります。これによりメンバ間の関係が観測しやすくなりました。

    • f:id:myaun:20190129234051p:plain

4. 関係を可視化

  • [3. 全ブログから言及関係数を集計]の時点で、見つけたい関係を観測できましたが、より直観的に全体の関係を確認するために、グラフによる可視化を試しました。(格好をつけたかった)
    • ノード間エッジ(線)の太さが関係の強さを表しています。
    • f:id:myaun:20190129234951p:plain
    • 可視化のためにツールはCytoscapeを使いました。
    • cytoscape.org

解析結果について

  • 欅坂46を応援しているファンが見ると、納得できる結果だとは思います。

    • 個人的には、「織田奈那」さんが最も多くのメンバから言及されていて、「斎藤冬優花」さんが最も多くのメンバについて満遍なく沢山言及しているというのが、とても腑に落ちた。
      • 「織田奈那」さんは、バラエティ番組等でよく弄られる愛されキャラ
      • 斎藤冬優花」さんは、ダンスレッスンでは周りのメンバを引っ張るダンスリーダー、ブログを毎日更新する
  • 何か正確なもの(?)と比較するために、欅坂46の冠バラエティ番組「欅って書けない」の企画で検証されていた相関図と比較してみました。

    • f:id:myaun:20190129235634p:plain
  • 番組相関図にもブログ相関図にもある関係
  • 番組相関図にはないが、ブログ相関図にある関係

終わりに

結論

  • 簡単な方法ではあったが、1ファンの感覚として腑に落ちる結果が得られた。
    • 「織田奈那」「斎藤冬優花」は最重要メンバであり精神的支柱
  • 番組の企画の相関図と比較しても割と似ているところが多かった。

今後の課題

感想

  • 好きなデータを弄る趣味解析は超楽しい、データサイエンスはドメインへの愛が1番大事だと思う
  • 実際、欅坂46メンバの愛称の語彙を公開してくださっていたサイトがMVP 欅坂46ブログメンバー呼び名一覧
    • 日本語NLPは精度の高い辞書を作ることが超大事
  • 可視化の部分でカッコよくしたかったのですが、結局大したことができなかったので、ちょっとフロントエンドの部分やデザイン(Infographics)も勉強してみたいと思った。

ツイートデータと見る坂道冠番組 2019/01/28【乃木中、けやかけ、がな推し】

解析方法

  • 番組のオンエア中に投稿されたツイートデータを収集しました。
  • ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象としました。
  • RTは対象としておらず、ツイート数等にに含んでいません。

今週の新規点

乃木坂工事中 #191 (2019/01/28 00:00 ~ 00:30)

各時間のツイート数 (総数: 24991)

f:id:myaun:20190128194522p:plain

最もツイートされた場面

0時22分頃: 北川悠理さん紹介パートでの和田まあやさんのヤバい翻訳

f:id:myaun:20190128195359p:plain

各時間のツイートされたワード

 0時 0分  tweet_num:1091 -> keywords: [('さくらちゃん', 86), ('遠藤', 47), ('乃木中', 43), ('4期生', 39), ('4期', 16), ('ドン', 9), ('キター', 9), ('1週間', 9), ('リアタイ', 8), ('乃木坂46', 7)]
 0時 1分  tweet_num:986 -> keywords: [('さくらちゃん', 148), ('蕎麦屋', 142), ('遠藤', 127), ('乃木中', 26), ('4期生', 21), ('愛知', 19), ('乃木坂46', 17), ('そば屋', 13), ('田村', 13), ('4期', 13)]
 0時 2分  tweet_num:1066 -> keywords: [('みなみ', 201), ('さくらちゃん', 90), ('遠藤', 81), ('設楽', 70), ('蕎麦屋', 67), ('ここじゃないどこか', 48), ('乃木中', 17), ('日村', 12), ('乃木坂46', 11), ('吹奏楽部', 10)]
 0時 3分  tweet_num:801 -> keywords: [('みなみ', 95), ('設楽', 49), ('遠藤', 38), ('さくらちゃん', 37), ('ローストビーフ', 23), ('乃木坂46', 19), ('蕎麦屋', 18), ('4期生', 12), ('なお', 12), ('乃木中', 11)]
 0時 4分  tweet_num:756 -> keywords: [('設楽', 40), ('みたらし団子', 39), ('さくらちゃん', 30), ('みなみ', 26), ('遠藤', 21), ('トマト', 16), ('乃木坂46', 12), ('まいちゅん', 12), ('乃木中', 11), ('中田', 11)]
 0時 5分  tweet_num:704 -> keywords: [('設楽', 132), ('みなみ', 76), ('さくらちゃん', 20), ('遠藤', 19), ('カイザー', 19), ('乃木坂46', 12), ('みたらし団子', 10), ('トマト', 9), ('蕎麦屋', 7), ('ω', 6)]
 0時 6分  tweet_num:1090 -> keywords: [('日村', 227), ('あやめ', 78), ('顔芸', 48), ('みなみ', 31), ('遠藤', 30), ('さくらちゃん', 29), ('与田', 25), ('設楽', 24), ('筒井', 21), ('乃木坂46', 16)]
 0時 7分  tweet_num:1034 -> keywords: [('与田', 173), ('あやめ', 103), ('筒井', 56), ('日村', 45), ('みなみ', 36), ('申年', 35), ('さくらちゃん', 27), ('遠藤', 25), ('14歳', 17), ('乃木坂46', 15)]
 0時 8分  tweet_num:851 -> keywords: [('みなみ', 100), ('あやめ', 86), ('与田', 72), ('14歳', 69), ('飛鳥', 56), ('筒井', 38), ('まあや', 28), ('段の上', 16), ('尾関', 14), ('星野みなみ', 12)]
 0時 9分  tweet_num:655 -> keywords: [('tee', 44), ('あやめ', 43), ('与田', 38), ('the alfee', 25), ('筒井', 23), ('みなみ', 22), ('14歳', 19), ('日村', 15), ('東京03', 15), ('乃木坂46', 11)]
 0時10分  tweet_num:1090 -> keywords: [('与田', 344), ('スティッチ', 68), ('スティービーワンダー', 61), ('スシロー', 44), ('あやめ', 37), ('tee', 23), ('筒井', 21), ('乃木坂46', 18), ('乃木中', 12), ('14歳', 11)]
 0時11分  tweet_num:727 -> keywords: [('与田', 144), ('あやめ', 75), ('スティッチ', 68), ('筒井', 29), ('14歳', 17), ('日村', 11), ('乃木中', 10), ('4期生', 10), ('乃木坂46', 9), ('女子力', 9)]
 0時12分  tweet_num:829 -> keywords: [('日村', 100), ('あやめ', 56), ('与田', 44), ('ニット帽', 40), ('筒井', 31), ('飛鳥', 28), ('皆川', 26), ('go', 19), ('14歳', 16), ('4期生', 16)]
 0時13分  tweet_num:597 -> keywords: [('あやめ', 51), ('飛鳥', 39), ('与田', 35), ('日村', 31), ('筒井', 26), ('4期生', 20), ('金川', 15), ('みなみ', 15), ('さくらちゃん', 14), ('北川', 14)]
 0時14分  tweet_num:791 -> keywords: [('北海道', 129), ('飛鳥', 107), ('金川', 77), ('北海道出身', 41), ('紗耶', 26), ('ななみん', 26), ('17年', 23), ('梅澤', 23), ('乃木中', 17), ('北海道産', 16)]
 0時15分  tweet_num:1083 -> keywords: [('飛鳥', 387), ('金川', 38), ('北海道', 36), ('梅ちゃん', 34), ('梅澤', 25), ('あすか', 25), ('紗耶', 22), ('乃木坂46', 17), ('運動音痴', 14), ('北海道出身', 12)]
 0時16分  tweet_num:863 -> keywords: [('飛鳥', 391), ('あすか', 28), ('神奈川出身', 25), ('金川', 22), ('北海道', 19), ('運動音痴', 16), ('北海道出身', 16), ('齋藤飛鳥', 15), ('紗耶', 13), ('乃木中', 11)]
 0時17分  tweet_num:1089 -> keywords: [('飛鳥', 366), ('コラ', 223), ('そだねー', 119), ('北海道弁', 28), ('あすか', 25), ('金川', 23), ('北海道', 19), ('北海道出身', 15), ('齋藤飛鳥', 14), ('設楽', 13)]
 0時18分  tweet_num:553 -> keywords: [('飛鳥', 86), ('コラ', 49), ('梅澤', 23), ('金川', 17), ('梅ちゃん', 16), ('北海道', 15), ('北海道弁', 15), ('そだねー', 14), ('設楽', 10), ('乃木中', 10)]
 0時19分  tweet_num:904 -> keywords: [('飛鳥', 102), ('梅ちゃん', 92), ('早口言葉', 67), ('金川', 49), ('梅澤', 48), ('滑舌', 47), ('コラ', 17), ('寿司', 13), ('紗耶', 13), ('北海道', 11)]
 0時20分  tweet_num:800 -> keywords: [('飛鳥', 139), ('金川', 69), ('早口言葉', 65), ('梅ちゃん', 57), ('まあや', 48), ('滑舌', 37), ('梅澤', 27), ('紗耶', 19), ('北川', 18), ('コラ', 18)]
 0時21分  tweet_num:680 -> keywords: [('北川', 66), ('飛鳥', 50), ('未央奈', 31), ('帰国子女', 28), ('堀', 26), ('早口言葉', 23), ('理々杏', 22), ('アメリカ', 21), ('悠理', 20), ('金川', 19)]
 0時22分  tweet_num:1290 -> keywords: [('まあや', 164), ('未央奈', 136), ('堀', 98), ('みお', 45), ('北川', 41), ('パライオ', 41), ('飛鳥', 20), ('悠理', 19), ('帰国子女', 18), ('乃木坂46', 17)]
 0時23分  tweet_num:886 -> keywords: [('まあや', 171), ('今でしょ', 44), ('未央奈', 38), ('北川', 37), ('日村', 32), ('堀', 25), ('乃木中', 19), ('まいちゅん', 19), ('悠理', 18), ('乃木坂46', 17)]
 0時24分  tweet_num:981 -> keywords: [('堀', 166), ('未央奈', 128), ('りり', 58), ('猫耳', 44), ('理々杏', 38), ('北川', 37), ('みお', 35), ('まあや', 30), ('りりあん', 29), ('キキ', 25)]
 0時25分  tweet_num:781 -> keywords: [('日村', 134), ('ヒム', 77), ('ヒム子', 57), ('堀', 35), ('未央奈', 32), ('北川', 20), ('りり', 16), ('みお', 15), ('キキ', 13), ('乃木中', 13)]
 0時26分  tweet_num:412 -> keywords: [('日村', 45), ('北川', 36), ('堀', 26), ('未央奈', 25), ('4期生', 23), ('ヒム', 16), ('飛鳥', 14), ('ジコチュー', 13), ('悠理', 12), ('乃木中', 11)]
 0時27分  tweet_num:374 -> keywords: [('日村', 37), ('パラパラ漫画', 31), ('北川', 27), ('4期生', 13), ('乃木坂46', 11), ('悠理', 11), ('未央奈', 11), ('飛鳥', 10), ('4期', 8), ('堀', 8)]
 0時28分  tweet_num:684 -> keywords: [('日村', 44), ('田村', 40), ('4期生', 33), ('北川', 24), ('真佑', 23), ('ウ○コ', 14), ('パラパラ漫画', 13), ('飛鳥', 12), ('悠理', 11), ('乃木中', 11)]
 0時29分  tweet_num:543 -> keywords: [('4期生', 43), ('田村', 40), ('掛橋', 24), ('北川', 24), ('真佑', 24), ('飛鳥', 20), ('4期', 20), ('3週', 17), ('乃木中', 17), ('30分', 14)]

欅って書けない #165 (2019/01/28 00:35 ~ 01:05)

各時間のツイート数 (総数: 8436)

f:id:myaun:20190128194534p:plain

最もツイートされた場面

1時3分頃: 8thシングル「黒い羊」 フォーメーション発表 f:id:myaun:20190128200051p:plain

本編の中だと、回答のためにスタジオの3階まで行かなければならないというハンデを背負わされて泣いちゃった守屋さん

f:id:myaun:20190128195908p:plain

ツイートされた数Top3メンバと関連キーワード

1位 (ツイート数:1045) 土生瑞穂
ボケ回答連発の土生さんが堂々の1位。クレイジー、土生ワールド、無双などが頻出

f:id:myaun:20190128210037p:plain

2位 (ツイート数:959) 鈴本美愉
可愛い表情が目立った鈴本さんが2位。...『おしっこ』 f:id:myaun:20190128210050p:plain

3位 (ツイート数:808) 守屋茜
今回の企画の主役である守屋さんが3位。ジャージ、可哀想、軍曹などが頻出

f:id:myaun:20190128210103p:plain

各時間のツイートされたワード

 0時35分  tweet_num:253 -> keywords: ['ジャージ', 'あかね', 'けやかけ', '守屋', '宮城', '欅坂46', 'ガチ', '1人', '守屋茜', 'リアタイ']
 0時36分  tweet_num:266 -> keywords: ['ジャージ', 'あかね', '守屋', '1人', '戦闘服', 'ガチ', '宮城', 'けやかけ', '欅坂46', '4人']
 0時37分  tweet_num:302 -> keywords: ['あかね', 'けやかけ', '守屋', '笹かま', '宮城', '4人', 'ジャージ', '欅坂46', '1人', 'mc']
 0時38分  tweet_num:302 -> keywords: ['土生', 'もん', '顔芸', '守屋', '伊達政宗', '宮城', '笹かま', '欅坂46', 'けやかけ', 'あかね']
 0時39分  tweet_num:315 -> keywords: ['土生', 'けやかけ', '伊達政宗', 'もん', '宮城', '欅坂46', 'あかね', '#tvtokyo', '鈴本', '土生瑞穂']
 0時40分  tweet_num:235 -> keywords: ['土生', 'あかね', '守屋', '欅坂46', '石森', '伊達政宗', 'けやかけ', '宮城', 'もん', '土生瑞穂']
 0時41分  tweet_num:238 -> keywords: ['もん', 'あかね', 'スナフキン', 'けやかけ', 'タケちゃんマン', '土生', '欅坂46', '石森', '伊達政宗', '守屋']
 0時42分  tweet_num:239 -> keywords: ['土生', '伊達政宗', 'けやかけ', '欅坂46', 'ニット帽', '宮城', 'もん', 'ちびまる子ちゃん', '守屋', 'みい']
 0時43分  tweet_num:145 -> keywords: ['土生', '伊達政宗', '宮城', 'あかね', 'けやかけ', '守屋', '欅坂46', 'ニット帽', '土生瑞穂', '共和国']
 0時44分  tweet_num:272 -> keywords: ['土生', '宮城', 'けやかけ', '欅坂46', '土生瑞穂', '頭の回転', 'こち星', 'あかね', 'ω', '#tvtokyo']
 0時45分  tweet_num:251 -> keywords: ['土生', '宮城', '群馬', 'けやかけ', '欅坂46', '土生瑞穂', 'むーちゃん', 'こち星', '上村莉菜', '上村']
 0時46分  tweet_num:404 -> keywords: ['3階', 'あかね', '守屋', '土生', '欅坂46', 'けやかけ', '宮城', '1階', '泣かないで', '涙']
 0時47分  tweet_num:365 -> keywords: ['守屋', 'あかね', 'むすび丸', '欅坂46', '茜', '宮城', '涙', 'けやかけ', '守屋茜', 'もん']
 0時48分  tweet_num:285 -> keywords: ['あかね', '守屋', 'けやかけ', '欅坂46', 'むすび丸', '長濱ねる', '茜', '3階', '守谷', '守屋茜']
 0時49分  tweet_num:375 -> keywords: ['もん', '鈴本', '守屋', 'けやかけ', 'ション', '澤部', '欅坂46', '下ネタ', 'ばかちん', '嬉']
 0時50分  tweet_num:294 -> keywords: ['もん', 'ばかちん', 'けやかけ', '守屋', '鈴本', '金八先生', 'あかね', '鈴本美愉', '欅坂46', '美']
 0時51分  tweet_num:220 -> keywords: ['女子力', 'もん', 'グロス', '欅坂46', 'ばかちん', '理佐', 'クロちゃん', '守屋', 'おだ', 'なな']
 0時52分  tweet_num:213 -> keywords: ['理佐', 'りか', '欅坂46', '石森', '梨加', 'りさ', 'けやかけ', '女子力', '渡辺梨加', 'もん']
 0時53分  tweet_num:217 -> keywords: ['土生', 'けやかけ', '欅坂46', '石森', 'もん', '守屋', '愛子', 'フォーメーション', '仙山線', '理佐']
 0時54分  tweet_num:158 -> keywords: ['土生', 'けやかけ', 'usa', '欅坂46', '宮城', 'あかね', '守屋茜', '愛子東', 'もん', '渡辺梨加']
 0時55分  tweet_num:168 -> keywords: ['土生', 'けやかけ', 'usa', '欅坂46', '宮城', 'オダ', 'もん', '愛子', '尾関', '#tvtokyo']
 0時56分  tweet_num:284 -> keywords: ['土生', 'オダ', 'けやかけ', '下ネタ', '土生瑞穂', 'usa', '欅坂46', 'おだ', '???', '織田']
 0時57分  tweet_num:145 -> keywords: ['土生', 'オダ', '欅坂46', '土生瑞穂', 'けやかけ', 'u.', 'むーちゃん', '羽生', '澤部', 'ヤバい']
 0時58分  tweet_num:173 -> keywords: ['土生', '欅坂46', '渡辺梨加', 'けやかけ', 'usa', '守屋', '石森', 'むーちゃん', '梨加', 'ベリカ']
 0時59分  tweet_num:164 -> keywords: ['ウザ', '土生', 'けやかけ', 'もん', 'ウザイ', '欅坂46', '織田', 'お餅', 'dis', 'りさ']
 1時 0分  tweet_num:324 -> keywords: ['お餅', '澤部', 'もん', 'けやかけ', 'スーパーボール', 'ウザ', '欅坂46', '土生', 'おもち', '織田奈那']
 1時 1分  tweet_num:315 -> keywords: ['フォーメーション', 'スーパーボール', 'けやかけ', 'お餅', '選抜発表', '澤部', '菅井', '欅坂46', '神回', '土生']
 1時 2分  tweet_num:504 -> keywords: ['フォーメーション', '3列目', '選抜発表', 'もん', '鈴本', '三列目', 'けやかけ', '欅坂46', 'てち', '8t']
 1時 3分  tweet_num:598 -> keywords: ['てち', 'フォーメーション', '3列目', 'しーちゃん', 'もん', '欅坂46', 'みい', '平手', '鈴本', 'けやかけ']
 1時 4分  tweet_num:412 -> keywords: ['フォーメーション', 'てち', '3列目', 'しーちゃん', '欅坂46', 'もん', '8t', '三列目', '鈴本', '2列目']

ひらがな推し #41 (2019/01/28 01:05 ~ 01:35)

各時間のツイート数 (総数: 7600)

f:id:myaun:20190128194548p:plain

最もツイートされた場面

1時17分頃: ニブモネア、埼玉ギャグでの金村美玖さんのコバトン

f:id:myaun:20190128200508p:plain f:id:myaun:20190128200534p:plain

(他も接戦だったので、それらの中でも個人的MVPを)
MCオードリー若林さんが斉藤京子さんの「居心地悪く、大人になった」を知っていた場面

f:id:myaun:20190128201022p:plain f:id:myaun:20190128201223p:plain

各時間のツイートされたワード

 1時 5分  tweet_num:329 -> keywords: [('ちゅどーん', 33), ('ちゅ', 6), ('ひなの', 5), ('ひらがな', 5), ('けやき坂46', 4), ('きょん', 4), ('1週間', 3), ('菜緒', 3), ('ツインテール', 3), ('一週間', 2)]
 1時 6分  tweet_num:230 -> keywords: [('井口', 18), ('丹生', 14), ('ツインテール', 13), ('さんま御殿', 8), ('ちゅどーん', 7), ('よろしくお願いします', 7), ('さんま', 7), ('けやき坂46', 5), ('若林', 3), ('ひらがなけやき', 3)]
 1時 7分  tweet_num:342 -> keywords: [('きょん', 19), ('サンド', 19), ('サンドウィッチマン', 15), ('春日', 13), ('けやき坂46', 8), ('オードリー', 7), ('keyabingo', 6), ('三角関係', 5), ('ウッチャン', 4), ('さんま', 4)]
 1時 8分  tweet_num:258 -> keywords: [('エアリー', 32), ('きょん', 10), ('春日', 9), ('小坂菜緒', 7), ('けやき坂46', 7), ('ガヤ', 5), ('サンドウィッチマン', 5), ('サンド', 5), ('ひらがな', 5), ('オードリー', 5)]
 1時 9分  tweet_num:300 -> keywords: [('キモ', 58), ('エアリー', 16), ('中邑真輔', 14), ('春日', 13), ('若林', 11), ('中邑', 9), ('けやき坂46', 8), ('林先生', 8), ('ひよ', 7), ('真輔', 7)]
 1時10分  tweet_num:235 -> keywords: [('キモ', 41), ('エアリー', 18), ('フレディ', 15), ('中邑真輔', 13), ('若林', 12), ('中邑', 10), ('林先生', 10), ('春日', 6), ('真輔', 6), ('けやき坂46', 5)]
 1時11分  tweet_num:244 -> keywords: [('三菱', 37), ('キモ', 20), ('若林', 17), ('中邑真輔', 13), ('ニク', 9), ('中邑', 7), ('井口', 7), ('エアリー', 6), ('入場曲', 5), ('濱岸', 4)]
 1時12分  tweet_num:343 -> keywords: [('若林', 75), ('井口', 33), ('春日', 31), ('久美', 13), ('けやき坂46', 7), ('ひらがなけやき', 7), ('キモ', 5), ('#tvtokyo', 4), ('中邑真輔', 4), ('おたけ', 4)]
 1時13分  tweet_num:290 -> keywords: [('若林', 59), ('春日', 27), ('久美', 18), ('井口', 14), ('ドッグカフェ', 8), ('佐々木久美', 7), ('むつみ', 7), ('きくちゃん', 6), ('所沢', 6), ('けやき坂46', 5)]
 1時14分  tweet_num:205 -> keywords: [('ザキヤマ', 57), ('若林', 17), ('久美', 15), ('オードリー', 11), ('所沢', 9), ('スクール革命', 7), ('けやき坂46', 7), ('春日', 6), ('佐々木久美', 6), ('クミ', 4)]
 1時15分  tweet_num:218 -> keywords: [('若林', 32), ('丹生', 30), ('ザキヤマ', 13), ('けやき坂46', 11), ('イロモネア', 8), ('埼玉', 7), ('春日', 6), ('#tvtokyo', 6), ('ひらがなけやき', 5), ('久美', 4)]
 1時16分  tweet_num:286 -> keywords: [('丹生', 45), ('コバトン', 32), ('埼玉', 12), ('若林', 12), ('ローラ', 10), ('瞬', 7), ('けやき坂46', 6), ('イロモネア', 6), ('ザキヤマ', 5), ('おすし', 5)]
 1時17分  tweet_num:364 -> keywords: [('コバトン', 95), ('丹生', 44), ('埼玉', 20), ('瞬', 18), ('埼玉県民', 11), ('若林', 11), ('おすし', 9), ('美玖', 9), ('けやき坂46', 6), ('きょん', 6)]
 1時18分  tweet_num:226 -> keywords: [('コバトン', 25), ('きょん', 19), ('丹生', 14), ('若林', 12), ('けやき坂46', 10), ('小坂菜緒', 9), ('小坂', 8), ('齊藤京子', 7), ('菜緒', 7), ('西野七瀬', 6)]
 1時19分  tweet_num:207 -> keywords: [('丹生', 24), ('きょん', 15), ('小坂', 8), ('ヒョウモントカゲモドキ', 7), ('まな', 7), ('けやき坂46', 6), ('コバトン', 6), ('埼玉', 5), ('レオパ', 5), ('小坂菜緒', 5)]
 1時20分  tweet_num:250 -> keywords: [('丹生', 38), ('まな', 22), ('きょん', 17), ('ドン引き', 16), ('けやき坂46', 9), ('ひらがなけやき', 6), ('ヒョウモントカゲモドキ', 5), ('小坂', 5), ('ぱん', 5), ('小坂菜緒', 5)]
 1時21分  tweet_num:212 -> keywords: [('丹生', 36), ('けやき坂46', 11), ('このちゃん', 11), ('キモ', 8), ('松田', 6), ('イントロ', 6), ('ひらがなけやき', 5), ('若林', 5), ('きょん', 4), ('このか', 4)]
 1時22分  tweet_num:285 -> keywords: [('イントロ', 45), ('オードリー', 15), ('このちゃん', 8), ('松田', 7), ('丹生', 5), ('若林', 5), ('けやき坂46', 5), ('2人', 5), ('激おこ', 5), ('ひらがな', 4)]
 1時23分  tweet_num:268 -> keywords: [('ジョイマン', 36), ('若林', 31), ('イントロ', 17), ('オードリー', 17), ('ひらがな', 15), ('けやき坂46', 10), ('松田', 9), ('このちゃん', 7), ('ひらがなけやき', 6), ('小坂菜緒', 4)]
 1時24分  tweet_num:337 -> keywords: [('若林', 79), ('オードリー', 24), ('きょん', 11), ('ひらがな', 10), ('love', 9), ('春日', 8), ('けやき坂46', 7), ('ジョイマン', 7), ('イントロ', 7), ('ソロ曲', 4)]
 1時25分  tweet_num:227 -> keywords: [('若林', 49), ('オードリー', 15), ('ひらがな', 9), ('きょん', 7), ('ちゃる', 7), ('イントロ', 6), ('ひらがなけやき', 5), ('けやき坂46', 5), ('めいちゃん', 5), ('love', 4)]
 1時26分  tweet_num:203 -> keywords: [('春日', 22), ('若林', 12), ('めいちゃん', 10), ('逃走中', 10), ('ひらがな', 8), ('けやき坂46', 8), ('きょん', 7), ('ひらがなけやき', 6), ('オードリー', 6), ('ちゃる', 5)]
 1時27分  tweet_num:202 -> keywords: [('春日', 9), ('けやき坂46', 7), ('きょん', 4), ('芽依', 3), ('逃走中', 3), ('#tvtokyo', 3), ('若林', 3), ('誰だ', 3), ('絵面', 3), ('ひらがなけやき', 3)]
 1時28分  tweet_num:223 -> keywords: [('春日', 19), ('宮田愛', 17), ('まな', 13), ('富田', 8), ('けやき坂46', 6), ('萌', 5), ('愛萌', 5), ('ひらがな', 5), ('めいちゃん', 4), ('宮田', 4)]
 1時29分  tweet_num:120 -> keywords: [('春日', 15), ('宮田愛', 6), ('きょん', 5), ('ひらがな', 5), ('逃走中', 4), ('若林', 4), ('乃木坂工事中', 4), ('オードリー', 4), ('けやき坂46', 3), ('パリピ', 3)]
 1時30分  tweet_num:272 -> keywords: [('ひなの', 106), ('ひらがな', 15), ('ひなのちゃん', 12), ('このちゃん', 10), ('春日', 7), ('宮田愛', 5), ('松田', 5), ('上村', 5), ('オードリー', 4), ('ひらがなけやき', 4)]
 1時31分  tweet_num:266 -> keywords: [('ひなの', 115), ('ひなのちゃん', 21), ('上村', 20), ('ひらがな', 18), ('春日', 10), ('けやき坂46', 9), ('松田', 8), ('オードリー', 6), ('なのなの', 6), ('このちゃん', 5)]
 1時32分  tweet_num:127 -> keywords: [('ひなの', 54), ('上村', 10), ('ひなのちゃん', 8), ('ひらがな', 8), ('けやき坂46', 6), ('3期生', 4), ('ひらがなけやき', 3), ('3期', 3), ('な!', 3), ('春日', 3)]
 1時33分  tweet_num:322 -> keywords: [('ひなの', 93), ('ひなのちゃん', 34), ('上村', 26), ('ひらがな', 22), ('お小遣い', 14), ('1人', 7), ('3期生', 6), ('けやき坂46', 6), ('乃木坂工事中', 5), ('春日', 5)]
 1時34分  tweet_num:209 -> keywords: [('ひなの', 56), ('ひなのちゃん', 18), ('上村', 17), ('ひらがな', 11), ('神回', 10), ('お小遣い', 9), ('武道館', 6), ('乃木坂工事中', 6), ('けやき坂46', 5), ('ドッキリ', 5)]

「NeurIPS2018読み会@PFN」に参加した

はじめに

  • 2019/01/26に「NeurIPS2018読み会@PFN」を聴講した

connpass.com

  • ので、発表スライド等をまとめながらメモ書きをする

全体感想

  • 正直、全体的にちゃんと理論の詳細まで理解できました!みたいなものは少なくて、抽象的な内容や論文のコンセプトがなるほど~と思える程度のものが多かったが、それでも学びは大きかった。
  • 中でも、特に「GAN」「強化学習」「GNN (Graph Neural Network)」周りは分からなかったけど、興味を持ったので色々調べて使ってみたい。

テーマ発表1 濱田晃一(DeNA)

  • 発表タイトル: "Generative Adversarial Networks and Disentangled Representations @ NeurIPS2018"
  • 資料: https://www.slideshare.net/hamadakoichi/gans-disentangled-representations
    • メモ
    • NeurIPS2018では、「GAN」を主テーマとして含む論文の本数が60本超どんどん増えている(2014:1 -> 2015:1 -> 2016:6 -> 2017->34)
    • NeurIPS2018では、生成品質を向上するだけが貢献だけの論文は1本も無く、他の複雑性を説くような課題へ進んでいる

論文紹介1 竹中誠(首都大)

論文紹介2 木村優志(Convergence Lab.)

論文紹介3 大野健太(PFN)

  • "Minimax statistical learning with Wasserstein distances"
  • 資料: ?

論文紹介4 岡本大和(オムロン)

テーマ発表2 佐野正太郎(PFN)

テーマ発表3 亀澤諒亮(DeNA)

論文紹介6 大元司(ドワンゴ)

  • "CatBoost: unbiased boosting with categorical features"
  • 資料: https://niconare.nicovideo.jp/watch/kn3831
    • メモ
    • 新規点がとても分かりやすかった。
    • Ordered TSによるカテゴリカルデータの前処理の改善
    • Ordered boostingによるブースティングアルゴリズムの改善

論文紹介7 田中潤(ShannonLab)

  • "Neural Ordinary Differential Equations"
  • 資料: ?

論文紹介8 上月正貴(crcrpar)

論文紹介5 白川達也(ABEJA)

論文紹介9 三原千尋 (発表キャンセルでしたがスライドあり)

テーマ発表4 甲野佑(DeNA)

テーマ発表5 比戸将平(PFN)

  • Modeling the Physical World @ NeurIPS2018
  • 資料: ?

ツイートで見る 「欅坂46 8thシングル 黒い羊 解禁」

ラジオ初解禁時のツイート数推移

以下のハッシュタグでのツイート数の推移を確認

"#SOL"のハッシュタグは、平手友梨奈さんの登場と「そろそろ来るか...」みたいな反応で早い段階で盛り上がっています。
"#黒い羊"・"#欅坂46"は、ラジオでの解禁後も長く盛り上がっており、拡散された楽曲を聞いてぞくぞくとファン達が楽曲の感想をツイートしています。

#SOL

f:id:myaun:20190122011349p:plain

#黒い羊

f:id:myaun:20190122004923p:plain

#欅坂46

f:id:myaun:20190122005009p:plain

みんなの感想をまとめてみる

1. WordCloud

  • 2019/01/21 22:30 ~ 2019/01/21 23:59の間に"#黒い羊"が付与されたツイート
  • 名詞と形容詞のみ使用

f:id:myaun:20190122011636p:plain

特徴

  • 神曲」「最高」「好き」などポジティブな感想が多い
  • 「エキセントリック」「避雷針」などの楽曲を思い起こす?
  • 「鳥肌」「感情」「エモい」など感情を揺さぶられた的な感想が多い?