myaun’s blog

2020年に学会コンペに3つ参加したので感想など

Kaggle Advent Calendar 2020 21日の記事です。 今年、以下の3つの国際会議に併設されている分析コンペ(以降、学会コンペ)に参加したので、参加したコンペを振り返りつつ、その感想をまとめます。 RecSys Challenge 2020 CIKM2020 AnalytiCup, COVID-19 Retw…

今年、Kaggleが楽しくなった話

前置き Kaggleが楽しくなったきっかけ [小ネタ] チーム名でモチベーションを高めるKaggle Kaggleやってて良かったこと(私の場合) 仕事で機械学習のコード書いてなくても焦りにくい 少し話のネタになる 来年のKaggleでの目標 金メダル! カーネルやディスカ…

ブログ解析による日向坂46メンバの相関図作成

はじめに 本記事でやったこと 解析方法 解析に使用したコード 1. ブログを収集 2. 各メンバのブログ文章から他メンバへの言及を抽出 3. メンバ間の関係を可視化 考察 4. メンバーから番組MCオードリーへの関係を可視化 考察 終わりに はじめに 本日2019/7/28…

「企業の研究者をめざす皆さんへ ―Research That Matters」読みました

読んだ本 企業の研究者をめざす皆さんへ―Research That Matters作者: 丸山宏出版社/メーカー: 近代科学社発売日: 2009/11/04メディア: 単行本購入: 7人 クリック: 105回この商品を含むブログ (16件) を見る どんな本 本書の著者である丸山宏さん(現在、PFN…

FaceNetによる顔画像の特徴量抽出 - アイドル画像による検証 -

1. はじめに 参考 2. FaceNetによる顔画像の特徴量抽出 2-1. ブログ画像を収集 2-2. ブログ画像から顔検出、保存 2-3. Facenetにより顔画像から特徴量抽出 2-4. 得られた顔画像特徴量の検証 A. 類似顔画像検索 B. t-SNEによる2次元可視化 C. クラスタリング …

アイドルブログの文体的特徴に基づく著者分類

1. はじめに 本記事では、アイドルブログの文体的特徴に基づく著者分類の紹介をします。 1-1. 「文体的特徴」とは 簡単に言うと、文章に現れる著者の癖に注目した特徴量です。計量文体学、計量分析学と呼ばれる領域にて研究されているみたいです。 文体とい…

「Spotlight on Search, Google Tokyo」に参加しました

はじめに Google Tokyoの検索チームの主催イベント「Spotlight on Search, Google Tokyo」に参加しました。 Googleはフィードバックを賢く学習していことで超進化する会社なので、忘れないうちに本イベントへの感想を書いてみました。 *1 参加イベント イベ…

「犯罪捜査のためのテキストマイニング」読みました

読んだ本 犯罪捜査のためのテキストマイニング: 文章の指紋を探り,サイバー犯罪に挑む計量的文体分析の手法作者: 財津亘,金明哲出版社/メーカー: 共立出版発売日: 2019/01/09メディア: 単行本この商品を含むブログを見る どんな本 近年増加しているインター…

ツイートで見る「けやき坂46→日向坂46」

はじめに 本日 2019/02/11、14:00より配信されたSHOWROOM「ひらがなからのおしらせ」にて、けやき坂46(ひらがなけやき)が日向坂46へ改名されるなど、様々な発表がありました。 *1 その配信中および配信後のTwitter上でのファンの反応を解析しました。 Twit…

ツイートデータと見る坂道冠番組 2019/02/04【乃木中、けやかけ、がな推し】

はじめに 乃木坂46、欅坂46、けやき坂46の冠番組へのツイートを使って簡単な解析をしました。 番組のオンエア中に投稿されたツイートデータを収集しました。 ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象と…

乃木坂46・欅坂46・けやき坂46のブログから単語分散表現を学習

1. はじめに 特定ドメインのテキストから単語分散表現を学習することに興味があったので実験しました。 今回実施した内容 乃木坂46・欅坂46・けやき坂46のブログを収集してテキストへ前処理をする fastTextにより収集したブログのテキストから単語分散表現を…

僕が欅坂46に急激に好きになるまでの経緯

はじめに 2018年11月頃から現在までに、僕は欅坂46・けやき坂46(ひらがなけやき)に急激にハマりました。 その間、どんなコンテンツを浴びて、どのような感想を抱き、このグループのファンになったかを辿ります。 *1 以下では、今でも思い出せる印象に残って…

ブログ解析による欅坂46メンバの相関図作成

はじめに 欅坂46メンバの公式ブログを解析し、メンバ間の関係を抽出して相関図を作成しました。 データの収集から解析まで、基本的にPythonです。コードも公開してます。 趣味爆発の記事ですが、欅坂46分からなくても(たぶん)楽しめるよ! 解析方法 以下の4…

ツイートデータと見る坂道冠番組 2019/01/28【乃木中、けやかけ、がな推し】

解析方法 番組のオンエア中に投稿されたツイートデータを収集しました。 ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象としました。 RTは対象としておらず、ツイート数等にに含んでいません。 今週の新規点 …

「NeurIPS2018読み会@PFN」に参加した

はじめに 2019/01/26に「NeurIPS2018読み会@PFN」を聴講した connpass.com ので、発表スライド等をまとめながらメモ書きをする 全体感想 NeurIPS2018読み会@PFNを聴講してきました。約6時間と長丁場で、頭が疲れたのよく眠れそう。近年のトレンドとそれに対…

ツイートで見る 「欅坂46 8thシングル 黒い羊 解禁」

ラジオ初解禁時のツイート数推移 以下のハッシュタグでのツイート数の推移を確認 "#SOL" ... 楽曲の初解禁をしたラジオ番組SCHOOL OF LOCK!のタグ "#黒い羊" "#欅坂46" "#SOL"のハッシュタグは、平手友梨奈さんの登場と「そろそろ来るか...」みたいな反応で…

ツイートデータと見る坂道冠番組 2019/01/21【乃木中、けやかけ、がな推し】

解析方法 番組のオンエア中に投稿されたツイートデータを収集しました。 ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイートを対象としました。 RTは対象としておらず、ツイート数等にに含んでいません。 乃木坂工事中 …

ツイートデータと見る坂道冠番組 2019/01/14【乃木中、けやかけ、がな推し】

はじめに みんな大好き乃木坂46、欅坂46、けやき坂46の冠番組へのツイートを使って簡単な解析をしました。 番組のオンエア中に投稿されたツイートデータを収集しました。 ハッシュタグ "#乃木坂工事中", "#欅って書けない", "#ひらがな推し"が付与されたツイ…

今年の僕のScrapbox事情

はじめに 2018年から使い始めて恐らく最もお世話になったWebサービスであるScrapboxをどんな用途にどれくらい使ったを振り返ってみました。 Scrapboxとは 次世代の情報共有ツール、知のコラボレーションツールなどと表現されております。まさにその通りで、…

年越し前に自分のYouTubeの視聴履歴を解析したよ【Python】

はじめに 今年もあと数週間で終わりますが、1年間の振り返り方は人それぞれ色々あると思います。 本記事では、私が最も使っているサービスであるYouTubeの視聴履歴という楽しげなデータを見つけたので、自分が1年間どんな動画どれだけ視聴したかを確認してみ…