myaun’s blog

今年、Kaggleが楽しくなった話

前置き

今までKaggleは興味はあるが腰が重いみたいな存在でしたが、今年になってKaggleが楽しくなって参加するようになったので、その経緯と今年の振り返りを書きます。

  • kaggle その2 Advent Calendar 2019 の4日目の記事です。
  • 日記(Kaggle系ポエム)です。
  • 本記事はKaggleで勝つための技術は全く得られません。

Kaggleが楽しくなったきっかけ

今年までは、やってみたいやってみたいと思いながら、TwitterでKagglerの人達みたり、Kernelsを動かしてみたり、Discussionを読んでみたりするだけでした。

今年になってたまたま以下のような流れでKaggleが楽しくなりました。

  • 3月頃に転職活動をしていて、有給消化したり社内ニートになったりしてて暇になったことをきっかけにPetfinderに参加した。当時、日本勢のKagglerの方達がTwitterとかで盛り上がってて楽しそうでした。
  • [楽しくなった!] まぐれ特徴量が当たって銀メダル圏に入れた。
  • 結果、調子に乗っていたがKaggle何も分かっていなくてかなりShake down ...でも銅メダルはもらえた
  • [楽しくなってる!] Petfinderの結果が出るのが遅くて、そわそわして代名詞コンペに参加する

なので、ハマるきっかけはまぐれでも最初だけでも良いのでメダル圏内や上位に入ることだと思います。(そのためにはある程度時間に余裕が必要?)

楽しくなった結果、下図のような感じでたくさんのコンペに参加しました。

f:id:myaun:20191204231619p:plain
今年参加したコンペ

今年、一番楽しかったのは分子コンペ (Predicting Molecular Properties) でした。 経験が浅いながら過去数回のコンペやMeetup等で学んだことを実践しながら、 グラフ系データの扱いを学べて楽しめました。

[小ネタ] チーム名でモチベーションを高めるKaggle

(本当はこのネタだけで記事にしようと思ってたが、内容が薄すぎたので日記に変えた)

皆さんはソロで参加するときのチーム名は気にしてますか? デフォルトだと登録名ですが、ソロであってもチーム名は変えられます。

f:id:myaun:20191204231010p:plain
チーム名変更画面

私は気分転換で適当に名前を変えていて、最後の方には自分の好きなアイドルの楽曲の名前にします。*1 自分が上位になることでその楽曲名が多くの人に宣伝できれば嬉しいとか思いながら頑張っています。 (この作戦により、Load Moreをしなくても表示される50位以内へのモチベーションが高まります。)

f:id:myaun:20191204232359p:plain
私が参加したコンペのチーム名

外国人にもわかるように英語表記にして、一応ぐぐったらYouTubeのMVが検索結果にでてくることを確認しています。

以上、Kaggleの変な楽しみ方でした。

Kaggleやってて良かったこと(私の場合)

仕事で機械学習のコード書いてなくても焦りにくい

以前は、業務外の機械学習系のインプットは本を読んだり技術ブログを読んだりがメインだったので、 業務で資料作成などが立て込み、データ分析や機械学習のコードを書かない期間が長くなると、 なまって弱くなっているのではないか、と不安になることがありました。

最近は、コードをあまり書かない期間があっても、Kaggleを通して調査+実装をしていることが多いのでその辺り少し気持ちが楽になりました。 Kaggleは、絶えずたくさんの分析テーマを世界中に公開してくれているという観点ですごい有難い存在だなと感じます。

少し話のネタになる

今年に入ってデータサイエンス系役職の面談をすることが増えたのですが、 共通の話題として面談のアイスブレーク的に話せることが何度かあったのでそういう時は良いなーと思います。 Kaggleやっていない人はいますが、知らない人はこの界隈では流石に少ない。

また、業務に関しては内容の話は細かいところ秘密だったりするけど、 Kaggleの過去コンペの話は大丈夫(進行中のコンペは注意!)。

来年のKaggleでの目標

金メダル!

ただ、現状の実力だと金メダルには高い壁があるような気がするのでしっかり修行します。 ドラクエ3だと、Masterになるのがバラモス撃破、GMになるのがゾーマ撃破くらいかな*2と思っているので今は道中を楽しんでいるところです。

カーネルやディスカッション、ソリューションを投稿する

コンペに参加する(インプット、実装に必死) -> コンペ終わる(汚いコードと微妙な結果だけが残る) -> 一段楽(結果の整理はできてない) -> 次のコンペに参加する..., のようなクソムーブで、Kaggle始めてからブログ等のアウトプットが減ってしまった(インプットも未整理)という反省があるので、来年は1つ1つしっかりまとめていきたい。

最後に

Kaggle Days Tokyo行きます(業務内で!)

*1:非推奨のアクションとかだったらすみません

*2:もっと段階があるかも