これはなに
2023年4月に新卒データサイエンティストとして入社してから、1年が経ちました。記憶が揮発する前に色々書き留めておこうと思います。どうやら、新卒データサイエンティストは記事を書くことが多いみたいです。
こういった記事を書いてくれる人は希少で、就活していたときは色々参考にさせていただきました。僕の記事が誰かの参考になるかどうかはわかりませんが、界隈に還元するためにも公開しておきます。
振り返り
4~7月
4~7月は研修期間でした。リモートワークの会社に入社したのですが、最初の数日は出社でした。満員電車がつらすぎて厳しかったです。
研修は全体研修、全体ハッカソン、技術職ハッカソン、職種別研修の4つに分かれていました。全体研修ではマナー講習などもありましたが、インターネットでよく見るやばい研修などはなく、かなり短縮されたものだったので助かりました。名刺のマナーや上座下座のお話とかもしていた気がしますが、すでに何一つ覚えていません。
全体研修が終わると、全体ハッカソンがありました。これは企画職、営業職、技術職全ての人が参加します。僕のチームは5人で、企画、営業、バックエンドエンジニア、AI研究者、ぼくの5人でした。AI研究者はいわゆる企業研究者に当たる職種です(研究者もハッカソンに参加するのはちょっと面白い)。指定のAPIを使ってなんか作ろうね〜みたいなやつでした。アイデア出し→要件定義→実装→修正→実装……のよくあるサイクルを3日間という短い期間でなるだけ頑張る感じです。企画の人がPMをやってくれたのですが、進め方がうますぎてこいつ新卒か?などと思いました。みんな経験あるしFlask/Pythonで書こうね〜みたいになりましたが、僕は見栄を張っているだけでほぼPythonを書けません。とはいえRで書きましょう!などと言えるはずもなく、泣きながらドキュメントやネットに転がっている実装等を読んでいました。研修の中だとこれが1番楽しかったかもしれません。なんとか本番環境にデプロイできてよかったです。
次が技術職ハッカソンです。メッセージアプリをつくろうねーみたいなやつでした。こちらは6週間と非常に長く、けっこう真面目にやる必要があります。今回のメンバーはサーバー、サーバー、AI、ML、僕でした。偏りがひどい。
Androidアプリを指定されていたこともあり、サーバーもクライアントもKotlinで書く流れになりました。結果的にはサーバーとフロントの言語を統一することで、お互いのコードを多少なりとも読める&アドバイスもしやすい感じでした(助けられた記憶しかないが)。分担としては次のとおりでした。
- サーバー:バックエンドエンジニア2名
- クライアント:AI研究者、ぼく
- インフラ:MLエンジニア
作戦としては、実装量が多いと思われるサーバーをサーバーの人がゴリゴリやる。フロントはデータ系2名で気合いで頑張る。MLの人は本人の希望でインフラにチャレンジすると言った感じでした。インフラは誰かがやるしかないので本当に助かりました。ちなみにMLの人はコンピュータサイエンスに精通していたので k8sを使いこなしていい感じに上手くやってくれました。強すぎる。
全体ハッカソンは対面でやりましたが、今回は基本リモート開発です。メンバーに物理的な距離があり(東京3、大阪1、福岡1)、せざるを得ないという感じです。AI研究者の人とクライアントのコードを書きましたが、一瞬で崩壊した記憶があります。Android開発の基本がわからないので、仲良くキメラコードを錬成しました。開発量が多いわけではないので、UIはJetpack Composeの力を借りつつよしなにできましたが、DB周りやgRPCは知識がほぼなかったので苦しかったです。
最後は職種別研修です。僕はデータ系の研修を受けましたが、駆け足気味だったのであまり覚えてません。唯一覚えていることは、共有ディレクトリにクソデカファイルを置いて全員のリソースを破壊したことくらいです。
7月前半〜8月
ここまでは割とみんなで手を繋いで進めていたのですが、ここからは配属先のチーム次第でがっつり変わります。ちなみに配属先は候補が提示されてみんなで選ぶ感じでした。若干競合があったので面談とかもしました。「なるようになるっしょ!」みたいなお気持ちだったので、「どこでも楽しくやります!」みたいなことを書きました。結果的には今のチームに入れてよかったです、たのしいので。
配属先のチームでチュートリアル的なものをやりましたが、結構重くて大変でした。お題に沿って実データを分析してみるというシンプルな課題でしたが、お題がだいぶ抽象的かつデータのサイズが非常に大きいので、苦労した記憶があります。
9月~3月
データサイエンティストっぽいお仕事を一通りやった感じになります。箇条書きにするとこんな感じです。
- A/Bテストをはじめとする効果検証
- 施策効果の試算
- 分析を起点とした施策そのものの提案
- 新規案件の基礎分析
- BIツールなどを用いたダッシュボード作成
- 分析用中間テーブルのETL作成
- 社内ライブラリ開発
なんかたくさんやっていてウケますね。いろんな反省点がありつつも、いずれも楽しくいい経験になったと思います。それぞれ詳しく振り返りを書いてみましたが、あまりにも長すぎるうえ、公開できる情報に絞ると何を言っているかよくわからない感じになってしまったため、ローカルのPCに眠らせておくことにします。何かのイベントの懇親会や、カジュアル面談などでなら話せるかもしれません。
全体を通して
働き始める前は、「社会無理だよ〜」みたいな感じでしたが、いざ働き出すとなんとかなりました。部署、チームの雰囲気が僕に合っていたことが大きいです。お仕事のデータ分析だけでは飽きてしまうと思い、外部の分析コンペに出るなどしたのも気分転換になり、よかったように思えます。
次の一年
まだメンターの方から独り立ちできていないので、まずはそこからやっていきたいです。今の段階だと、自分の判断に自信を持てないことが多いので、コミュニケーションがふわっとしたものになりがちだったという反省がありました。また、技術的に高度なことを何もやれていないな〜という気持ちが結構あります。今までできなかったことをできるようにする体験を増やしていけると、楽しい一年にできるのかな〜などと考えたりしています。
いずれにせよ明らかに経験値が足りていないので、次の一年もやっていきの気持ちでやっていこうと思います!