募集背景
現在、Rimoは急速に認知を拡大しており、急に「5万時間分の議事録を作りたい」のですができますか?などと聞かれたりします。 Rimoは、動画のアップロードから文字起こし、議事録(ChatGPTによる要約)作成が行われます。これを高速・高精度にするために、内部では想像以上に複雑なワークフローが組まれており、1つの動画アップロードで1000個以上のタスクが作られるような状況です。 こうなってくると、1つのタスクが失敗する確率が0.01%だとしても、どれかのタスクが失敗する確率は10%程度になる計算になり、エラーを前提としたワークフローを組むことが必須となってきます。
それ以外にも、Rimoは共同編集や、話者を手動でつけていくことで残りの話者分離を高精度でできるような仕組みもあり、これらはすべてk8sを用いたロジックで立ち上がる高度なバックエンドサーバーがあってはじめて成り立つものです。 今後もRimoはより高度な処理を、ユーザーがGoogle DocsやNotionを使うぐらい当たり前に高度さを感じさせずに提供していくつもりです。ChatGPTが出てきてCopilotのような機能もより当たり前になるでしょう。
こういったサービス提供価値を支えてくれる方を募集します。
業務内容
- Rimoのサービスがより高速に安定して動くようにする (以下例)
- Rimoに音声をアップロードしてから議事録が作成されるまでのフローがたとえ誰かが大量アップロードしたり、壊れたファイルを上げたとしても安定して高速に動き続けるようにする。
- 共同編集や話者分離などの機能も高速なレスポンスなためバックエンドのサーバー高速な準備が必要になっている。これを今後スケールしても安定して動かす。
- リアルタイム音声認識中に、ChatGPTや知識データベースに質問しミーティングに参加できるような仕組みの開発
- 10年後も2倍成長を続けられるような、エンジニアの生産性を上げるような基盤を作る (以下例)
- テストを書きやすい仕組み、高速なテスト実行
- ユーザーのデータをもとにAIの再学習や、新しい機械学習をしやすい仕組みづくり
- ChatGPTなどの生成AIを利用したコード作成やレビューの自動化
この仕事の魅力
- リリースから1年でARR1億円突破、導入社数300社以上という成長率であり、変化のある環境で業務ができる
- 音声認識×GPTという世の中のトレンドを捉えたサービスであることから、利用者を飛躍的に向上させるチャンスがある
- プロダクトを日本だけではなく世界に広げて行ける
開発環境
言語:Go, Python, TypeScript フレームワーク:gin, React(Next.js), LangChain, fastAPI, sklearn, pytorch データベース:Firestore(Firebase), BigQuery ソースコード管理:GitHub 情報共有ツール:Slack, Zoom, Notion, Rimo インフラ:GCP(Kubernetes Engine, Cloud Run)
必須スキル
- なぜ共同編集や、リアルタイム話者分離にk8sなどのインフラ技術が必要か想像がつく
- Go(MLOpsの場合はPython)などでのアプリケーションコードも当然のようにかける
- DockerとKubernetesを使いこなせる
- AWS / GCP / Azureどれかでのインフラ運用経験
歓迎スキル
- MLOpsの経験
- ChatOpsの経験
- バックエンドやフロントエンド開発の経験
求める人物像
- 慣習にとらわれずにゼロベースであるべき姿を考えて実行できる方
- 分からないことをしっかり認識し、知識やノウハウを吸収しようという意思のある方
- 新たな試みや仕組み化を周囲を巻き込みながら推進できる方
- 積極的なコミュニケーションや社内調整ができる方