Job Description
AIプロダクト企業におけるLLM推論エンジニア(大規模分散システム構築と高速化)
■ 職種
LLM エンジニア
■ 会社概要
日本語に特化した国産の大規模言語モデルの研究開発および生成AIサービスの提供を主事業とする企業です。LLMの価値をユーザーに届けるための推論インフラ構築に重点を置いています。
■ 職務内容
(雇入れ直後) LLMの価値をスケーラビリティと高可用性を確保しつつユーザーに提供するための推論(Inference)システムの構築と、チーム全体の開発プロセス設計、生産性向上活動を担当します。モデルの性能を最大限に引き出すインフラの実現がミッションです。
(変更の範囲)会社の定める業務
■ 応募資格
* 実務経験が5年以上あること
* スケーラビリティと高可用性が求められる大規模分散システムの開発または運用経験
* 理想を追求し、継続的な改善に取り組む意欲
■ 歓迎条件
* GPUクラスタ(オンプレ/クラウド)上でのシステム設計・開発
* マルチリージョンに跨る高可用システムの設計・開発・運用
* 分散DB/検索エンジンの開発・運用、またはMLモデルオンラインサービング基盤の設計・開発。
* LLM推論ワークロードの高速化に関する研究開発、またはvLLM, TensorRT-LLM等の推論フレームワークを用いたシステムの運用
* 分散処理基盤のモニタリング、オブザーバビリティに関するシステム設計開発
* エンタープライズ向けAPIサービスにおけるセキュリティ・ガバナンス設計
* 詳細設計から実装・レビューまで自ら主導できる能力
* OSSへの貢献、論文執筆、技術コミュニティでの活動
■ アピールポイント
海外ベンダーに匹敵する計算基盤を活用し、LLMという最先端技術を支える最重要インフラ(推論システム)の設計・開発に携われる。ユーザ価値の創出を意識し、提案から開発まで一貫して主体的に行える環境。プロダクトに必要な技術であれば領域を問わず挑戦できる自由度がある。
■ 就業場所
(雇入れ直後) 東京都(フルリモートワークも申請により可能)。
(変更の範囲)会社の定める場所
■ 給与
月給:541,667円~1,500,000円(理論年収:**650万円~1,800万円**)
求人内容の詳細は面談時にお伝えします。
【ホームページからのご応募=企業への応募確定】ではございませんので、情報収集から始めたいという方もまずはお気軽にご連絡ください。
オンライン・電話でのご相談も承っております。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
◆少しでもご興味をお持ちいただけましたら、
「APPLY」ボタンからお気軽にご連絡ください◆
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーー