New【AIエンジニア】NVIDIA GB200を用いた超長尺エピゲノム言語モデルの分散事前学習開発の求人・案件

常駐

※本サイトでは募集中の案件だけでなく過去の募集案件を掲載しております。
※単価や稼働日数など条件面についても無料サポート登録よりお気軽にご相談ください。
※当社が保有する非公開案件等からスキルに適した案件をご提案いたします。

案件概要

職種
案件内容

AI×医療・バイオ領域における最先端の生成AI基盤モデル開発。
・1兆データポイントのエピゲノムデータを用いた言語モデルの設計およびフルスクラッチ事前学習
・GB200(複数ノード)を用いた大規模分散事前学習環境の構築・最適化
・数千万規模の超長尺コンテキストに対応するモデル構造(Mambaやコンテキスト並列等)の検討・実装
※分散学習時のメモリ・通信ボトルネックを自力で解決する挑戦的なR&Dポジションです。

必須スキル

– マルチノードGPU環境における大規模モデルの分散事前学習経験(または同等の知見)
– PyTorch、DeepSpeed、Megatron-LM等を用いた並列学習(テンソル/パイプライン/コンテキスト並列)の実装・最適化経験
– OOMや通信ボトルネック発生時、CUDAや通信レイヤーを含めて原因特定・解決できる高度なトラブルシューティング能力
– 超長尺コンテキストを扱う代替バックボーン(Mamba、状態空間モデル等)への強い関心とキャッチアップ力

尚可スキル

– 数B〜数十B規模以上のモデルのフルスクラッチ事前学習・継続事前学習経験
– Ring AttentionやSequence Parallelism等の超長尺処理技術の知見
– AWS(SageMaker HyperPod等)/GCP/Azureでの大規模GPUクラスタ構築・運用経験
– NVIDIA Blackwell(GB200/B200)環境での開発経験
– バイオインフォマティクスやオミクスデータの解析知見、トップカンファレンス論文の実装・再現経験

環境・ツール
フレームワーク・ライブラリ
分析目的・ジャンル
稼働率 80~100%
面談回数 1回
稼働日数 週4日 週5日
募集人数 2人

関連する案件

お仕事を開始するまでのステップ

案件のご紹介はもちろん、案件参画後も担当コンサルタントより定期的なフォローを実施いたします。

案件お問い合わせ

必須項目

*必須項目です。

*必須項目です。

*年を入力してください。

*月を入力してください。

*日を入力してください。

ハイフン無しでご記入ください

*携帯電話番号を正しく入力してください。

*メールアドレスを正しく入力してください。

*項目を選択してください。

*項目を選択してください。

*希望稼働条件を選択してください。

*職種を選択してください。

*経験年数を選択してください。

経歴書 5MBまで
選択されていません

当社の個人情報保護方針および利用規約に同意の上、送信してください。


個人情報の取り扱い、利用規約に同意してください

戻る