New【AI】先端科学データ研究開発における基盤モデル・LLMエンジニアの求人・案件

常駐

※本サイトでは募集中の案件だけでなく過去の募集案件を掲載しております。
※単価や稼働日数など条件面についても無料サポート登録よりお気軽にご相談ください。
※当社が保有する非公開案件等からスキルに適した案件をご提案いたします。

案件概要

職種
案件内容

AI技術を用いた先端科学・医療分野のデータ研究開発プロジェクトにおいて、以下の業務を担当します。

  1. データ解析・研究開発
  • 大規模な専門データ・医療情報の前処理、品質評価、探索的データ分析(EDA)、可視化、および仮説検証
  • 特徴量設計、データ表現の最適化、学習・評価用データセットの整備
  1. 機械学習 / 深層学習モデル開発
  • 深層学習モデルの設計・実装・評価、およびベースライン構築と継続的改善
  • 表現学習、自己教師あり学習、またはドメイン特化型基盤モデルの開発
  • アクセラレータ(GPU等)環境を用いたモデル学習・実験運用、性能評価、および誤差分析
  1. 大規模学習・開発基盤
  • 分散学習ジョブの設計・運用・最適化、および学習パイプライン・実験管理基盤の構築
  • 大規模データI/Oや再現性を考慮した研究開発フローの整備、およびMLOpsの推進
  1. 研究プロセス・チーム連携
  • 評価指標・ベンチマークの設計、実験の再現性担保、ログ管理、およびドキュメント化
  • 各分野の研究者、データサイエンティスト、エンジニアとの緊密な協働
必須スキル

以下1、2のいずれかの領域において、「実装および最適化」の実務経験を有すること。
1. アーキテクチャ設計と事前学習の実務経験
– Transformerベースのモデル、または最新の動的状態空間モデル(SSM等)を用いた大規模モデルの設計・実装経験
– 基盤モデルの拡張則(Scaling Laws)に基づき、数千億〜兆規模のトークン学習に必要な計算リソースを定量的に見積もる能力
– 数十億〜数百億パラメータ規模のモデルにおける事前学習のチューニングおよび学習安定化の経験
2. 大規模分散学習のエンジニアリング
– 主要な分散学習ライブラリ(PyTorch FSDPやDeepSpeed等)を、モデル規模やネットワーク帯域に合わせてカスタマイズ・チューニングした経験
– マルチノード環境における通信ボトルネックの解消、および大規模データに対する効率的なI/Oパイプラインの設計経験
– シーケンス並列(Sequence Parallelism)等の実装を通じた、単一メモリに収まらないコンテキスト長に対する学習最適化経験

尚可スキル

– 構成管理ツールを用いたチーム開発経験(Git運用、コードレビュー文化への適応)
– クラウド環境(AWS/GCP/Azure等)を利用したシステム構築・運用経験
– 表現学習、自己教師あり学習、オートエンコーダー、または大規模言語モデル(LLM)の研究開発経験
– GPUアクセラレータ環境でのモデル学習、または分散トレーニング・HPC環境の利用経験
– 統計モデリング、因果推論、ベイズ統計などの高度な数学的知識
– 不均衡データ、時系列データ、またはマルチモーダルデータの解析・処理経験
– 最新論文のアルゴリズム実装、研究再現、およびベンチマークの構築経験
– Pythonを用いた高度なデータ分析および機械学習の実務経験(分類、回帰、時系列、異常検知等)
– 分析結果から課題や改善案を論理的に抽出し、自走して実装・検証まで進められる能力

言語
環境・ツール
分析目的・ジャンル
稼働率 60~100%
面談回数 1回
稼働日数 週3日 週4日 週5日
募集人数 5人

関連する案件

お仕事を開始するまでのステップ

案件のご紹介はもちろん、案件参画後も担当コンサルタントより定期的なフォローを実施いたします。

案件お問い合わせ

必須項目

*必須項目です。

*必須項目です。

*年を入力してください。

*月を入力してください。

*日を入力してください。

ハイフン無しでご記入ください

*携帯電話番号を正しく入力してください。

*メールアドレスを正しく入力してください。

*項目を選択してください。

*項目を選択してください。

*希望稼働条件を選択してください。

*職種を選択してください。

*経験年数を選択してください。

経歴書 5MBまで
選択されていません

当社の個人情報保護方針および利用規約に同意の上、送信してください。


個人情報の取り扱い、利用規約に同意してください

戻る