データアナリストの案件一覧

過去に募集したエンジニア、データサイエンティスト、マーケターの案件を中心に掲載しています。
非公開案件を多数保有していますので、ご希望のイメージに近い案件をクリックして無料サポートにお申込みください。
専門コンサルタントがヒアリングを通じて最適な案件をご提案いたします。
単価や稼働日数などの条件面についてもお気軽にご相談ください。

該当件数:306

データアナリストの案件を探す

案件内容

大規模エピゲノムデータを学習させた基盤モデル(Large Epigenome Model, LEM)の開発を担当していただきます。ゲノム領域の潜在表現を獲得することで、さまざまな生物学的タスク(バイオマーカー予測、予防医療AIなど)への応用を可能にするプロジェクトです。
主な業務内容:
大規模エピゲノムデータを用いた自己教師あり学習・表現学習モデルの設計・実装
Autoencoder 系モデル、Transformer、大規模言語モデルを活用したゲノム領域の潜在表現獲得
Long context 処理可能なモデルのアーキテクチャ設計と事前学習の高速化アルゴリズム研究
PyTorch / JAX などを用いた深層学習フレームワークでのモデル実装
大規模 GPU 学習、分散トレーニング、HPC 環境での運用
PyTorch Distributed、CUDA、クラウド環境(AWS 等)での学習・運用

必須スキル

・表現学習、自己教師あり学習、Autoencoder 系モデル、Transformer、大規模言語モデルの実務経験
・PyTorch / JAX など深層学習フレームワークでの実装経験
・Long context モデルや大規模言語モデルのアーキテクチャ設計経験
・大規模 GPU 環境での学習・分散トレーニング経験

案件内容

ヘルスケア系スタートアップの研究開発部門にて、
DNAメチル化(エピゲノム)データを活用した統計解析・データ分析業務を担当いただきます。

本プロジェクトでは、以下のデータを統合し、
生物学的年齢(Biological Age)や疾患発症リスク・死亡リスクの予測モデルの研究開発を進めています。

・DNAメチル化データ(CpGサイト:約27万特徴量)
・人間ドック・健康診断データ
・大学研究機関の長期追跡研究データ(20年スパンの死亡率・疾患発症データ)

チーフサイエンティストおよびバイオインフォマティクスチームと連携しながら、
研究開発に必要なデータ前処理・探索的分析・統計解析・可視化を担っていただきます。

また解析結果は、
医学論文・学会発表・研究レポート等で利用されるため、Publication Qualityのデータ可視化が重要なミッションとなります。

【主な業務内容】
・DNAメチル化データ/医療データのクレンジング・整形
・探索的データ分析(EDA)
・統計解析(回帰分析、生存時間解析など)
・医療研究向けデータ可視化(論文・学会用図表作成)
・Python / Rを用いた解析パイプライン構築
・研究チームとの仮説検証ディスカッション

必須スキル
・PythonまたはRを用いたデータ分析経験
(Pandas / Tidyverse等)
・統計解析の基礎知識
(回帰分析、統計検定など)
・データ可視化スキル
(論文・レポート向けの図表作成経験)
案件内容

DNAのメチル化情報(エピゲノム)やプロテオーム、メタボローム、MRI画像などの生体データを用いた、生物学的年齢(バイオロジカル・エイジ)の予測モデルおよび予防介入AIの開発をお任せします。
・アジア最大規模のゲノム・生体データを活用したAIモデルの構築・評価・改善 ・血液検査の数値等を予測するバイオマーカー予測アルゴリズムの開発 ・予防医療に向けた、ユーザーへの介入・レコメンドAIの構築 ・データの収集・前処理・整形(数十万次元のデータや、不均衡データへの対応など) ・LightGBMなどの機械学習から、深層学習を用いた基盤モデルまでの検証および実装

必須スキル
・PythonまたはRでのデータ分析経験(Pandas / NumPy 等) ・機械学習モデルの実務経験(分類・回帰・異常検知など)
・実験・分析の結果を整理し、再現性のある形で共有、改善案まで言語化できること
・新しいドメイン知識(医療・バイオなど)を積極的にキャッチアップする意欲
案件内容

通信事業者向けスマホアプリのユーザ行動ログを分析し、既存機能の改善示唆を提案
分析手法の提案、分析実施、結果報告、ツール提案およびダッシュボード構築を担当

必須スキル
・SQL経験
・データ分析経験(物販・販促系の分析経験尚良)
・BIツールによるデータマート作成、ダッシュボード作成経験
・コミュニケーション能力
案件内容

研究開発部門にて、DNAメチル化(エピゲノム)データを用いた統計解析業務を担当します。 チーフサイエンティストやバイオインフォマティクスチームと連携し、解析結果を医学論文や学会発表で用いるための「質の高い図表」としてアウトプットすることが重要なミッションです。
・エピゲノムデータ、健康診断データ等のクレンジング・整形 ・探索的データ分析(EDA)および仮説検証 ・論文投稿・学会発表用のデータ可視化(R/ggplot2等を用いたPublication Qualityの作図) ・統計解析(回帰分析、生存時間解析など) ・PythonおよびRを用いた解析パイプラインのコード整備

必須スキル

・PythonまたはRを用いたデータ分析実務経験(Pandas, Tidyverse等)
・論文やレポート向けの高度なデータ可視化スキル(見た目を美しく分かりやすく整えられる能力)
・統計学の基礎知識
・他職種(研究者・エンジニア)と連携して仮説検証を進めるコミュニケーション能力

案件内容

スタートアップの研究開発部門にて、DNAメチル化(エピゲノム)データを用いた統計解析業務を担当します。 チーフサイエンティストやバイオインフォマティクスチームと連携し、解析結果を医学論文や学会発表で用いるための「質の高い図表」としてアウトプットすることが重要なミッションです。
・エピゲノムデータ、健康診断データ等のクレンジング・整形 ・探索的データ分析(EDA)および仮説検証 ・論文投稿・学会発表用のデータ可視化(R/ggplot2等を用いたPublication Qualityの作図) ・統計解析(回帰分析、生存時間解析など) ・PythonおよびRを用いた解析パイプラインのコード整備

必須スキル
・PythonまたはRを用いたデータ分析実務経験(Pandas, Tidyverse等)
・論文やレポート向けの高度なデータ可視化スキル(見た目を美しく分かりやすく整えられる能力)
・統計学の基礎知識
・他職種(研究者・エンジニア)と連携して仮説検証を進めるコミュニケーション能力
案件内容

生物学的年齢を再定義するアルゴリズム・アーキテクト
・エピジェネティクス情報を用いた新規エイジングクロック(生物学的年齢)算出ロジックの考案 ・臓器別(脳・心臓・腸など)の老化予測モデルの要件定義および実験計画の策定
・深層学習(LLM等)をバイオデータへ適用するためのアーキテクチャ設計および技術選定
・解析結果に基づく「病気にならない体作り(介入方法)」のサービス化に向けた仕様検討

必須スキル
・機械学習・深層学習を用いた新規アルゴリズムの研究開発・実装経験 ・論文からの先行研究調査および実装(SOTAのキャッチアップ)能力
・不確実性が高いデータ(正解が曖昧なデータ)に対する評価指標(F1スコア、再現率等)の設計能力
案件内容

生命のコードをAIに学習させる。LLM×深層学習エンジニア
・Python/PyTorchを用いた深層学習モデル(CNN/Transformer等)の構築・学習・評価, ・大規模言語モデル(LLM)技術を応用したエピジェネティクス解析モデルの実装
・特徴量エンジニアリングおよびハイパーパラメータチューニングによるモデル精度向上
・Git/GitLabを用いたチーム開発(プルリクエスト、コードレビュー)およびモデル管理, ・クラウド環境(GCP/BigQuery等)を用いた学習基盤の活用

必須スキル
・PythonまたはRを用いたデータ分析の実務経験
・機械学習モデル構築の実務経験、または同等レベルの知見
・分析結果を整理し、改善案まで含めて言語化できる能力
案件内容

・データ分析
・DWH構築
・データ統合

<環境/言語/ツール>
azure synapse analytics

必須スキル
・複雑なデータ処理に関わるプログラミングの広範な知識
・データ作成の正確性(納品に耐えうるデータ作成)
・上記スキルを満たす方
案件内容

・研究開発(R&D)領域におけるデータ分析・機械学習業務
・データ収集、前処理、品質確認(欠損・外れ値・分布確認 等)
・探索的データ分析(EDA)、可視化、仮説検証
・機械学習モデルの構築および評価(分類/回帰/時系列/異常検知 等)
・特徴量設計、評価指標設計、データリーク検知
・分析結果のドキュメント化、再現性を意識した社内共有
・適性に応じてモデル開発高度化、AI×DB活用、MLOps領域への関与あり

必須スキル
・PythonまたはRを用いたデータ分析の実務経験
・機械学習モデル構築の実務経験、または同等レベルの知見
・分析結果を整理し、改善案まで含めて言語化できる能力

検索結果306件中1-10件