募集終了
【AIエンジニア】コールセンター向けAIエンジニア(音声認識)の求人・案件
リモート
※本サイトでは募集中の案件だけでなく過去の募集案件を掲載しております。
※単価や稼働日数など条件面についても無料サポート登録よりお気軽にご相談ください。
※当社が保有する非公開案件等からスキルに適した案件をご提案いたします。
案件概要
| 職種 | |
|---|---|
| 案件内容 |
大手コールセンターのクライアントにてPoCや実用システムを構築するエンジニアが不足しており、特にコールセンター系由来の音声データ処理のエキスパートを募集します。 経験・スキルに応じてタスクをご依頼する想定です。 |
| 必須スキル | ① 音声処理・信号処理の基礎知識
デジタル信号処理(DSP)
サンプリング理論、スペクトル解析(FFTなど)
ノイズ除去・音響特徴抽出(MFCC、Spectrogram、Pitch等)
② 音声認識・合成関連の技術
ASR(Automatic Speech Recognition):音声→テキスト
TTS(Text to Speech):テキスト→音声
主要なライブラリ例:
SpeechRecognition, Kaldi, wav2vec2.0, ESPnet, Whisper (OpenAI) など
③ 音声データの前処理とアノテーション、ノイズ除去(Denoising)
音声区間検出(VAD: Voice Activity Detection)
話者分離(Diarization)
アノテーション(ラベリングツールの活用、ex. Audacity, Praat)
④ プログラミングとツール活用スキル
Python(NumPy, Pandas, LibROSA, PyDubなど)
音声ライブラリ:LibROSA、torchaudio、soundfile
データパイプライン構築:音声→特徴量→モデル入力
クラウド連携:Google Speech API, Azure Speech, AWS Transcribe等
⑤ 機械学習・深層学習の基礎、音声認識モデルに関する知識(RNN, LSTM, CNN, Transformer系)
PyTorch / TensorFlowでのモデル実装
HuggingFaceモデルの転用(例:wav2vec2.0)
⑥ 応用領域に応じた理解
多言語対応(言語モデルへの理解)
音声UI / コールセンター業務への適用知識
字幕生成・文字起こし支援での品質評価(WERなど)
医療・教育分野への応用
|
| 稼働率 | 100% |
| 面談回数 | 1回 |
| 稼働日数 | 週5日 |
| 募集人数 | 1人 |