募集終了
【AIエンジニア】コールセンター向けAIエンジニア(音声認識)の求人・案件

リモート

※本サイトでは募集中の案件だけでなく過去の募集案件を掲載しております。
※単価や稼働日数など条件面についても無料サポート登録よりお気軽にご相談ください。
※当社が保有する非公開案件等からスキルに適した案件をご提案いたします。

案件概要

職種
案件内容

大手コールセンターのクライアントにてPoCや実用システムを構築するエンジニアが不足しており、特にコールセンター系由来の音声データ処理のエキスパートを募集します。

経験・スキルに応じてタスクをご依頼する想定です。

必須スキル
① 音声処理・信号処理の基礎知識
デジタル信号処理(DSP)
サンプリング理論、スペクトル解析(FFTなど)
ノイズ除去・音響特徴抽出(MFCC、Spectrogram、Pitch等)

 

② 音声認識・合成関連の技術
ASR(Automatic Speech Recognition):音声→テキスト
TTS(Text to Speech):テキスト→音声
主要なライブラリ例:
SpeechRecognition, Kaldi, wav2vec2.0, ESPnet, Whisper (OpenAI) など

 

③ 音声データの前処理とアノテーション、ノイズ除去(Denoising)
音声区間検出(VAD: Voice Activity Detection)
話者分離(Diarization)
アノテーション(ラベリングツールの活用、ex. Audacity, Praat)

 

④ プログラミングとツール活用スキル
Python(NumPy, Pandas, LibROSA, PyDubなど)
音声ライブラリ:LibROSA、torchaudio、soundfile
データパイプライン構築:音声→特徴量→モデル入力
クラウド連携:Google Speech API, Azure Speech, AWS Transcribe等

 

⑤ 機械学習・深層学習の基礎、音声認識モデルに関する知識(RNN, LSTM, CNN, Transformer系)
PyTorch / TensorFlowでのモデル実装
HuggingFaceモデルの転用(例:wav2vec2.0)

 

⑥ 応用領域に応じた理解
多言語対応(言語モデルへの理解)
音声UI / コールセンター業務への適用知識
字幕生成・文字起こし支援での品質評価(WERなど)
医療・教育分野への応用
稼働率 100%
面談回数 1回
稼働日数 週5日
募集人数 1人

関連する案件

お仕事を開始するまでのステップ

案件のご紹介はもちろん、案件参画後も担当コンサルタントより定期的なフォローを実施いたします。

案件お問い合わせ

必須項目

*必須項目です。

*必須項目です。

*年を入力してください。

*月を入力してください。

*日を入力してください。

ハイフン無しでご記入ください

*携帯電話番号を正しく入力してください。

*メールアドレスを正しく入力してください。

*希望稼働日数/週を選択してください。

*希望稼働条件を選択してください。

*職種を選択してください。

*経験年数を選択してください。

経歴書 5MBまで
選択されていません

当社の個人情報保護方針および利用規約に同意の上、送信してください。


個人情報の取り扱い、利用規約に同意してください

戻る