工作職責(zé)
1、針對(duì)業(yè)務(wù)場(chǎng)景(如智能外呼、智能客服、虛擬人)設(shè)計(jì)高表現(xiàn)力的語音合成系統(tǒng)
2、主導(dǎo)完成訓(xùn)練數(shù)據(jù)預(yù)處理、模型調(diào)優(yōu)與評(píng)估等任務(wù)
3、推動(dòng)TTS技術(shù)的落地應(yīng)用與用戶體驗(yàn)提升,推動(dòng)語音系統(tǒng)可聽性、響應(yīng)速度的技術(shù)升級(jí)
4、負(fù)責(zé)語音合成前沿算法的研究與優(yōu)化,以及多音色/少樣本語音合成技術(shù)的探索落地
任職要求
1、計(jì)算機(jī)科學(xué)、信號(hào)處理、語音相關(guān)專業(yè)碩士或211本科以上學(xué)歷,3年以上語音合成研發(fā)經(jīng)驗(yàn)
2、熟練使用python/c++,熟悉深度學(xué)習(xí)框架(pytorch/tensorflow),具備模型訓(xùn)練、壓縮與端側(cè)部署經(jīng)驗(yàn)
3、熟悉主流大模型語音合成技術(shù)(如VITS、Tacotron2、cosyvoice、f5tts、HiFi-GAN等)
4、熟悉傳統(tǒng)TTS各個(gè)模塊的技術(shù)并且具有相關(guān)經(jīng)驗(yàn)和落地,如聲學(xué)模型、神經(jīng)網(wǎng)絡(luò)聲碼器
5、具備音色克隆、情感控制、實(shí)時(shí)合成等實(shí)戰(zhàn)經(jīng)驗(yàn)
6、加分項(xiàng)目:具備多方言TTS系統(tǒng)開發(fā);語音驅(qū)動(dòng)數(shù)字人技術(shù);有論文發(fā)表經(jīng)驗(yàn);實(shí)際多輪語音交互系統(tǒng)