工作地點:深圳天安云谷
服務(wù)部門:AI數(shù)據(jù)
業(yè)務(wù)對象:pangu大模型、行業(yè)模型
工作內(nèi)容:多模態(tài)數(shù)據(jù)處理(文本、語音、圖像[崗位已滿]),數(shù)據(jù)平臺開發(fā)(后端)
成長平臺:駐場HW、對接HW技術(shù)、HW集群和資源平臺和、自研大模型
【崗位一 Python后端開發(fā)】(招聘2人)
1、python技能必須熟練,接受手撕python代碼,熟悉Python后端開發(fā);
2、本科一年以上工作經(jīng)驗,計算機(jī)/軟件相關(guān)碩士可以應(yīng)屆;
3、院校好,相關(guān)專業(yè)優(yōu)先考慮,有NLP大模型相關(guān)經(jīng)驗的優(yōu)先考慮;
【崗位二 python文本數(shù)據(jù)/NLP算法】(招聘4人)
1、python技能必須熟練,接受手撕python代碼,有Python文本或NLP算法開發(fā)經(jīng)驗;
2、本科兩年以上相關(guān)工作經(jīng)驗,計算機(jī)/軟件類碩士可以應(yīng)屆;
3、院校好,相關(guān)專業(yè)優(yōu)先考慮,有NLP大模型相關(guān)經(jīng)驗的優(yōu)先考慮;
【崗位三 Python語音數(shù)據(jù)/流媒體開發(fā)】(招聘1人)
1、python技能必須熟練,接受手撕python代碼;
2、本科一年以上語音數(shù)據(jù)處理經(jīng)驗,音頻技能關(guān)鍵詞有ffmpeg,torchaudio,librosa,pydub;
3、院校好,相關(guān)專業(yè)優(yōu)先考慮,有NLP大模型相關(guān)經(jīng)驗的優(yōu)先考慮;
【工作職責(zé)】
1、負(fù)責(zé)多模態(tài)大模型數(shù)據(jù)語料生產(chǎn)和處理,包括但不限于數(shù)據(jù)生成增強(qiáng)、分布研究、數(shù)據(jù)獲取、數(shù)據(jù)規(guī)范化、數(shù)據(jù)質(zhì)量檢測、打標(biāo)等,確保訓(xùn)練數(shù)據(jù)的有效性,可用性;
2、負(fù)責(zé)優(yōu)化和改進(jìn)現(xiàn)有的數(shù)據(jù)清洗和質(zhì)檢打標(biāo)流程,提高效率和準(zhǔn)確性;
3、負(fù)責(zé)大模型相關(guān)數(shù)據(jù)工具鏈的開發(fā)實現(xiàn)及應(yīng)用維護(hù)等;