崗位描述:
SFT 和RL 數(shù)據(jù)質(zhì)檢與驗(yàn)收:對(duì)大模型監(jiān)督微調(diào)(SFT)、強(qiáng)化學(xué)習(xí)(RL)任務(wù)的數(shù)據(jù)進(jìn)行全流程質(zhì)檢,包括數(shù)據(jù)標(biāo)注的準(zhǔn)確性、一致性、合規(guī)性核查,依據(jù)標(biāo)注規(guī)范和業(yè)務(wù)需求,嚴(yán)格驗(yàn)收數(shù)據(jù)質(zhì)量,保障數(shù)據(jù)符合算法訓(xùn)練要求。
問(wèn)題分析與優(yōu)化:深度分析質(zhì)檢過(guò)程中發(fā)現(xiàn)的數(shù)據(jù)問(wèn)題,如標(biāo)注錯(cuò)誤、邏輯矛盾、格式不統(tǒng)一等,提出優(yōu)化建議并推動(dòng)標(biāo)注團(tuán)隊(duì)改進(jìn);定期總結(jié)數(shù)據(jù)質(zhì)量問(wèn)題,協(xié)助完善標(biāo)注規(guī)則和驗(yàn)收標(biāo)準(zhǔn)。
跨部門(mén)協(xié)作:與數(shù)據(jù)標(biāo)注團(tuán)隊(duì)、算法研發(fā)團(tuán)隊(duì)、產(chǎn)品團(tuán)隊(duì)緊密溝通,及時(shí)反饋數(shù)據(jù)質(zhì)量情況,根據(jù)業(yè)務(wù)需求調(diào)整質(zhì)檢策略;參與數(shù)據(jù)標(biāo)注流程優(yōu)化,為大模型訓(xùn)練提供高質(zhì)量數(shù)據(jù)支持。
崗位要求:
專(zhuān)業(yè)知識(shí):熟悉大模型數(shù)據(jù)標(biāo)注流程,深入了解 SFT、RL 等技術(shù)原理及在數(shù)據(jù)標(biāo)注中的應(yīng)用,具備扎實(shí)的機(jī)器學(xué)習(xí)或自然語(yǔ)言處理理論基礎(chǔ)。
實(shí)踐經(jīng)驗(yàn):1 年以上大模型數(shù)據(jù)標(biāo)注質(zhì)檢或相關(guān)工作經(jīng)驗(yàn),有 SFT、RL 任務(wù)數(shù)據(jù)質(zhì)檢經(jīng)驗(yàn)者優(yōu)先;熟練使用常見(jiàn)數(shù)據(jù)質(zhì)檢工具,能夠高效處理大規(guī)模數(shù)據(jù)。
其他要求:邏輯思維嚴(yán)謹(jǐn),具備較強(qiáng)的問(wèn)題排查和解決能力;擁有出色的溝通協(xié)調(diào)能力,能夠在跨部門(mén)協(xié)作中高效推進(jìn)工作;對(duì)人工智能行業(yè)充滿(mǎn)熱情,具備持續(xù)學(xué)習(xí)新技術(shù)的能力。