1.數(shù)據(jù)標注與清洗:對文本、圖像、音頻、視頻等多模態(tài)數(shù)據(jù)進行標注、分類、校對和清洗,確保數(shù)據(jù)質量符合模型訓練要求。
2.數(shù)據(jù)質量把控:遵循標注規(guī)范,保證標注結果的準確性和一致性,定期復核標注結果并修正錯誤。
3.數(shù)據(jù)分析與反饋:記錄標注過程中的常見問題,反饋數(shù)據(jù)分布偏差或標注難點,輔助模型優(yōu)化。
4.工具與流程優(yōu)化:熟悉標注工具,參與標注工具的測試和改進。
5.標注人員管理:不限于培訓、答疑、質檢、日常工作管理等。
1.有兩年及以上數(shù)據(jù)標注或相關項目經(jīng)驗,有多模態(tài)多領域標注經(jīng)驗優(yōu)先。
2.對AI和大模型有基本了解,理解數(shù)據(jù)標注對模型訓練的重要性。
3.細心、耐心,具備較強的責任心和抗壓能力。
4、有數(shù)據(jù)標注、內容審核、語言學分析相關經(jīng)驗者優(yōu)先。
5、熟悉電力行業(yè)優(yōu)先。
6、熟悉Python/SQL等基礎工具,能進行簡單數(shù)據(jù)處理者優(yōu)先。