職位描述
負責(zé)大模型(LLM)數(shù)據(jù)全流程管理,包括數(shù)據(jù)采集、清洗、標注及預(yù)處理,構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集;
設(shè)計并實現(xiàn)高效的數(shù)據(jù)管道(Pipeline),支持分布式數(shù)據(jù)處理與迭代。
任職要求
教育背景?:計算機科學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)或相關(guān)專業(yè)本科及以上學(xué)歷
?工作經(jīng)驗?:2年以上大數(shù)據(jù)處理或AI數(shù)據(jù)工程經(jīng)驗,有LLM項目經(jīng)歷者優(yōu)先
技能要求:熟悉Java語言,熟悉SQL/NoSQL數(shù)據(jù)庫,具備ETL流程開發(fā)經(jīng)驗。