工作概述:
1、深度參與大語言模型的數(shù)據(jù)處理、prompt工程、模型訓練、調(diào)優(yōu)、系統(tǒng)評測和模型推理;
2、負責行業(yè)大語言模型應用,包括但不限于對話問答、信息提取、文本生成、序列決策等場景幫助團隊達成目標效果和應用落地;
3、針對細分業(yè)務場景的數(shù)據(jù)處理、模型微調(diào)、prompt tuning等,以適應場景并達成業(yè)務目標;
4、參與設計行業(yè)大語言模型的應用方案設計。
任職要求:
1、本科及以上學歷,計算機類及相關專業(yè)及碩士優(yōu)先;
2、熟悉python和常用的算法庫和深度學習訓練框架,有分布式預訓練的經(jīng)驗,良好的開發(fā)能力;
3、了解常用的預訓練模型與技術概念,如Transformer/BERT/GPT/T5/LayoutLM等,有多模態(tài)經(jīng)驗者優(yōu)先;
4、對NLP主流大模型如GPT3/chatGPT/T5/LLaMA/GLM等的原理和差異有深入的理解和實際項目經(jīng)驗者優(yōu)先;
5、有大模型、智能對話、知識圖譜、搜索引擎等工業(yè)級系統(tǒng)算法開發(fā)實戰(zhàn)經(jīng)驗者優(yōu)先;
6、具有自主學習能力和自我驅(qū)動力。