1、負責基于開源大模型的應用開發(fā)與優(yōu)化,包括模型微調(diào)、性能優(yōu)化以及在特定任務中的應用;
2、負責大模型在垂域和特定場景下的繼續(xù)訓練,包括研發(fā)繼續(xù)預訓練、全量/高效微調(diào)和強化學習算法;
3、負責落地大模型工業(yè)級應用算法,包括但不限于智能問答、RAG和Agent等;;
4、利用 Prompt 工程技術優(yōu)化模型的輸出和交互效果,設計高效的 Prompt 模板以提升模型的任務執(zhí)行能力.
任職要求:
1.計算機科學、人工智能、數(shù)學等相關專業(yè)本科及以上學歷,具備深厚的機器學習和深度學習理論基礎;學習態(tài)度、上進心強的畢業(yè)生可適當放寬。
2、熟練掌握NLP和ML基礎理論與算法,熟練掌握Transformer模型架構和原理;
3、熟悉大模型預訓練和微調(diào)框架,掌握Prompt Tuning、P-Tuning、LoRA中至少一種高效微調(diào)技術;
4、熟悉模型壓縮算法,包括但不限于模型蒸餾、量化、剪枝等技術;
5、極強的學習能力,能夠快速理解垂直領域的業(yè)務邏輯。