崗位要求:
1、碩士及以上學歷,計算機、人工智能等相關專業(yè)畢業(yè);
2、實驗能力強(可快速復現(xiàn)前沿技術并評估可行性)、實戰(zhàn)能力強(技術方案通過可行性評估后,具備獨立封裝算法模型的能力);
3、精通Python、C/C++(可選)等編程語言,熟練掌握PyTorch等主流深度學習框架,Transformers、Vlm等;
4、熟悉大模型分布式訓練技術和框架庫,如DeepSpeed等,熟悉框架庫源碼,有多卡或多機的大模型訓練經驗;
5、熟悉知識圖譜相關技術原因、圖數(shù)據等技術;
6、精通大模型推理優(yōu)化技術、精通各種微調技術,如LORA、QLORA、SFT、DPO等。
崗位職責:
1、負責大模型相關場景的工程化落地,探索業(yè)界先進的大模型(及架構)、Agent技術/框架、前沿RAG技術等;
2、圍繞大模型(包括多模態(tài))領域,構建從數(shù)據采集、加工標注、算法訓練部署至推理加速等;
3、負責大模型的結構設計、訓練、微調、部署和優(yōu)化,提高模型的效率、穩(wěn)定性和可擴展性;
4、跟蹤國內外前沿的大模型技術動態(tài),持續(xù)改進和優(yōu)化現(xiàn)有模型;
5、負責知識圖譜(知識及index)全自動化構建,全流程(抽取、融合、消歧等)優(yōu)化等。