1.人工智能、計算機、通信、網(wǎng)絡等專業(yè)領(lǐng)域。
2.對Transformer、MOE、多模態(tài)、擴散模型等大模型架構(gòu)有深入理解,熟悉LLM、AIGC、多模態(tài)等相關(guān)算法的研究與算法優(yōu)化;
3.精通大模型預訓練與微調(diào)策略,包括多模態(tài)無監(jiān)督預訓練、有監(jiān)督微調(diào)與提示學習;
4.精通信號(語音)處理方法,深入研究自動語音識別、語音合成和語音多模態(tài)大模型等前沿技術(shù),部分與電磁信號共性技術(shù)可直接遷移至電磁大模型上;
5.精通多模態(tài)對齊和知識蒸餾技術(shù),熟練使用DeepSpeed、Megatron等多種分布式訓練框架;
6.熟練掌握大模型微調(diào)技術(shù),包括LoRA、DPO策略優(yōu)化,熟悉MoE、AI Agent和RAG技術(shù)。
1、根據(jù)業(yè)務需求,負責領(lǐng)域/場景大模型技術(shù)路線論證工作,提供技術(shù)解決方案,包括但不限于多模態(tài)數(shù)據(jù)理解、RAG、AI Agent等;
2、與平臺工程師、數(shù)據(jù)科學家、評測工程師等團隊合作,開展大模型數(shù)據(jù)工程、訓練與微調(diào)、對齊、評估、云邊端部署等工作與工具鏈建設;
3、大模型迭代、訓練與優(yōu)化工作,持續(xù)提高大模型在業(yè)務場景中的性能水平;
4、負責優(yōu)化電磁大模型架構(gòu),推進多任務應用落地
5、構(gòu)建電磁大模型的測評基準,測評在電磁多任務效果,推動大模型性能提升
6、負責電磁大模型內(nèi)存和推理速度優(yōu)化,降低訓練部署成本和推理延時
7、編寫項目論證方案、實施方案與項目總結(jié)報告等相關(guān)技術(shù)報告、研發(fā)文檔、匯報PPT等文檔撰寫;
8、關(guān)注大模型相關(guān)技術(shù)發(fā)展趨勢,參與集團公司大模型相關(guān)論證工作。