【崗位職責(zé)】
(實習(xí)3~4天/周 實習(xí)6個月以上)
1、跟蹤并研究強化學(xué)習(xí)(Reinforcement Learning, RL)領(lǐng)域的最新研究進展,具備較強的論文閱讀與復(fù)現(xiàn)能力;?
2、基于目前的E2E算法,開發(fā)與之適配的RL策略,探索其在自動駕駛場景中的應(yīng)用;?
3、協(xié)助構(gòu)建高質(zhì)量的仿真環(huán)境與真實數(shù)據(jù)集,推動算法在實際任務(wù)中的泛化能力;?
4、優(yōu)化現(xiàn)有RL算法的訓(xùn)練效率與穩(wěn)定性,提升策略收斂速度與性能表現(xiàn);
【任職要求】
1.掌握python,熟悉pytorch框架,具備扎實的深度學(xué)習(xí)和大語言模型算法基礎(chǔ);?
2.具備扎實的機器學(xué)習(xí)、深度學(xué)習(xí)與強化學(xué)習(xí)理論基礎(chǔ),熟悉常見RL算法(如DQN、PPO、SAC、TD3等);?
3.熟悉OpenAI Gym、 Carla 、Unity ML-Agents等仿真平臺;?
4.計算機、信息、數(shù)學(xué)、電子、自動化、機械、測控、汽車等相關(guān)專業(yè)碩士及以上學(xué)歷,具有扎實的數(shù)學(xué)功底和算法基礎(chǔ);計算機基礎(chǔ)扎實,熟練掌握Python、Pytorch編程,熟悉Linux?
5.熟悉Sparsedrive、VAD、driveVLM等端到端自動駕駛算法優(yōu)先
【加分項】?
有強化學(xué)習(xí)在真實系統(tǒng)(如機器人、自動駕駛等)中的應(yīng)用經(jīng)驗;?
熟悉多智能體強化學(xué)習(xí)(MARL)、元強化學(xué)習(xí)(Meta-RL)或?qū)哟螐娀瘜W(xué)習(xí)(HRL);?
掌握C++、CUDA等底層編程語言,具備高性能計算優(yōu)化經(jīng)驗;?
熟悉Ray RLlib、Stable-Baselines3、CleanRL等開源強化學(xué)習(xí)框架;??