1、負(fù)責(zé)大型模型推理服務(wù)以及大模型相關(guān)應(yīng)用的私有化部署和維護(hù)工作,確保模型在客戶環(huán)境中的高效運行。
2、根據(jù)業(yè)務(wù)需求開發(fā)定制的推理服務(wù)功能,并設(shè)計相應(yīng)的部署實施方案。
3、解決現(xiàn)場客戶遇到的各類技術(shù)問題,包括但不限于硬件服務(wù)器、機房網(wǎng)絡(luò)和軟件部署等相關(guān)問題。
4、負(fù)責(zé)服務(wù)器上架、入網(wǎng)等基礎(chǔ)設(shè)施搭建工作,確保部署環(huán)境的正常運行。
5、升級和維護(hù)已部署的推理服務(wù),確保系統(tǒng)穩(wěn)定性和安全性。
6、整理各類交付文檔,總結(jié)并沉淀部署經(jīng)驗,為團隊提供技術(shù)積累和知識分享。
擁有3年及以上相關(guān)工作經(jīng)驗,具備良好的故障排除能力和解決問題的技巧。
1、 熟悉網(wǎng)絡(luò)設(shè)備(如路由器、交換機、防火墻等)的配置和管理。
2、精通Python,熟悉Java開發(fā),了解TypeScript和C編程語言,能夠編寫自動化腳本和工具,提高運維效率和一致性,
3、熟悉Transformer、PyTorch等主流深度學(xué)習(xí)框架,了解TensorFlow、BERT等熱門大型模型框架。
4、熟練使用Linux操作系統(tǒng),掌握Shell腳本編寫,具備K8s,Docker、Kubernetes等容器技術(shù)的使用經(jīng)驗。
5、具備良好的溝通表達(dá)技能和團隊協(xié)作能力。
加分項:
具備生成式大型模型能力的了解及應(yīng)用場景實踐經(jīng)驗。
擁有大數(shù)據(jù)處理、數(shù)據(jù)分析、機器學(xué)習(xí)等相關(guān)領(lǐng)域的工作經(jīng)驗。
在相關(guān)領(lǐng)域有開源項目或技術(shù)博客等展示性成果。