国产成人精品日本亚洲999,99久久久国产精品免费蜜臀 ,v一区无码内射国产,被调教的少妇雅芳1一19,国产成人a亚洲精v品无码

更新于 9月17日

推理模型性能優(yōu)化

10-15萬
  • 上海浦東新區(qū)
  • 5-10年
  • 碩士
  • 全職
  • 招1人

職位描述

SGLANG,VLLM
崗位職責(zé):
? 分析深度學(xué)習(xí)網(wǎng)絡(luò)(LLM等),優(yōu)化深度學(xué)習(xí)模型以實(shí)現(xiàn)低延遲、高
吞吐量的推理。
? 使用 vLLM或SGlangM 等推理加速引擎部署模型
? 理解、分析、剖析和優(yōu)化深度學(xué)習(xí)工作負(fù)載并在我們的硬件和軟件平臺(tái)上進(jìn)行
深度性能。
? 與內(nèi)部和外部研究人員合作,確保模型從訓(xùn)練到推理部署的無縫集成
任職要求:
? 計(jì)算機(jī)科學(xué)、電子工程或相關(guān)專業(yè)碩士及以上學(xué)歷,博士學(xué)位優(yōu)先。
? 7 年以上工作經(jīng)驗(yàn)
? 在深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面有著扎實(shí)的背景,包括訓(xùn)練或推理。
? 精通AI負(fù)載性能加速方案包括并行方式、量化、壓縮、投機(jī)策略、調(diào)度系統(tǒng)

? 熟悉主流的推理加速引擎vLLM或SGlang
? 對(duì)計(jì)算機(jī)架構(gòu)有深入的理解,并熟悉加速芯片架構(gòu)的基礎(chǔ)知識(shí)。
? 具備分析、建模和優(yōu)化應(yīng)用程序性能的豐富經(jīng)驗(yàn)。
? C++ 和 Python 編程技能

工作地點(diǎn)

上海浦東新區(qū)張江路

職位發(fā)布者

周宏馳/招聘負(fù)責(zé)人

剛剛活躍
立即溝通
深圳市義方管理咨詢有限公司
We know that in the semiconductor industry, excellent talents are very valuable and scarce resources. Our team of experienced recruiters has a proven track record of successfully matching exceptional candidates with some of the most respected companies in the industry.We believe that we can provide your organization with the same level of service and results. We look forward to a successful working relationship in the future.
公司主頁