国产成人精品日本亚洲999,99久久久国产精品免费蜜臀 ,v一区无码内射国产,被调教的少妇雅芳1一19,国产成人a亚洲精v品无码

更新于 9月13日

AI深度學習工程師

5.5-8萬·16薪
  • 杭州
  • 3-5年
  • 碩士
  • 全職
  • 招1人

雇員點評標簽

  • 工作環(huán)境好
  • 同事很nice
  • 團隊執(zhí)行強

職位描述

自然語言處理TransformerPyTorchSGLANGPythonC++C語言推理 LLM人工智能云計算/大數據電子/半導體/集成電路
職位描述 1. 基于對 主流AI芯片 和 服務器架構 的深刻理解,分析硬件加速特征與內部拓撲結構,提供硬件優(yōu)化實踐和調優(yōu)指南,確保充分發(fā)揮硬件潛能。 2. 結合主流LLM推理框架 (如sglang/vLLM) 和 大模型結構及其計算特性,通過軟硬件協(xié)同優(yōu)化和技術創(chuàng)新 (包括但不限于 硬件算子優(yōu)化、顯存以及并行化等),負責新服務器上的端到端性能分析和優(yōu)化。 3. 提供 場景化的定制優(yōu)化能力,識別并解決大模型在不同業(yè)務場景下的性能瓶頸,快速的給出滿足需求的性能優(yōu)化方案。 4. 熟悉 系統(tǒng)調優(yōu)和Profiling工具 (如 nsys/ncu系列、通用工具如Perf、火焰圖等),負責系統(tǒng)級性能分析與瓶頸定位能力,并能基于硬件特性進行軟件適配與優(yōu)化 5. 洞悉大模型的發(fā)展趨勢和技術演進,結合硬件Profling和Trace 數據,為下一代AI基礎設施的服務器設計與研發(fā)提供量化數據分析支持。 職位要求 1. 熟悉主流AI加速芯片的系統(tǒng)結構、指令集和計算特性,具備異構計算硬件 下的開發(fā)和性能優(yōu)化經驗。 2. 熟悉 sglang/vLLM/Pytorch等主流LLM推理框架 、二次開發(fā)或深度優(yōu)化經驗 (如KV Cache、編譯優(yōu)化,Speculative、量化,DeepEP等優(yōu)化技術) 3. 具備良好的溝通協(xié)作能力和項目組織能力,能與不同背景的團隊高效溝通、協(xié)同,并對項目進行有效的組織與規(guī)劃,以確保項目按時按質按量完成。 如下經驗優(yōu)先: 1.性能調優(yōu)經驗: sglang/vLLM 新硬件使能和優(yōu)化經驗, 針對 模型優(yōu)化的經驗優(yōu)先

工作地點

杭州市-西湖區(qū)-三墩鎮(zhèn)燈彩街1008號

職位發(fā)布者

杜垠/人事經理

昨日活躍
立即溝通
公司Logo阿里云
阿里云創(chuàng)立于2009年,是全球領先的云計算及人工智能科技公司,為200多個國家和地區(qū)的企業(yè)、開發(fā)者和政府機構提供服務。阿里云致力于以在線公共服務的方式,提供安全、可靠的計算和數據處理能力,讓計算和人工智能成為普惠科技。2017年1月阿里云成為奧運會全球指定云服務商。阿里云在全球29個地域開放了88個可用區(qū),通過底層統(tǒng)一的飛天操作系統(tǒng),為全球數十億用戶提供可靠的計算支持。阿里云致力于為員工提供挑戰(zhàn)有趣的工作,暖心的福利,無限的發(fā)展機會,期待你的加入,和我們一起用技術創(chuàng)未來!
公司主頁