崗位職責(zé):
負(fù)責(zé)SRE團隊技術(shù)方向制定和團隊管理,推動穩(wěn)定性工程最佳實踐落地
設(shè)計和優(yōu)化多云環(huán)境下的系統(tǒng)架構(gòu)穩(wěn)定性,制定SLI/SLO體系和錯誤預(yù)算管理
主導(dǎo)重大故障應(yīng)急響應(yīng),建立故障處理流程和應(yīng)急預(yù)案
負(fù)責(zé)容災(zāi)體系設(shè)計和災(zāi)難恢復(fù)演練,確保業(yè)務(wù)連續(xù)性
推動跨團隊協(xié)作,建立SRE文化和穩(wěn)定性意識
任職要求:
本科及以上學(xué)歷,計算機相關(guān)專業(yè),5年以上大型互聯(lián)網(wǎng)公司SRE/DevOps經(jīng)驗
精通多云架構(gòu)設(shè)計(AWS、阿里云、GCP、OCI),具備大規(guī)模分布式系統(tǒng)穩(wěn)定性治理經(jīng)驗
熟悉Kubernetes、Docker、服務(wù)網(wǎng)格等云原生技術(shù)棧
具備優(yōu)秀的架構(gòu)設(shè)計能力和容災(zāi)規(guī)劃經(jīng)驗
優(yōu)秀的團隊管理和跨部門協(xié)作能力
英語讀寫能力良好,能閱讀英文技術(shù)文檔
Onsite易點天下,外企七險一金,15天年假,試用期100%薪資