工作職責:
1、運維保障:通過不斷優(yōu)化技術架構,為業(yè)務提供安全、穩(wěn)定,高效,易用的數(shù)據(jù)服務能力,支撐業(yè)務和數(shù)據(jù)量的快速擴張;
2、高可用能力保障:沉淀業(yè)務保障關鍵能力,如應急響應、故障恢復,健康巡檢,變更管控,日常演練等;
3、自動化能力提升:負責內(nèi)外部系統(tǒng)的日常管理和運維,利用自動化手段解決運維平臺問題,提高其他部門生產(chǎn)力;
4、CI/DC能力提升:維護并改善CI/CD流程, 參與設計 CT (continuous testing) 流程,實現(xiàn)監(jiān)控告警和故障恢復自動化;
5、運維平臺開發(fā)&技術調(diào)研:CMDB、系統(tǒng)運維自動化平臺、自動化業(yè)務監(jiān)控平臺、自動化工單系統(tǒng)、Devops平臺開發(fā);相關技術調(diào)研與文檔輸出。
任職要求:
1、計算機本科及以上學歷,擁有5年以上的運維保障經(jīng)驗;
2、具有 on call 經(jīng)驗,可以隨時處理突發(fā)事件(必備項);
3、熟悉容器化技術(Docker、Kubernetes),且有云平臺部署實踐 ;
4、熟悉Linux (Ubuntu 優(yōu)先),Python等常用運維工具,有一定的腳步編寫能力,熟練使用 bash , 熟悉 sysctl 配置, 了解重要系統(tǒng)指標監(jiān)控和解讀;
5、擁有生產(chǎn)環(huán)境使用 Prometheus 、Zabbix經(jīng)驗, 包括部署, 使用和調(diào)優(yōu);擁有生產(chǎn)環(huán)境lvs等流量轉(zhuǎn)發(fā)工具、nginx等服務代理或者服務網(wǎng)關等組件運維與自動化經(jīng)驗;
6、有 Kafka,Etcd,Zookeeper,RabbitMQ生產(chǎn)環(huán)境部署, 使用和調(diào)優(yōu)經(jīng)驗;具有真實的CMDB、自動化平臺、監(jiān)控平臺、工單系統(tǒng)、Devops開發(fā)經(jīng)驗;
7、熟練使用阿里云、騰訊云平臺和 ELK 平臺和相關工具;具有良好的文檔編寫能力與跨部門溝通能力。