崗位要求:
1、熟練使用Linux/unix(centos、ubuntu)、Windows操作系統(tǒng)或者國產(chǎn)系列等主流操作系統(tǒng)(AnolisOS/openEuler)。
2、熟悉網(wǎng)絡(luò)協(xié)議(TCP/IP/HTTP/DNS)和常見網(wǎng)絡(luò)設(shè)備配置,有良好的網(wǎng)絡(luò)、存儲、安全、計算機體系結(jié)構(gòu)方面的知識。
3、精通Shell/Python/Go等至少一門腳本語言,實現(xiàn)自動化運維。
4、深入理解Kubernetes/Docker架構(gòu),具備集群搭建、故障處理及性能優(yōu)化能力。
5、熟悉微服務(wù)架構(gòu)(如SpringCloud)及相關(guān)組件(注冊中心、消息中間件)。
6、掌握MySQL/Oracle/SQL Server/PostgreSQL/OpenGauss/Redis/Elasticsearch等主流數(shù)據(jù)庫的主從架構(gòu)、運維、SQL優(yōu)化及備份恢復(fù)。
7、熟悉Nginx/Redis/Kafka/RocketMQ/Tomcat等中間件的配置與調(diào)優(yōu)。
8、熟悉CI/CD流程(GitLab/Jenkins/Ansible工具),具備二次開發(fā)經(jīng)驗者優(yōu)先。
9、熟悉主流開源的服務(wù)監(jiān)控、預(yù)警平臺的搭建使用。
10、熟悉灰度、藍綠、雙活等部署方式及數(shù)據(jù)同步、備份、遷移的機制和原理。
11、熟練使用相關(guān)日志收集工具和測試工具(如GPU壓測工具),進行故障分析、診斷及壓測異常處理。
12、具備自動化運維能力、系統(tǒng)均衡容災(zāi)設(shè)計、故障響應(yīng)能力、優(yōu)化資源使用率、有大型集群維護經(jīng)驗者優(yōu)先。
二、崗位職責(zé)
1、系統(tǒng)與服務(wù)運維
參與公司整體 IT 基礎(chǔ)設(shè)施建設(shè)與運維。
負責(zé)服務(wù)器、本地資源的部署、維護、監(jiān)控與性能調(diào)優(yōu),保障系統(tǒng)高可用性和穩(wěn)定性。
管理容器化環(huán)境(如Kubernetes/Docker),處理日常故障、性能優(yōu)化及資源調(diào)度。
維護操作系統(tǒng)(Linux/Windows)、中間件、數(shù)據(jù)庫(MySQL、Oracle、PostgreSQL、OpenGauss、Redis等)及微服務(wù)組件(如Nacos、Kafka、RocketMQ)。
2、運維流程與工具鏈
優(yōu)化生產(chǎn)發(fā)布流程(如藍綠/灰度發(fā)布),降低發(fā)布風(fēng)險。
維護監(jiān)控告警體系(如Prometheus/Zabbix/ELK)、日志系統(tǒng)及DevOps工具鏈(如GitLab/Jenkins/Ansible)。
開發(fā)自動化腳本(Shell/Python)和運維工具,提升運維效率。
3、基礎(chǔ)設(shè)施與安全
管理網(wǎng)絡(luò)架構(gòu)(如DNS/CDN/LVS)、負載均衡及高可用集群(如Keepalived/Nginx)。
落實安全規(guī)范,執(zhí)行漏洞掃描、備份恢復(fù)、訪問控制及容災(zāi)方案。
支持高性能計算集群和大模型平臺的部署與運維。
4、技術(shù)支持與文檔
提供客戶技術(shù)支持,解決系統(tǒng)使用問題,完成培訓(xùn)及項目驗收。
輸出運維文檔(SOP、報告)、優(yōu)化方案,并具備跨團隊溝通能力。