崗位要求:
1、 計算機(jī)科學(xué)或相關(guān)專業(yè)本科及以上學(xué)歷,3年以上運(yùn)維或運(yùn)維開發(fā)經(jīng)驗(yàn)。
2、精通 Linux 操作系統(tǒng),能熟練進(jìn)行問題診斷和性能調(diào)優(yōu)。
3、精通 Ansible 或其它自動化配置管理工具,有大規(guī)模環(huán)境自動化部署經(jīng)驗(yàn)。
4、 精通 Shell/Python 腳本編程。
5、深入理解網(wǎng)絡(luò)、存儲、負(fù)載均衡等基礎(chǔ)設(shè)施原理。
6、 具備良好的故障排查能力和抗壓能力
7、對GaussDB或GoldenDB的內(nèi)核機(jī)制有深入了解者。
優(yōu)先條件:
1、有從零開始參與設(shè)計或開發(fā)數(shù)據(jù)庫管理平臺、自動化運(yùn)維平臺經(jīng)驗(yàn)者。
2、持有華為GaussDB或中興GoldenDB相關(guān)認(rèn)證者。
3、有大型金融、電信行業(yè)核心系統(tǒng)分布式數(shù)據(jù)庫運(yùn)維經(jīng)驗(yàn)者。
主要職責(zé)
1、負(fù)責(zé)GaussDB和GoldenDB分布式數(shù)據(jù)庫集群的部署、安裝、升級、擴(kuò)容、備份恢復(fù)、性能調(diào)優(yōu)和故障排除。
2、 分布式數(shù)據(jù)庫深度監(jiān)控與性能容量分析,設(shè)計并落實(shí)分布式數(shù)據(jù)自定義巡檢模板,定期/按需執(zhí)行數(shù)據(jù)庫健康巡檢。
3、 編寫和維護(hù) Ansible Playbooks、Shell/Python 腳本,實(shí)現(xiàn)平臺下發(fā)的各類運(yùn)維操作(如安裝、啟停、切換、檢查)。
4、 確保腳本的健壯性、冪等性和詳細(xì)的日志輸出,便于平臺跟蹤任務(wù)狀態(tài)。
5、開發(fā)各類檢查腳本(OS配置基線、數(shù)據(jù)庫參數(shù)一致性、高可用架構(gòu)靜態(tài)配置),并將結(jié)果標(biāo)準(zhǔn)化上報給平臺。
6、深入理解GoldenDB/GaussDB的架構(gòu)和運(yùn)維細(xì)節(jié),為平臺的功能設(shè)計提供專業(yè)建議。
7、當(dāng)平臺操作失敗時,進(jìn)行深度根因分析,是腳本問題、環(huán)境問題還是數(shù)據(jù)庫本身問題。
8、開發(fā)或整合故障自愈(Self-Healing)方案,如數(shù)據(jù)庫異常后的自動重啟與同步重建。
9、負(fù)責(zé)運(yùn)維腳本和平臺操作的權(quán)限控制、審計和合規(guī)性要求。