1. 扎實(shí)的 Java 語言基礎(chǔ),熟悉多線程、IO、網(wǎng)絡(luò)編程等核心API,具備良好的編程習(xí)慣、調(diào)試能力和單元測試意識。
2. 具備 Apache Flink 的實(shí)戰(zhàn)經(jīng)驗(yàn):必須有使用 Flink DataStream API 開發(fā)流式應(yīng)用的項(xiàng)目經(jīng)驗(yàn)(個人/課程/實(shí)習(xí)項(xiàng)目均可)。理解其核心概念:時間語義(Event Time/Processing Time)、狀態(tài)(StateBackend)、窗口(Window)、檢查點(diǎn)(Checkpoint)和容錯機(jī)制。
3. 了解 Apache Kafka:具備一定的實(shí)際操作經(jīng)驗(yàn)。理解其核心概念:Topic/Partition、Producer/Consumer/Consumer Group、Offset、副本機(jī)制。
4. 熟悉Flink與Kafka集成消費(fèi)時的各種配置和調(diào)優(yōu)點(diǎn)。
5. 熟練掌握 Apache Doris:理解其核心數(shù)據(jù)模型(聚合模型、唯一模型、重復(fù)模型)的適用場景并能進(jìn)行合理設(shè)計(jì)。具有數(shù)據(jù)導(dǎo)入的實(shí)戰(zhàn)經(jīng)驗(yàn):熟練使用Stream Load、Routine Load(尤其是來自Kafka)等方式將數(shù)據(jù)高效入庫。
6. 能夠編寫復(fù)雜SQL(如多層嵌套、窗口函數(shù)、多表JOIN)進(jìn)行數(shù)據(jù)查詢和分析。理解其查詢優(yōu)化原理,對索引、分區(qū)、分桶等機(jī)制有實(shí)踐經(jīng)驗(yàn)。
加分項(xiàng):
1.有使用其他大數(shù)據(jù)組件(如 Pulsar、ClickHouse、Hudi)的經(jīng)驗(yàn)
2.有使用調(diào)度工具(如 DolphinScheduler, Apache Airflow)的經(jīng)驗(yàn)。
其他:
1. 大三、大四、研二、研三都可,實(shí)習(xí)時間至少4個月以上,每月 可接受1-2天時間請假,但不接受長時間(5天以上)請假;
2. 實(shí)習(xí)要求實(shí)習(xí)至少3個月,每周5天