国产成人精品日本亚洲999,99久久久国产精品免费蜜臀 ,v一区无码内射国产,被调教的少妇雅芳1一19,国产成人a亚洲精v品无码

更新于 9月5日

高級(jí)爬蟲工程師

1.2-1.3萬·13薪
  • 西安未央?yún)^(qū)
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

數(shù)據(jù)清洗反爬蟲Python數(shù)據(jù)采集AI
負(fù)責(zé)各類互聯(lián)網(wǎng)平臺(tái)的數(shù)據(jù)采集,建立穩(wěn)定高效的爬蟲流程。
負(fù)責(zé)任務(wù)的定時(shí)執(zhí)行、采集速度控制、失敗重試,保證采集過程穩(wěn)定可靠。
對(duì)采集到的原始數(shù)據(jù)進(jìn)行清洗、結(jié)構(gòu)化、去重與質(zhì)量校驗(yàn)。
設(shè)計(jì)并維護(hù)數(shù)據(jù)庫/存儲(chǔ)模型,實(shí)現(xiàn)數(shù)據(jù)的入庫與快照管理。
搭建日志、監(jiān)控與報(bào)警體系,持續(xù)優(yōu)化采集與處理流程。
熟悉 HTTP/HTTPS 協(xié)議,能夠分析請(qǐng)求頭、參數(shù)和分頁規(guī)則。
熟悉使用抓包工具(Fiddler、mitmproxy、Charles),能夠完成接口抓取與復(fù)現(xiàn)。
熟悉 JSON、Protobuf 等數(shù)據(jù)格式,具備接口解析和數(shù)據(jù)處理能力。
熟悉 PostgreSQL / MySQL,掌握常見的數(shù)據(jù)去重、快照和更新方法,了解 Redis 在緩存和限流中的應(yīng)用。
具備數(shù)據(jù)清洗與質(zhì)量控制經(jīng)驗(yàn),能夠保證采集數(shù)據(jù)的準(zhǔn)確性。
了解定時(shí)任務(wù)和調(diào)度工具(如APScheduler、Airflow),有日志和監(jiān)控經(jīng)驗(yàn)(Prometheus、Grafana、ELK)。
熟練掌握 Python 或 Node.js/TypeScript,具備并發(fā)采集經(jīng)驗(yàn)。
有app端數(shù)據(jù)爬取者經(jīng)驗(yàn)優(yōu)先

工作地點(diǎn)

未央?yún)^(qū)西安工業(yè)設(shè)計(jì)產(chǎn)業(yè)園-凱瑞E座

職位發(fā)布者

李先生/研發(fā)

昨日活躍
立即溝通