日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

Python爬蟲 scrapy框架爬取某招聘網存入mongodb解析

系統 2210 0

創建項目

            
scrapy startproject zhaoping
          

創建爬蟲

            
cd zhaoping
scrapy genspider hr zhaopingwang.com
          

目錄結構

Python爬蟲 scrapy框架爬取某招聘網存入mongodb解析_第1張圖片

items.py

            
  title = scrapy.Field()
  position = scrapy.Field()
  publish_date = scrapy.Field()
          

pipelines.py

            
from pymongo import MongoClient

mongoclient = MongoClient(host='192.168.226.150',port=27017)
collection = mongoclient['zhaoping']['hr']

class TencentPipeline(object):
  def process_item(self, item, spider):
    print(item)
    # 需要轉換為 dict
    collection.insert(dict(item))
    return item
          

spiders/hr.py

            
def parse(self, response):
    # 不要第一個 和最后一個
    tr_list = response.xpath("http://table[@class='tablelist']/tr")[1:-1]
    for tr in tr_list:
      item = TencentItem()
      # xpath 從1 開始數起
      item["title"] = tr.xpath("./td[1]/a/text()").extract_first()
      item["position"] = tr.xpath("./td[2]/text()").extract_first()
      item["publish_date"] = tr.xpath("./td[5]/text()").extract_first()
      yield item

    next_url = response.xpath("http://a[@id='next']/@href").extract_first()
    # 構造url
    if next_url != "javascript:;":
      print(next_url)
      next_url = "https://hr.tencent.com/" + next_url
      yield scrapy.Request(url=next_url,callback=self.parse,)
          

就是這么簡單,就獲取到數據

Python爬蟲 scrapy框架爬取某招聘網存入mongodb解析_第2張圖片

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 庆安县| 濮阳县| 吉林省| 龙岩市| 闻喜县| 仙游县| 长宁县| 宜兰市| 胶南市| 玉林市| 鄂州市| 凤阳县| 上栗县| 邢台县| 德令哈市| 江北区| 克山县| 基隆市| 宜春市| 满洲里市| 阿拉尔市| 固始县| 屏边| 新沂市| 洛扎县| 迁安市| 确山县| 水城县| 剑阁县| 罗平县| 军事| 宝坻区| 克什克腾旗| 石林| 屏山县| 南通市| 台东市| 类乌齐县| 大理市| 青龙| 丰顺县|