ScrapyフレームワークによるBOSS直聘データ抽出
環境構築と基本設定
ScrapyはPython向けのクローラーフレームワークです。本記事ではBOSS直聘サイトの求人情報を抽出する実装例を示します。
プロジェクト初期化手順
プロジェクト作成: scrapy startproject BOSS
スパイダー生成: cd BOSS && scrapy genspider job_spider zhipin.com
アイテム定義(items.py):
import scrapy
class JobItem(scrapy.Item):
...
6月11日 22:07 投稿