Skip to content

Jリーグ公式サイトから各チームの選手一覧とシーズン成績をスクレイピング

Notifications You must be signed in to change notification settings

Yoshifumi14/jleague-scraping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Jリーグ公式サイトから各チームの選手一覧とシーズン成績をスクレイピング

やってること

例えば川崎フロンターレのページを例に出すと、

まず、選手名鑑のタブにあるテーブル情報を取得してcsvにします。

その後、各選手の行をクリックした先にある選手ページのシーズン成績のテーブルも取得し、csvにします。ファイル名は選手名_背番号.csvの形式です。

前提

  • Python
  • pip
  • ChromeDriver

ChromeDriverの準備

seleniumも使っているのでChromeDriverが必要になります。 こちらから適当なバージョンのドライバーをインストールしてそのパスをconfig.ymlに記述してください。デフォルトはルートディレクトリ直下になっています。

driver_path: ./chromedriver

依存ライブラリインストール

$ pip install -r requirements.txt

実行

$ python gen_table.py ${出力先フォルダ} ${チームURL}

チームURLはhttps://www.jleague.jp/club/***の形式です。この辺のページからたどって取得してみてください。

例えば川崎フロンターレだとhttps://www.jleague.jp/club/kawasakifになりますので、このように実行します。

$ python gen_table.py ./kawasaki https://www.jleague.jp/club/kawasakif

About

Jリーグ公式サイトから各チームの選手一覧とシーズン成績をスクレイピング

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages