北海道の新型コロナウイルス情報を集め、jsonやcsvとして出力するPythonスクリプトです
- main.pyを実行すると、①settings.pyのREMOTE_SOURCESに基づき外部データを取得し、②①のデータを集計してmain_summaryを生成し、③importフォルダ内のcsvを読み込んで、それら全てのデータのjsonファイルを出力します
- jsonの出力前に、schemas.pyのスキーマ定義に基づきデータがバリデーションされます(データに異常があった場合jsonは出力されません)
- settings.pyとimportフォルダ内に同じkeyがある場合、importフォルダが優先されます
- このスクリプトでは、1つのCSVが1つのJSONに対応します(last_updateをのぞく)
- ODPのcovid19_data.csvを集計して、5つのjsonファイルを生成します(以下の対応表のとおり)
GitHub Actionsにより1時間に一度、すべてjson類をgh-pagesブランチに書き出します
gh-pagesブランチにあるjsonデータに直接アクセスしてデータを読み出す事が出来ます。
sample1: https://codeforsapporo.github.io/covid19hokkaido_scraping/patients.json
sample2: https://raw.githubusercontent.com/codeforsapporo/covid19hokkaido_scraping/gh-pages/patients.json