cbioportalのMETABRICデータセットにて、一括ダウンロードできないデータをスクレイピングするプロジェクト
cbioportalのMETABRICデータセットにて、一部患者の臨床データなどがcsv出力に対応していなかった。 そこで、seleniumを触ることも目的に、データをスクレイピングすることにした。
無事狙い通りのデータを取得できたが、結果的にはデータ量や解析方法を定められなかったので、データは使用しなかった。 uploadに伴いフォルダをresultsにまとめたのに伴い、コードを修正したが、一部修正が行き渡っていない可能性があるため、必要に応じて修正すること。
HTMLタグを用いることで簡単にスクレイピングできた。 タグの指定方法も様々だったので便利だな〜。