Skip to content

cbioportalのMETABRICデータセットにて、一括ダウンロードできないデータをスクレイピングするプロジェクト

Notifications You must be signed in to change notification settings

mono-clone/scraping-cbioportal

Repository files navigation

scraping-cbioportal

cbioportalのMETABRICデータセットにて、一括ダウンロードできないデータをスクレイピングするプロジェクト

目的

cbioportalのMETABRICデータセットにて、一部患者の臨床データなどがcsv出力に対応していなかった。 そこで、seleniumを触ることも目的に、データをスクレイピングすることにした。

結果

無事狙い通りのデータを取得できたが、結果的にはデータ量や解析方法を定められなかったので、データは使用しなかった。 uploadに伴いフォルダをresultsにまとめたのに伴い、コードを修正したが、一部修正が行き渡っていない可能性があるため、必要に応じて修正すること。

所感

HTMLタグを用いることで簡単にスクレイピングできた。 タグの指定方法も様々だったので便利だな〜。

About

cbioportalのMETABRICデータセットにて、一括ダウンロードできないデータをスクレイピングするプロジェクト

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published