Google SpreadSheet で手軽にデータ取得する方法をまとめます。
※個人メモとしての記事で、既出情報です
IMPORTDATA
指定URLのデータをCSV,TSV形式でインポートする
IMPORTDATA - Google ドキュメント エディタ ヘルプ
サンプル
都道府県データ - tbpgr/sample_data - GitHub
=IMPORTDATA("https://raw.githubusercontent.com/tbpgr/sample_data/master/prefectures.csv")
IMPORTFEED
IMPORTFEED - Google ドキュメント エディタ ヘルプ
サンプル
私の自作 gem kosi
の GitHub の タグの Feed を取得します
=IMPORTFEED("https://github.com/tbpgr/kosi/tags.atom")
IMPORTHTML
HTML ページ内の表やリストからデータをインポートする
IMPORTHTML - Google ドキュメント エディタ ヘルプ
サンプル
私がCodeIQで過去に開催していたデスマコロシアムの第12回の集計記事から
データを抽出してみます
=IMPORTHTML("http://tbpgr.hatenablog.com/entry/2015/07/26/030211", "table", 1) =IMPORTHTML("http://tbpgr.hatenablog.com/entry/2015/07/26/030211", "table", 2) =IMPORTHTML("http://tbpgr.hatenablog.com/entry/2015/07/26/030211", "table", 3)
IMPORTRANGE
指定したスプレッドシートからセルの範囲を読み込む。
IMPORTRANGE - Google ドキュメント エディタ ヘルプ
サンプル
先程抽出したデスマコロシアムのデータのセル A1:D20
の範囲を抽出します
=IMPORTRANGE("https://docs.google.com/spreadsheets/d/some_key/", "シート1!A1:D20")
IMPORTXML
XML、HTML、CSV、TSV、RSS フィード、Atom XML フィードなど、
さまざまな種類の構造化データからデータをインポートします。
XPathクエリで内容の一部を取得することができます。
IMPORTXML - Google ドキュメント エディタ ヘルプ
サンプル
私のブログ「 Empowerment Engineering 」 のページ内の
カテゴリー部分を取得します。
=IMPORTXML("http://empowerment-engineering.hatenablog.com/", "//*[@id='box2-inner']/div[6]/div[2]")