Tbpgr Blog

Ruby プログラマ tbpgr(てぃーびー) のブログ

Google SpreadSheet で手軽にデータ取得

f:id:tbpg:20161102002921p:plain

Google SpreadSheet で手軽にデータ取得する方法をまとめます。
※個人メモとしての記事で、既出情報です

IMPORTDATA

指定URLのデータをCSV,TSV形式でインポートする

IMPORTDATA - Google ドキュメント エディタ ヘルプ

サンプル

都道府県データのCSVを取得します

都道府県データ - tbpgr/sample_data - GitHub

=IMPORTDATA("https://raw.githubusercontent.com/tbpgr/sample_data/master/prefectures.csv")

f:id:tbpg:20161102002643p:plain

IMPORTFEED

RSS フィードや Atom フィードをインポートする

IMPORTFEED - Google ドキュメント エディタ ヘルプ

サンプル

私の自作 gem kosiGitHub の タグの Feed を取得します

=IMPORTFEED("https://github.com/tbpgr/kosi/tags.atom")

f:id:tbpg:20161102002654p:plain

IMPORTHTML

HTML ページ内の表やリストからデータをインポートする

IMPORTHTML - Google ドキュメント エディタ ヘルプ

サンプル

私がCodeIQで過去に開催していたデスマコロシアムの第12回の集計記事から
データを抽出してみます

=IMPORTHTML("http://tbpgr.hatenablog.com/entry/2015/07/26/030211", "table", 1)
=IMPORTHTML("http://tbpgr.hatenablog.com/entry/2015/07/26/030211", "table", 2)
=IMPORTHTML("http://tbpgr.hatenablog.com/entry/2015/07/26/030211", "table", 3)

f:id:tbpg:20161102002700p:plain

IMPORTRANGE

指定したスプレッドシートからセルの範囲を読み込む。

IMPORTRANGE - Google ドキュメント エディタ ヘルプ

サンプル

先程抽出したデスマコロシアムのデータのセル A1:D20 の範囲を抽出します

=IMPORTRANGE("https://docs.google.com/spreadsheets/d/some_key/", "シート1!A1:D20")

f:id:tbpg:20161102002706p:plain

IMPORTXML

XML、HTML、CSV、TSV、RSS フィード、Atom XML フィードなど、
さまざまな種類の構造化データからデータをインポートします。
XPathクエリで内容の一部を取得することができます。

IMPORTXML - Google ドキュメント エディタ ヘルプ

サンプル

私のブログ「 Empowerment Engineering 」 のページ内の
カテゴリー部分を取得します。

=IMPORTXML("http://empowerment-engineering.hatenablog.com/", "//*[@id='box2-inner']/div[6]/div[2]")

f:id:tbpg:20161102002712p:plain