ZeppelinでAWS Billing のCSVを分析する(CUR版)
投稿者:松木佑徒以前の記事の続きで今回はAWS BillingのCUR(Cost and Usage Report)の方で試してみました。
前回と同様/data フォルダ配下にCSVを配置した状態でZeppelinを立ち上げます。
前回調査不足でちょっと面倒な方法でCSVを読み込んでいたのですが、
Spark2.0からはCSVを読み込む機能が標準で用意されているらしく
以下のようにすることで簡単に読み込むことができるようです。
(loadの引 ...
ZeppelinでAWS BillingのCSVを分析する
投稿者:松木佑徒AWS BillingのCSVはそのままでは見にくいのでDBなどに投入する必要があると思いますが、Zeppelinを使用すれば一時テーブルを使用して簡単にSQLで分析を行うことができます。
GUIからSQLを書くだけでグラフの描画まで簡単にできますのでちょっとした分析をしたいときに便利です。
CSVを一時テーブルに読み込むZeppelin上ではR言語やPythonでも書けるのですがデフォルトのでScalaで書いてみました。
Scala ...
Zeppelinをdockerで動かしてBigQueryのデータを閲覧する
投稿者:松木佑徒BigQueryを簡単に閲覧できる環境が欲しかったのでローカルにdockerでZeppelinを立てて接続してみました。
docker-composeの設定2017/9/21時点では0.7.2が最新なので以下の設定になります。
version: '3'services: zeppelin_snapshot: image: apache/zeppelin:0.7.2   ...