S3から特定のファイルを再帰的にコピーする方法

2017-04-17AWS, AWSCLI, S3

この記事は最終更新日から1年以上が経過しています。

１．概要

現在のシステムでは以下のように保存されている。

■格納例
[S3バケット]/[サーバホスト名] / [インスタンスID] / YYYY / MM / DD /[ログ種別] /ログファイル
　※ログファイルは、5分ごとに１ファイルが作成される。

■パス例

s3://test-recochoku-jp/

　api-ap/

　api-ap00-i-0ed0250b86b11d3a6/

　2017/02/17/

　service_reco_dev.log/

　service_reco_dev.log_2017-02-17-15_12.gz

上記のようなS3のディレクトリ構成のため、特定の日のログを探すのがかなり困難となります。
なので、サーバに一括でログファイルをダウンロードするコマンドを調査しましたので、共有します。

aws s3 cp s3://test-recochoku-jp/api-ap/ . --recursive --exclude "*" --include "api-ap00*/2017/02/1*/service_reco_dev*.gz"

各コマンドとオプションの解説は以下の通りです。

コマンド/オプション	解説
aws s3	CLIでS3サービスに関する手続き実行するコマンド
cp	ファイルを、ローカル→S3、S3→ローカル、S3→S3でコピー
s3://test-recochoku-jp	S3バケット名＋ディレクトリ（S3Url）
.	ローカルディレクトリ
–recursive	指定されたディレクトリ配下を再帰的に検索
–exclude	指定された文字列が存在するファイルを除外（パスも含む）
–include	指定された文字列が存在するファイルを含める。※–excludeで除かれたものが対象となる。
–dryrun　※おまけ	指定した場合、ファイルコピーは実施せず、実行結果のみを表示