【連載】Amazon CloudSearchのCLI入門編 #2 (ドキュメントの登録)

AWS, AWSCLI, CloudSearch

この記事は最終更新日から1年以上が経過しています。

1.概要

システムのAWS化に合わせて、提供している検索エンジンをCloudSearchに置き換える事になりました。検証するために、CLI(コマンドラインインターフェイス)経由でCloudSearchを操作したので、その手順をまとめて残したいと思います。

2.前回までの記事

【連載】Amazon CloudSearchのCLI入門編 #1 (検索ドメインの作成)

3.前提条件(再掲)

クライアントは、Windows環境です。CLIのコマンドは同じなので、他のコマンドは、環境に合わせて、適宜読みかえて下さい。あと、アクセスキーとシークレットキーを発行してCloudSearchへ接続します。

今回、準備する検索ドメインは、以下の通りとなります。

フィールド名
id literal
artist_name_li literal
album_title_li literal
artist_name_te text
album_title_te text

※ 検証内容がliteral型とtext型のscore値の確認だったため、
  それぞれの検索フィードを定義しました。
※ その他、使える型は、以下のURLを参考にして下さい。
  参考URL:公式:Amazon CloudSearch ドメインのインデックスフィールドの設定

4.ドキュメントの準備

検索ドメインの型定義に合わせて、inputとなるファイルを作成します。
フォーマットは、json形式かxml形式となります。今回はjson形式のフォーマットで準備しました。

 参考URL:公式:Amazon CloudSearch 用にデータを準備

5.ドキュメントの登録

以下のコマンドを実行して、ドキュメントを登録します。

オプション 説明
upload-documents ドキュメント登録用のコマンドとなります。
–endpoint-url 検索ドメインの接続先を指定します。
–content-type ファイルのフォーマットを指定します。
–documents 作成したファイル名を指定します。

 参考URL:公式:Amazon CloudSearch ドメインにデータをアップロード

6.最後に

次は、ドキュメントの検索を実施します。

この記事を書いた人

山本 耕琢(コウタク)
山本 耕琢(コウタク)意識低い系エンジニア 兼 マネージャー
レコチョクの楽曲情報の検索や、決済/会員情報、 レコメンド情報などを扱う、レコチョクAPIの運用と改善を担当しています。主にプロジェクト管理をやっています。技術力は低めですが、気づきがあったことなどを更新していきます。

AWS, AWSCLI, CloudSearch