【セッション参加レポート】Media Intelligence for the Cloud with Amazon AI【MAE402】

2017, AWS, re:Invent, イベントレポート

re:Invent2017も2日目を迎えました。

簡単にですが、私の行ってきたセッションの一部(Media Intelligence for the Cloud with Amazon AI 【MAE402】)を紹介したいと思います。

概要

Amazon AIサービスを用いて画像や動画といった大量のメディアを最適化してメタデータを付与することで管理したいが、どのように構築し扱っていくかをナショナルジオグラフィック社によるAWS移行の事例をもとに、最適なアーキテクチャなどを紹介している

以下の求める要件からAWS移行を行った

  • 世界に散らばるチームがセルフサービス・マルチテナントに扱えるということ
  • 保存されたメタデータはAPIを通して扱えること
  • 自動で画像のリサイズを行ってくれること
  • 集められた画像や動画はグローバルで一意なIDをつけられるようになっていること

また、以下が実現するように挑戦を行った

  • ニッチな画像に対するカテゴライズができること
  • 低解像度またはハイレゾの動画像を扱えること
  • 白黒の画像にも色をつけられるようになること
  • 集めたデータに歴史的な文脈を付けられるようになること

アーキテクチャ

上記の要件を満たすように設計されたアーキテクチャーは以下の通り

各コンポーネントの用途は以下のとおりである

  • API Gateway
    • 各画像や動画に対するグローバルで一意となるようなIDの作成
  • Step Function
    • 画像処理
  • Dynamo DB
    • 取材や投稿された画像や動画のメタデータをここに保存
  • API Gateway
    • 各画像や動画に対するグローバルで一意となるようなIDの作成
  • Rekognition
    • 被写体や背景の識別を行う
  • ElasticSearch
    • リアルタイム検索
  • CloudFront
    • コンテンツ配信
  • S3
    • メタデータを付与した画像や動画をアーカイブ化

ディープラーニングを考慮したサイクル

デモ

画像からウミガメとゴリラを特定し、メタデータの付与を行っている

メタデータはJSONで定義

その他・所感

ニッチなケースでは機械学習による分類が上手くいかないことが多く、コストと時間を度外視して正確さを求めるならやはり人の手による教師あり学習がよいそうで、そこでクラウドワーカーを活用しているのは大変興味深かったです。

あと画像ではないですが、今後音楽のジャンルやタグ付けにも繋がって来る話なのかなと思いました。こういった記事のタグ付けとかもしれくれるようにもなるのかなぁ。