Seleniumを使ってリリース時の動作確認を自動化したい

Python, Selenium

はじめに

はじめまして。
システム開発推進部第2Gの山本です。
フロントエンドやバックエンドの開発を主に行っております。
今回は、Webブラウザの動作確認をSeleniumを用いて自動化する方法について、簡単にご紹介したいと思います。
なお、今回の環境はWindowsを使用していますが、MacやLinuxの場合、一部手順が異なる可能性がありますので、あらかじめご了承ください。

課題背景

私が担当しているサービスのAKB48グループ映像倉庫の開発は、数名のチーム体制で進行しており、リリース時には動作確認結果をSlackで共有しています。
リリース内容は多岐にわたりますが、中には軽微かつ定期的な更新作業が発生するものもあります。その中の一つが、WebTOPページのキャンペーンバナーの掲載作業です。
これを手作業で確認する場合、各OS(PC、Android、iOS)ごとにスクリーンショットを撮影し、Slackに報告する必要があります。確認内容は毎回同じで、作業自体は簡単ですが、定期的に発生するため、時間がかかり、少し煩雑に感じることがありました。
そこで、この確認作業を自動化することを試みました。

Seleniumとは

Seleniumは、WEBブラウザの操作を自動化するためのオープンソースのツールです。
ブラウザをプログラムで操作し、Webページのテストや操作を行うことができます。
具体的には、以下のようなことが可能です。

  • Webページのテスト自動化
    ボタンのクリックやフォームへの入力など、ユーザーの操作を自動化。

  • Webデータのスクレイピング
    ページ上のデータの取得や、動的に生成される要素の解析。

  • ブラウザの動作シミュレーション
    各種ブラウザ(Chrome、Firefox、Safariなど)での動作確認。

開発環境の準備

Seleniumを用いた自動化スクリプトを実行するための開発環境を構築していきます。

  1. Pythonのインストール
    まず、Pythonがインストールされているか確認します。

    もしPythonがインストールされていない場合、Pythonの公式サイトから最新版をダウンロードし、インストールしてください。

  2. Seleniumのインストール
    PythonでSeleniumを使用するためには、Seleniumライブラリをインストールする必要があります。
    以下のコマンドでインストールできます。

  3. ChromeDriverのインストール
    SeleniumでChromeブラウザを操作するには、ChromeDriverが必要です。
    ChromeDriverの公式サイトから、現在使用しているChromeのバージョンに対応したドライバをダウンロードします。
    ダウンロードしたZIPファイルを解凍し、任意のディレクトリに配置します。
    今回はD:/selenium/chromedriver-win64/chromedriver.exeに配置しています。

Seleniumの基本構文について

Seleniumの基本的な操作構文を簡単に紹介します。

  • ブラウザの起動

webdriver.Chrome()でChromeブラウザを起動し、get()で指定したURLにアクセスします。

  • 要素の取得と操作

find_element()で指定された条件でWebページ上の要素を取得し、click()でその要素をクリックします。

  • ページのスクリーンショット

指定したパスにページ全体のスクリーンショットを保存します。

  • ブラウザの終了

開いているブラウザをすべて閉じます。

今回作成したスクリプトの詳細

今回作成したスクリプトの全体の流れとスクリプトについて記載いたします。

スクリプト全体の流れ

  1. 各デバイス(PC、Android、iOS)ごとにユーザーエージェントを設定
  2. 各デバイスごとに指定したURLにアクセスし、ページのスクリーンショットを取得
  3. 指定したキャンペーンバナーリンクがページ内に存在するかを確認
  4. キャンペーンバナーリンクが存在すればクリックし、遷移先のステータスコードを確認

作成したスクリプト

スクリプトの解説

  • ユーザーエージェントの設定

各デバイス動作をまとめて確認することを目的としてますので、デバイスごとに異なるユーザーエージェントを設定し、異なるデバイスでのアクセスをシミュレーションしています。
webdriver.Chrome()を呼び出すことで、ブラウザのインスタンスを生成し、設定されたユーザーエージェントでのブラウザ操作が可能になります。

  • デバイスごとのブラウザのウィンドウサイズを設定

set_window_size()を使ってブラウザのウィンドウサイズ(幅と高さ)をピクセル単位で設定ができます。

  • 要素の検索と操作

find_element()メソッドを使って、指定されたリンクをページ内から検索します。
指定したリンクが見つかれば、その要素を操作できます。

  • スクロールとスクリーンショットの取得

スクリーンショットを取得する前に、対象の要素が画面内に表示されている必要があります。
scrollIntoView()を使って対象要素までスクロールし、要素が見えるようになってからスクリーンショットを撮ります。

  • リンクのクリックとステータスコードの確認

click()メソッドで要素をクリックし、遷移先のページのURLを取得しています。
そのURLに対してリクエストを送信し、ステータスコードを確認しています。

動画キャプチャを取りたい場合

今回は確認したいページのスクリーンショットを取っておりますが、
動画キャプチャを取りたいという場合は、ffmpegを使えば実現可能です。
ffmpegのインストールが別途必要となります。

出力結果

PC Android iOS
pc_screenshot.png android_screenshot.png ios_screenshot.png

このように、各デバイスごとに動作確認ができ、スクリーンショットが出力されることが確認できました。
TOPページのキャンペーンバナーの有無とリンクの遷移のみを確認していますが、ページごとに検証項目を追加すれば、デグレードの有無も自動的にチェックできるようになるのではと思います。

おわりに

Seleniumを用いることで、定期的なWebページの確認作業を自動化でき、作業効率が向上できました。
スマートフォンでの確認は実機を使ったほうが良いとは思いますが、素早く動作確認を行う場合はSeleniumが便利だと思います。
今回はSlackとの連携によるスクリーンショットの自動送信までは実装しませんでしたが、こちらの実装ができれば、動作確認結果の共有も自動化でき、さらに効率化が期待できると思います。
今回の記事では、Seleniumを用いてWebブラウザの動作確認を自動化する方法を紹介しましたが、少しでも参考になれば幸いです。
最後まで読んでいただき、ありがとうございました。

Python, Selenium