Python+Selenium — как начать работу

Сегодня я расскажу, как начать работу с Python и его библиотекой для автоматизации действий в интернете — Selenium.

Многие слышали про высокоуровневый язык программирования Python. На данный момент к нему придумали уже, наверное, более десятков тысяч различных библиотек. Главным плюсом данного языка является простота его синтаксиса: никаких «;» в конце строки; не надо каждый раз указывать тип переменной ( а ля int, float, double и прочее ) и многие другие ништяки… Лучше почитать на официальном сайте python.org

Selenium — это инструмент для автоматизированного управления браузерами. Наиболее популярной областью применения Selenium является автоматизация тестирования веб-приложений. Однако при помощи Selenium можно (и даже нужно!) автоматизировать любые другие рутинные действия, выполняемые через браузер. [оригинал — selenium2.ru]

Однако мне кажется, что главная проблема кросс-платформенной Java программы Selenium в том, что она очень распространена и поэтому многие сайты специально строят свой код так, чтобы исключить действия ботов или парсеров, использующих Selenium.

Итак, что нам понадобится для начала:

  1. Python 2.7 (да-да именно он, а не 3.5)
    На версии 3.5 появляются баги, которых нет на версии 2.7
    Для установки вам достаточно перейти сюда: https://www.python.org/downloads/release/python-2712/ и скачать версию для вашей ОС. Лично я чаще использую Windows, поэтому если возникнут вопросы об использовании на других ОС, отвечу в комментариях.
    при установке морально принуждаю поставить галочку на пункте «добавить команду в PATH» (да и вообще поставьте все галочки — хуже не будет). Вам  будет намного проще в работе с консолью.
  2. Пакет Selenium’a для Python.
    Для этого, открываем консоль (Пуск -> Выполнить… -> cmd.exe) и там прописываем:

    Если выскакивает ошибка, то скорее всего при установке Python вы не поставили галочку при установке в консоли (см. пункт 1)
  3. Хороший текстовый редактор. Советую NotePad ++ ( https://notepad-plus-plus.org/ ). Однако можно просто использовать IDLE , который появился при установке питона. К нему можно пройти так: Пуск -> Программы -> Python2.7 -> IDLE (Python GUI). Там нажать Файл-> Новый файл. Откроется окно, куда можно печатать свой скрипт)
  4. Понадобится браузерный драйвер. Я «крайне» рекомендую вам установить ChromDrive.exe ( https://sites.google.com/a/chromium.org/chromedriver/downloads ) вместе с браузером Google Chrome ( https://www.google.ru/chrome/browser/desktop/ ) . Поверьте, это очень удобно, и намного удобнее, чем рекомендуемый Mozilla FireFox (который отчасти имеет много своих ништяков типа FireBug).
  5. Перед началом поместите файл chromedriver.exe и ваш скрипт, который вы напишите в одну папку (так снова будет удобней). Можете запускать скрипты, дважды кликая на них.
  6. Проверка:
    Перейдём в IDLE (Python GUI) , создадим новый файл, а там введём следующий код для проверки:

    Нажмём кнопку F5 (запуск скрипта) и сохраним в ту же папку, где и chromedriver.exe. Увидим, как автоматически открывается окно браузера. и выполняются те действия, которые мы запрограммировали:)

Вот и всё! Теперь вы готовы, к изучению и использованию автоматизации.