+7 (495) 797-55-99 info@i-media.ru
495 748-54-59 Контакты
Мы работаем с 10:00 до 19:00,
а Контекст Мотор - круглосуточно!

Оставьте свой телефон и мы Вам
перезвоним.

Пишем макрос для автоматизации монотонных действий в браузере с помощью Excel и iMacro

Дата публикации оригинальной статьи:
Автор: Том Шмит
Перевод:

Если Вы столкнулись с такой рутиной задачей как монотонные однообразные действия в браузере или скачивание данных с группы веб-страниц (в простонародье "парсинг"), но не обладаете навыками программирования, то данная статья будет Вам полезна. Хорошим инструментом для автоматизации этого процесса является приложение для браузеров iMacros - бесплатный и мощный. Только убедитесь, что используется версия для Firefox, так как в других браузерах, таких как Chrome, его возможности ограничены.

Допустим, вы хотите получить список веб-сайтов компаний Fortune 500. Это непростая задача: на сайте журнала CNN, Fortune Magazine ссылки на сайты расположены в каждом отдельном профиле компании на отдельной странице. Смотрите, что я делаю с электронными таблицами и макросом.

Получим список URL-адресов компаний из CNN Money Fortune 500.

Используйте Web Developer tool , чтобы получить список ссылок на все профили компании. Просто выберите "Information" и "View Link Information". Посмотреть ссылки на веб-странице

Затем скопируйте ссылки, которые вы хотите вытянуть.

Вставьте в Excel (прим. Лучше использовать функцию "Специальная вставка" -> "Текст").

Добавить эти формулы к строке 1:

Колонка B: Присвойте уникальный номер для каждой строки. Это будет использоваться для названий загруженных файлов.

Колонка C: = "URL GOTO =" & A1 Это команда скажет макросу по какому URL нужно перейти.

Колонка D: = "SAVEAS TYPE = HTM Folder = C:i-media.ruforeigner-experience FILE =" & B1 & ".html" Сохраняет копию веб-страницы на жестком диске.

Колонка E: WAIT SECONDS=3 Трех секундная пауза между запросами. Поможет сохранить работу макроса стабильной.

В Excel, для столбца B значения должны быть от 1 до N (1, 2, 3, 4 и т.д.).

Правила из строки 1 для столбцов C, D, E нужно скопировать на все заполненные строки, чтобы ваша таблица выглядела следующим образом:

Теперь мы закончили работу с Excel и готовы создать свой макрос. Теперь нам нужно сделать так, чтобы каждая ячейка стала отдельной строкой кода. Ниже трюк для достижения этого.

Скопируйте из Excel заполненные клетки столбцов C, D, и Е (без пустых ячеек).

Вставьте в Word используя "Специальная вставка" в виде "Текста".
Использование автозамены

Используйте функцию "Заменить" в Word (прим. можно вызвать сочетанием клавиш CTRL+H). Найти "^t" (вкладки) и заменить на "^p" (абзацы). Нажмите "Заменить все". Ваш Макрос выстроится по одной функции на одну строку.
Результат автозамены

Перед тем как продолжить, Вам нужно создать папку загрузки. В нашем примере это

C:/i-media.ru/foreigner-experience/

Установите iMacros для Firefox . Избегайте использования Chrome и других версии браузеров, т.к. им не хватает важных особенностей. После установки, вы найдете программу в меню "Вид" -> "Боковая панель", либо справа от адресной строки, либо нажатием клавиши F8.
Запускаем iMacros

Скопируйте Ваш макрос из Word.

В iMacros, откройте # Current.imm (прим. создается при записи макроса) или любой другой макрос. Не важно, т.к. мы изменим название этого макроса. Выберите "Редактировать", затем изменим макрос. Вставьте макрос из Word. Вместо кнопки "Сохранить", нажмите на значке диска - Сохранить . Задайте название макроса #Fortune-i-media.ru.imm.
Вставляем в iMacros editor

Вернитесь в меню IMacros. Выберите "Редакт." -> "Обновить список".

Нажмите на # Fortune-i-media.ru.imm в списке макросов. Выберите "Воспр." "Воспроизвести" (большая кнопка).

Макрос начнет работать и скачивать все страницы в C:/i-media.ru/foreigner-experience/.

Подведем итоги. В этой инструкции было показано 3 трюка, которые использует автор:

  • Использование макросов для автоматизации повторяющихся задач
  • Использование формул Excel для написания макросов
  • Использование Word для преобразования табличного содержания Excel в строчный вид кода макроса

Но автор признает, что оставляет нас в подвешенном состоянии, потому что у нас есть только набор HTML файлов на жестком диске, но нет списка сайтов компаний Fortune 500. Чтобы автоматизировать и эту часть, автор использует PHP-скрипт, который открывает каждый HTML файл и извлекает URL'ы с использованием соответствующей команды РНР скрипта .

Автор поделится своим PHP скриптом в своей следующей статье.

Макросы используются для охвата всех видов информации, включающие инструменты сбора SEO-данных для нескольких сайтов и даже для сбора данных с инструмента подсказки ключевых слов Google. Макрос позволяет обрабатывать много страниц, а Excel упрощает создание макросов.

Мнение эксперта

 

Владимир Тапханаев
Руководитель группы

  • Приведенная методика получения данных с множества сайтов может пригодиться при проведении разовых экспериментов или исследований конкурентов. Например, можно распарсить без участия программистов (а время программистов очень дорого сегодня) цены конкурентов, названия карточек товаров или стянуть с сайта конкурента все карточки товаров. Стоит дождаться второй статьи, чтобы в полной мере научиться получению данных с группы сайтов в единый список. Рекомендую дополнительно ознакомиться с функционалом iMacros с помощью видео ниже.

Урок от сайта teachvideo.ru

28 апреля 2013
comments powered by Disqus

Коммерческое предложение

Вас интересует:
Контекстная реклама Управление
репутацией
Поисковая
оптимизация (SEO)
Аудит сайтов
Мобильная реклама Видеореклама
Веб-аналитика SMM и реклама
в социальных сетях
Продвижение
на прайс-площадках
Разработка сайта
Call Tracking Email-маркетинг

Ваши данные (* обязательно для заполнения)

Поделиться
Подписаться

Подпишитесь и ежемесячно получайте
лучшие материалы сайта
в информационном дайджесте i-Media

Что еще полезно знать по продвижению сайтов
Павел Лапшин руководитель отдела продаж
Позвоните:
+7 (495) 797-55-99
Напишите:


Отправьте заявку

Подписаться

Подпишитесь и ежемесячно получайте лучшие материалы сайта в информационном дайджесте
i-Media