Как самостоятельно спарсить данные с интернет-магазина при помощи Python
По рабочим задачам часто сталкиваюсь с задачами по парсингу. В этой короткой статье я покажу как сделать свой парсер, который будет получать данные с сайта Pleer.ru по ссылке из любой категории с листингом товаров — название, цену, заголовок страницы товара, id.
Статья написана в образовательных целях. Код сайта со временем изменится и скрипт не будет работать путём копипаста, нужно будет изменить XPath-выражения.
Инструментарий: Python 3 + библиотеки
Я буду использовать Python 3 и некоторые распространенные библиотеки Python.
Вот некоторые данные, которые этот парсер поможет вам извлечь в csv-таблицу:
В парсер легко добавить любые данные с сайта, помимо уже существующих — урл картинок или сами картинки, описания, отзывы и т.д.
Сохраню данные в виде электронной таблицы Excel (CSV), которая выглядит следующим образом:
Установка необходимых пакетов
Тут я не рассказываю про основы Python и как его установить, это тема отдельной статьи. Буду использовать следующие библиотеки:
Устанавливаю их с помощью pip3:
pip3 install requests, csv, time, lxml
Код проекта на Python
Внутри три функции:
- get_links() — принимает на вход url, берёт все ссылки с него на товары из листинга, проходит по всей пейдижнации и складывает ссылки в множество QUEUE_URL
- get_data() — принимает на вход один урл товара, парсит данные. Сами данные никуда не записывает, а возвращает список данных в виде словаря.
- main() — точка входа. Записывает получившиеся данные в файл csv, вызывая в своей работе get_links() для парсинга списка всех товаров и рекурсивно get_data() для парсинга конкретного урла.
Проблемы, с которыми вы можете столкнуться
- Сайт при парсинге отдаёт код 204, страница рабочая, но без контента. Решается добавлением рандомных хедеров.
- Для того, чтобы сайт не забанил при парсинге, нужно делать задержку между запросами рандомом в несколько секунд.
- Пейджинация чуть хитрее, потому что несуществующие страницы отдают 200 код, а не 404 и поэтому их нельзя перебрать в цикле стандартным способом.
- Чтобы парсить весь сайт нужно пилить либо через прокси, либо через Selenium.
- Если товара нет в наличии на странице, то в csv-файле будет пустая ячейка, потому что меняется вёрстка.
Список выше только часть проблем, с которыми сталкиваешься при парсинге и у каждого сайта они могут быть индивидуальны, особенно, если проект крупный.
Парсинг данных для интернет-магазинов: что такое, как работает, зачем нужен, обзор популярных сервисов
Кто владеет информацией, владеет всем миром. Сегодня это известное выражение Натана Ротшильда стало еще актуальнее, чем в бытность известного миллиардера. Расскажем об одном из популярных инструментов сбора информации из интернет-источников — парсинге. Итак, парсинг данных для интернет-магазинов: что, как, зачем.
Что такое парсинг информации
Так называют процесс автоматического сбора данных из сети. Для этих целей создано немало специальных сервисов — от простеньких до продвинутых. Они умеют анализировать буквально все: сайты магазинов конкурентов, социальные сети, сайты бесплатных объявлений, где есть нужная информация. Время парсинга зависит от объема данных и поставленной задачи. Важное условие: программы-парсеры умеют собирать базы только из открытых источников.
Что происходит с собранной информацией после ее автоматического сбора? Теперь ее можно использовать в любых целях: наполнять сайт товарами, собирать базы для электронных рассылок и делать многое другое.
Какую информацию можно парсить
Вообще любую, которую можно использовать в своих целях и когда речь идет о большом объеме однотипных данных. Обычно парсят товары с сайтов магазинов конкурентов, чтобы потом наполнить собственный каталог в автоматическом режиме. Но на самом деле сфера применения программ-парсеров куда шире. Расскажем об основных направлениях.
Парсить можно:
- товары из каталогов. Это одно из основных векторов для работы. Представьте: ассортимент даже небольшого интернет-магазина может состоять из тысяч и десятков тысяч позиций. Заливать их на сайт вручную долго и муторно. Придется пользоваться услугами копирайтеров чтобы писать описание товара, где-то брать картинки и изображения и прочее прочее. Сервисы делают это в автоматическом режиме: собранные данные можно сразу импортировать в собственный каталог;
- цены и динамику цен. Можно до бесконечности мониторить сайты конкурентов вручную, чтобы определиться с ценовой политикой и установить адекватные расценки. А можно прибегнуть к использованию программ-парсеров и сделать это быстро и безболезненно;
- профили пользователей, зарегистрированных в социальных сетях. Речь идет о таких данных, как пол, возраст, интересы, географическое местоположение и многое другое — все, что указывают люди на своих персональных страницах. В последующем эти данные можно использовать при проведении узконаправленных рекламных кампаний: контекстной рекламы в “Яндекс. Директ” и Google Adwords, настройках таргетинга во “ВКонтакте”, “Одноклассниках” и так далее;
- информацию о соискателях на сайтах объявлений и поиске работы и различных HR-порталах. Если вы активно набираете сотрудников в больших количествах (например, менеджеров по продажам). Те, кто сталкивался с формированием штата знают: собирать такую информацию вручную долго и трудозатратно. Нужно изучить множество профилей, изучить резюме и сделать многое другое. При помощи автоматических программ такая информация будет собрана автоматически. Большинство сервисов имеют встроенные фильтры, позволяющие выставить нужные критерии и требования к соискателям. На выходе — полный пул кандидатов, с которыми можно работать: звонить, писать и связываться по другим каналам;

- контактные данные. Сразу оговоримся: такая информация попадает под действие закона и защите персональных данных. Поэтому так просто взять и спарсить телефоны и email-адреса, а потом транслировать на них рассылки и оповещения, попросту нельзя. Но технически это выполнимо. Обычно в виде доноров подобной информации выступают всевозможные сайты бесплатных объявлений: “Авито”, “Циан”, “Авто.ру”, CarPrice и другие;
- объемы продаж. Некоторые крупные маркетплейсы, агрегаторы и ритейлеры показывают такие данные в открытом доступе. Вы все это видели: прямо на сайте в карточке товара есть примерно такие данные: сколько единиц осталось на складе, сколько продано за сегодня и тому подобное. Подход используют такие гиганты, как “Wildberries”, “Ламода” и “Леруа Мерлен”. Зачем интернет-магазину эта информация? Да затем, что из нее можно выудить много полезного: объемы продаж конкретных позиций, их популярность на рынке, а также примерный спрос. После этого появится понимание, в какую сторону движется рынок и чем он сейчас дышит. А еще есть возможность прогнозировать спрос на определенные товары в перспективе, например, через месяц или два;
- любую другую однотипную информацию в больших объемах.
Как это работает
Для того, чтобы спарсить требуемую информацию, нужно проделать следующее:
- Определиться с тем, что собираем. Критерии поиска надо сформулировать как можно подробнее. Программы-парсеры имеют в настройках множество фильтров, которые лучше применять на полную катушку. Так данные будут более релевантными запросам и подробными. Если речь идет о сборе профилей пользователей, распишите не только пол, возраст и геолокации, но и участие в тематических сообществах, круг интересов, образование и прочие данные.
- Выбрать подходящую программу. Здесь все зависит от бюджета на проект и ваших запросов. Есть простенькие сервисы с бесплатными пробными версиями, а есть дорогостоящие профессиональные инструменты. Если парсинг требуется раз от разу и особых требований к сбору данных нет, можно начать с бесплатной площадки или использовать пробную версию крутого продукта. Второе предпочтительнее — так вы получите серьезный функционал на безвозмездной основе. В случае, когда запросы к сбору данных велики, придется оплатить подписку на один из профессиональных сервисов.
- Собственно, запустить парсинг и собрать данные. Для этого в специальном окне программы-парсера указываем адрес страницы-донора. Ну или страниц, если нужно спарсить данные из нескольких источников. Проводим настройки, выставляем фильтры и запускаем парсинг. После этого можно использовать информацию по прямому назначению. Обычно собранные данные сводятся в наглядную таблицу, но здесь все зависит от особенностей работы конкретного сервиса. Все это можно импортировать в другие места, например, в каталог сайта интернет-магазина.

Общая схема работы метода
Как выбрать подходящий сервис для сбора информации
Приводим пошаговый алгоритм выбора программы-парсера. Работа будет состоять из нескольких этапов:
- Определитесь с целями и задачами. Дело в том, что большинство программ имеют узкую направленность и универсальных инструментов мало. То есть, такого софта, который анализирует соцсети, собирает контакты с “Авито” и попутно парсит каталоги товаров почти нет. Так что если нужно собирать данные из нескольких разных областей, придется воспользоваться парой-тройкой различных площадок. А так — если нужно собрать профили под портрет целевой аудитории — надо использовать программу-парсер социальных сетей.
- Определитесь с бюджетом. Сколько денег вы готовы потратить на сбор данных? Этот критерий может оказаться ключевым при выборе программы-парсера. Как мы уже говорили, существуют бесплатные сервисы и продвинутые дорогостоящие продукты. От бюджета на проект и будет зависеть выбор сервиса.
- Обратите внимание на функционал площадки. Он должен удовлетворять списку требований к сбору данных. Если чего-то не хватает, все предприятие может пролететь впустую, когда пропущен один из ключевых параметров поиска.
- Почитайте отзывы о сервисе в интернете. Только ищите настоящие, а не фейковые, написанные самими о себе. О том, как распознать такие комментарии, мы писали ранее.
- Обратите внимание на работу службы технической поддержки. Она должна функционировать в режиме 24/7/365, то есть круглосуточно, без выходных и праздничных дней. По закону подлости все сбои в работе, требующие оперативного вмешательства со стороны поставщика услуги, происходят именно ночью в выходной. Круглосуточное техническое сопровождение будет в этой ситуации очень кстати.
- Изучите сайт поставщика услуги на предмет кейсов и тех, кто уже воспользовался сервисом. Если среди клиентов вы обнаружите гигантов интернет-торговли или просто крупные компании, это очень хорошо. Обычно найти такую информацию не составляет труда: сервисы очень гордятся сотрудничеством с компаниями федерального масштаба и охотно вываливают такую информацию на главную страницу сайта. Увидели там “Тинькофф-банк” или Mail.ru Group — все в порядке, сервису доверяют.

Обзор сервисов для сбора информации
Приготовили для вас мини-подборку популярных площадок-парсеров. Среди них вы найдете сервисы для анализа ЦА, товаров и цен конкурентов. Поехали.
Targethunter
Номер один нашего списка. Почему? Именно по той причине, что площадке доверяют многие крупные компании, например, “Билайн” и “Додо пицца”. Кроме того, это один из официальных партнеров социальной сети “ВКонтакте”, а это говорит о многом. Сервис предназначен для анализа целевой аудитории в соцсетях и послужит незаменимым инструментом в работе любого SMM-специалиста.
“Таргетхантер” это:
- более 150 различных инструментов для поиска и анализа целевой аудитории;
- автоматическая загрузка собранных данных в рекламный кабинет;
- удобное управление сообществами с помощью специальных опций;
- бонусная программа. Вы получаете награду за активности, а потом деньги можно потратить на оплату сервиса и другие цели;
- круглосуточная техподдержка без выходных и праздников. По заверениям представителей площадки, среднее время ответа специалиста не превышает одной минуты.

Сервис работает на трех тарифных планах:
- бесплатный free-тариф. Здесь есть 35 инструментов для парсинга, круглосуточная техподдержка и доступ к сообществу с полезной информацией, а также доступ к закрытым чатам с экспертами по SMM;
- тариф “Стандартный”, стоимостью от 18 рублей в день при оплате за год. Это уже 130 парсинговых инструментов и более высокая скорость сбора данных;
- тариф “Автоматизация”. Цена — от 34 рублей в день. Самая высокая скорость парсинга, а также дополнительные опции: отслеживание активностей сообществах, дополнительный поток для автоматических задач и другие.
Import.io
Пожалуй, один из самых продвинутых сервисов для сбора информации о товарах в интернет-магазинах. С его помощью можно создать каталог легко и безболезненно, не прибегая к услугам программистов и других специалистов. Система анализирует карточки товаров интернет-магазинов-доноров и формирует пакет со следующими данными:
- цена;
- название;
- категория;
- материал;
- год выпуска и так далее.

Софт иностранного производства, поэтому вы столкнетесь с серьезным минусом: интерфейс доступен исключительно на английском языке. Import.io работает на двух тарифных планах — платном и бесплатном. Для большинства интернет-магазинов достаточно будет бесплатной версии продукта.
Scrapinghub
Один из немногих универсальных инструментов, позволяющих парсить информацию любого вида и формата. Программа преобразует однотипные данные с сайтов и организованный контент. Есть бесплатный тариф, дающий доступ к работе одного поискового робота. Бесплатно спарсить можно 1 гигабайт информации, далее за каждый месяц придется платить 4 доллара. Премиум-тариф запускает сбор посредством работы четырех ботов одновременно. Это будет стоить уже 9 долларов в месяц.

Минус Scrapinghub тот же — отсутствие русскоязычной версии. Правда, из-за простого и понятного интерфейса это не проблема. Техподдержка в лучших традициях: круглосуточно, без выходных и праздников.
На самом деле программ для сбора данных гораздо больше, на любой вкус и выбирайте, парсите и будьте на голову выше конкурентов. Удачи!
Бесплатный парсер сайтов Catalogloader
Как работает Бесплатный парсер сайтов Catalogloader
Бесплатный парсер сайтов Catalogloader работает в облаке, не требуется установка никакого дополнительно программного обеспечения на компьютер, работает на любой операционной системе. Достаточно иметь только браузер.
Вам предоставляется доступ в личный кабинет, где происходит управление парсером.
Вы сможете:
- указывать категории сайта-донора, которые нужно выгружать;
- изменять названия категорий, вложенность, объединять категории для загрузки на свой сайт или в файл;
- делать наценки;
- выбирать формат экспорта в файл;
- запускать процесс руками или настроить расписание запусков;
- смотреть запуски, скачивать результат (если настроена выгрузка в файл);
- забирать данные по API в свое программное обеспечение для дальнейшей обработки информации.;
- выгружать (объединять) данные из нескольких сайтов-доноров (парсеров) в один файл или на один сайт;
Бесплатный парсер сайтов Catalogloader выгружает следующие данные
- артикул;
- название товара;>
- описания (полное, краткое);
- все фото (названия фото, ссылки на фото, сами фото);
- производитель;
- характеристки;
- комбинации (варианты товара: разные цветы, размеры и т.п.);
Окончательный список параметров, которые будут выгружаться, обсуждается индивидуально для Вашей задачи в техническом задании.
Экспорт из парсера выполняется в файлы
Выгрузка в интернет-магазин
Кроме экспорта в стандартные файлы можно выгрузить в шаблоны файлов для импорта в следующие cms:
























Стоимость
Стоимость ориентировочная и может меняться в зависимости от сложности проекта.
| кол-во товаров | выгрузка в файл Excel, csv, xml или на сайт |
| до 500 запросов, самостоятельная настройка | БЕСПЛАТНО |
| до 10 тыс ежедневно* | 5400 руб/мес |
| до 30 тыс ежедневно* | 7650 руб/мес |
| до 50 тыс ежедневно* | 12000 руб/мес |
| до 100 тыс ежедневно* | 22500 руб/мес |
* — если скорость выгрузки позволяет делать это ежедневно.
Заказать настройку парсера в нашей компании
Укажите исходные данные в форме ниже и обсудим Вашу задачу.
Спасибо!
Comments are closed.
- Главная
- Наполнение интернет-магазина
- Бесплатный парсер сайтов
- Блог
- Поддержка
- Контакты
Catalogloader.com © 2009 — 2024
ООО «Эффективные решения для интернет-бизнеса»
УНП 191777605, 21.02.2013, Мингорисполком.
Парсер товаров с сайта в наличии и под заказ

Программа «Парсер товаров интернет магазинов» разработана для парсинга товаров с интернет магазинов и любых сайтов других тематик, в том числе для парсинга каталогов сайтов поставщиков с загрузкой данных в таблицу Excel в форматах xls* и csv.
Парсер создан на VBA (Visual Basic for Applications) и представлен в виде лучшей надстройки для MS Excel.
Для парсинга любого интернет магазина необходима настройка универсальной программы «Парсер сайтов» под Ваши задачи.
Что можно делать при помощи «Парсера товаров»
- Прохождение авторизации, решение Caprcha, обход блокировок.
- Выгрузку товаров по категориям и разделам из интернет магазинов, сайтов поставщиков, каталогов, торговых площадок и товарных агрегаторов.
- Сбор данных с каталогов автозапчастей, интернет магазинов одежды, мебели, электроники, бытовой техники, музыкальных инструментов и т.п.
- Парсинг цен интернет магазинов, артикулов, штрих кодов, названий, характеристик, атрибутов, описаний товаров в Excel.
- Формирование файлов csv и xlsx и баз для импорта на маркетплейсы, торговые площадки, CMS: OpenCart, 1C Битрикс, PrestaShop, WordPress, Joomla!, MODX, CS-Cart, UMI.CMS и др.
- Загрузку фото, графики, картинок, документов (PDF, docx, txt и др.) на жесткий диск, задавая произвольные имена файлам, парсинг ссылок на фото в таблицы Excel.
Как парсить товары с сайта (ВИДЕО)
Как заказать парсинг интернет магазина
- Скачайте и запустите тестовую версию программы по текстовой или видео инструкции. Убедитесь что программа запускается и работает, в противном случае пишите будем разбираться.
- Посмотрите ВИДЕО как работает софт с интернет магазинами.
- Составьте техническое задание (как составить ТЗ) для настройки «Парсера товаров» и отправьте его через эту форму для оценки работ, или в почту info@parserok.ru, или пишите в другие контакты.
- Ожидайте согласование плана работ, стоимости настройки парсера и сроков выполнения.
Сколько стоит спарсить товары с сайта
- Цена на парсер товаров интернет магазинов складывается из покупки вечной лицензии на 2 ПК (3300 р.) и настройки программы для необходимого интернет-магазина, в среднем 2000-3000 р., т.е. лицензия покупается 1 раз и навсегда, а настроек можно подключать сколько потребуется.
- Стоимость настройки зависит от сложности работ, наличия капчи и блокировок, срочности выполнения работ.
- Средние сроки настройки программы 3-7 рабочих дней.
- Если Вы ранее не работали с нашим парсером, то решение «под ключ» составит от 5300 р. (лицензия + настройка).
Бонусы: Постоянным клиентам предусмотрены скидки на настройку парсера.
Обзоры готовых парсеров товаров с сайтов
Парсер одежды «Tamrikoshop.com»
Парсинг детской одежды, школьной формы с сайта оптового поставщика одежды Тамрико.
Загрузка товаров одежды в Excel по шаблону Вашей CMS для импорта товаров на сайт, создания совместных покупок, размещения на маркетплейсах и т.п.
Обновление ассортимента, парсинг новых товаров, обновление цен и наличия.
Парсер климатехники «Миркли.ру»
Парсинг кондиционеров, котлов отопления и прочей климатической техники из интернет-магазина поставщика ООО»МИРКЛИ» по категориям, брендам, фильтрам.
Загрузка в Excel товаров климатехники по шаблону Вашей CMS для импорта товаров на сайт, торговые площадки и т.п.
Обновление ассортимента, парсинг новых товаров, обновление цен и наличия.
Парсер «АВС-электро»
Парсинг электротоваров и электротехники из интернет-магазина поставщика «АВС-электро» по категориям, брендам, фильтрам.
Загрузка в Excel электротоваров по шаблону Вашей CMS для импорта товаров на сайт, маркетплейсы и прочие торговые агрегатоы.
Обновление ассортимента, поиск новых товаров, обновление цен и наличия.
Парсер Santehnika-online.ru
Парсинг товаров сантехники и аксессуаров для ванной комнаты с интернет-магазина Santehnika-online.ru по категориям, брендам, фильтрам.
Загрузка сантехнических товаров по шаблону Вашей CMS для импорта товаров на сайт либо прочие торговые площадки.
Обновление ассортимента, поиск новых товаров, обновление цен.
- Парсеры по тематикам:
- Email адреса (2)
- Букмекерские конторы и спорт (6)
- Интернет-магазины и товары (4)
- Карты и справочники (1)
- Номера телефонов (2)
- Порталы и доски объявлений (2)
- Парсер BetCity.ru
- Парсер одежды «Tamrikoshop.com»
- Парсер климатехники «Миркли.ру»
- Парсер «АВС-электро»
- Парсер Santehnika-online.ru
- О программе
- Примеры работ
- Купить лицензию
- Заказать настройку парсера
- Контакты
- Частые вопросы