Расширение для ручного парсинга
Случается, что информации о товаре нет в нашей библиотеке, но она есть на каком-то сайте. При этом вручную копировать её - долго и утомительно. Мы сделали расширение для браузера, которое помогает в такой ситуации.
Принцип работы
Пользователь устанавливает расширение. Когда пользователь с установленным активным расширением открывает страницу сайта, который система может распарсить, HTML код страницы отправляется на сервер catalog.app. Сервер собирает информацию о ценах, наличии, характеристиках, описаниях, изображениях товаров со страницы.
Собранные данные моявляются в общей или в приватной библиотеке, в зависимости от того, указаны ли пользователем логин и пароль в настройках расширения.
Решаемые задачи
- Такой подход позволяет получить информацию даже со страниц, закрытых авторизацией или жесткой капчей.
- Можно получать информацию о новинках, не дожидаясь, пока её найдет автоматический парсер.
Инструкция
- Скачайте расширение в личном кабинете в разделе "Приватная библиотека"
- Распакуйте в какую-либо папку на вашем компьютере
- Откройте браузер (на движке Chromium) и перейдите на страницу "Управление расширениями" (Menu -> Extensions -> Manage Extensions)
- Найдите переключатель "Режим разработчика" (Developer mode) и включите его
- Нажмите "Загрузить распакованное" (Load unpacked) и укажите путь к папке с расширением
- Перейдите в настройки расширения (через контекстное меню на значке расширения) и укажите свои логин и пароль от аккаунта в catalog.app (не обязательно)
- Откройте поддерживаемый системой сайт и убедитесь, что на значке расширения появился зеленый кружок.