Соединение парсинга с разным названием атрибутов


Сергей Ефимов
95

Привет, такой вопрос. Есть сайт на WP, есть несколько смежных категорий товаров, которые надо объединить в единую базу данных с фильтрацией.

Проблема в том, что основных производителей с вменяемо заполненным карточками товара — 5 (может и больше), товары есть на Яндекс.Маркете, Слоне, пара нишевых сайтов. Но глубина их карточек меня не устраивает.

Каким образом подготовить единый csv/xml/по фиг что формат, чтобы соединить все данные с разных источников.

Собственно, у одного товара в зависимости от сайта-донора может быть как разный набор характеристик, так и разное название атрибута/значения, плюс может быть по разному атрибуты представлены (где-то через запятую, где-то строчками). Товаров всего около 1000.

Кто-нибудь занимается интеграцией на WP из форумчан? Рассмотрю предложение по услугам. ) Но мне важно понять, как это логически работает, так что будут вопросы.


totamon
пишете парсеры под все источники, парсите в один файл екселевский, в ручную дубли по названию чистите или объединяете, делаете импорт в ВП… ну или человека нанимаете которые все это делает)) вот право откуда такие вопросы вообще? верите в секретную волшебную кнопку, нажал и все готово?))

Сергей Ефимов
totamon #:
пишете парсеры под все источники, парсите в один файл екселевский, в ручную дубли по названию чистите или объединяете, делаете импорт в ВП… ну или человека нанимаете которые все это делает)) вот право откуда такие вопросы вообще? верите в секретную волшебную кнопку, нажал и все готово?))

Кмк, вопрос задан корректно и кнопка не искалась. Меня интересует логика парсинга и объединения атрибутов с разными названиями и значениями. Поскольку позиций не 10 и не 100, а атрибутов за 60, хотелось бы найти более визуально яский инструмент, чем эксель или человека, который это сделает.


BooblikBBW
Универсального решения нет, в любом случае такие задачи нужно программировать через Content Downloader или на край через BAS

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *