Онлайн генератор XML-фидов Textus (закрылся)

Отправим материал вам на EMail:


    Время чтения: 6 мин.

    Вы рекламируете большое количество товаров, используя контекстную рекламу? Хотите избавить себя от рутинной работы по сбору и обновлению данных для рекламируемых товаров или услуг? Тогда вам нужен новый сервис от команды Garpun – простой генератор обновляемых XML-фидов Textus. В данном обзоре я постараюсь подробно рассказать вам о возможностях этого сервиса.

    Начнем с того, что фид данных необходим для любой системы автоматизации контекстной рекламы или прайс-агрегаторов. И если раньше для получения таких данных вам необходима была помощь вебмастера, то теперь в этом нет необходимости. Вы можете воспользоваться бесплатным сервисом Textus. Он позволит Вам быстро создать обновляемый XML-фид с данными для рекламной кампании клиента или собственного интернет-магазина. Для этого не нужны специальные знания. Достаточно иметь базовые понятия об HTML и CSS.

    Кому полезен Textus:

    • специалистам по контекстной рекламе;
    • рекламодателям;
    • веб-разработчикам.

    Но действительно ли так хорош Textus как о нем говорят? Давайте с вами проверим все на практике.

    Работа с генератором XML-файлов Textus

    Переходим по ссылке xml.garpun.com и регистрируемся. В данный момент сервис находится на стадии открытого тестирования и поэтому доступен бесплатно.

    После очень легкой регистрации у вас должно появиться следующее окно:

    РегистрацияЗдесь мы будем создавать наши проекты. Но для начала давайте настроим работу парсера, т.е. зададим правила, по которым сервис будет собирать необходимую для нас информацию.

    Переходим на вкладку «Parser configuration» и добавим новый парсер. В качестве примера, я взяла интернет-магазин мебели. Название и описание парсера не столь важны, но должны быть понятны для вас в первую очередь. В парсере самое главное настроить CSS Selector.

    Parser configurationЗадаем правила для данных, которые хотим получить. Первое, это, конечно же, название товара. Заходим на сайт, открываем карточку любого товара и кликаем правой кнопкой мыши на название. В выпавшем меню выбираем «Просмотреть код».

    Просмотреть код

    Мы видим, что название товара содержится в теге h1. Что в принципе и логично. Затем переходим снова к настройкам парсера и заполняем первое правило:

    1. В поле CSS Selector пишем тег h1, ведь именно в нем и содержится название товара;
    2. В Property пишем «name»;
    3. Data type выбираем «string»;
    4. Source – «default».

    Третий пункт, означает, что вам необходимо указать тип данных, которые вы будете собирать. На выбор даются 3 варианта:

    • string – текстовая строка;
    • url – ссылка;
    • number – номер.

    В данном случае, название товара – это конечно же, «string».

    В четвертом пункте мы выбираем, из какого источника собирать информацию: text или attribute, либо оставить по умолчанию default. Что я и сделала, собственно говоря. Об источнике attribute расскажу чуть позже.

    После того как все поля заполнены, обязательно нажимаем «Save».

    Аналогичным образом сформируются и остальные правила. Например, мы хотим еще получить ссылку на картинку и цену товара. Тут определять CSS Selector будет немного сложнее.

    Если вы не владеете хотя бы базовыми знаниями о CSS, то разобраться будет не сложно. Но что же делать людям, которые даже не знают, что такое CSS и с чем его едят?

    Есть 2 выхода:

    • можно установить BugBuster – расширение в браузер, которое одним кликом поможет вам определить CSS Selector;
    • либо воспользоваться встроенным функционалом браузера для того, чтобы скопировать CSS Selector любого необходимого элемента.

    С первым все достаточно просто. Просто установите расширение. Активируйте его на странице товара, с которого хотите получить данные, нажав «Pick CSS Selector». Он автоматически начнет подсвечивать все элементы, находившиеся на странице. Выбираете тот, который вам необходим кликаете и BugBuster автоматически сохраняет CSS Selector в буфер обмена. Вам останется только вставить его в необходимое поле.

    Определим CSS Selector для картинки с помощью второго способа. Для этого кликаем правой кнопкой мыши на картинку. Все также выбираем «Просмотреть код» в меню. Браузер подсвечивает выбранные элементы, поэтому просто нажимаем правой кнопкой мыши в окне кода и выбираем пункт Copy→Copy selector. Он также сохраняется в буфере и остается только вставить его в поле «CSS Selector».

    «Просмотреть код» в менюВыбираем тип данных «url», ведь мы хотим получить именно ссылку на картинку. И вот тут нужно быть внимательным. Как видите, наша ссылка находится в теге «а» класса «div». И поскольку нам нужна именно ссылка, то в качестве источника мы укажем атрибут «src».

    Вроде ничего сложного. Дальше любым удобным для вас способом определяйте все остальные необходимые правила, сохраняйте их и будем проверять работу нашего парсера.

    Но прежде нам нужно получить ссылку, по которой будут доступны результаты парсера. Для этого перейдем на вкладку «Settings» и сгенерируем маркер, нажав на кнопку «Generate new».

    Generate new

    Теперь вернемся на вкладку «Project» и создадим наш проект.

    Заполняем поле «Project name», затем в «Parser configuration» выбираем созданный нами парсер и нажимаем кнопку «Add». Появляется окно редактирования проекта.

    Project name

    Вот тут и начинается самое интересное. Необходимо указать ссылки, с которых парсер будет собирать информацию. Их можно задать вручную. Но представьте себе на минуточку, что у вас интернет-магазин с множеством товаров: сколько вам потребуется времени, чтобы внести все ссылки вручную? Думаю, никто не захочет заниматься такой рутинной работой.

    Поэтому в Textus есть возможность использовать XML-карту сайта. Ведь по большей части, у каждого более-менее нормального сайта, а тем более интернет-магазина, уже имеется XML-карта. Ну, а если нет, то сгенерировать ее в принципе не сложно.

    В своем примере я использовала как раз карту сайта. В поле «Urls in project» указываем ссылку на XML-карту. Но так как в ней содержаться все ссылки сайта, а нам нужны только товары, то необходимо их отфильтровать. Для этого в поле «Urls mask» нужно выбрать «ON» и задать правило.

    Как это сделать? Открываете XML-карту вашего сайта и определяете, как можно отфильтровать страницы с товарами. Для интернет-магазина это будет несложно. Изучив карту, я поняла, что любой товар в своем адресе содержит фразу «catalog-view». Поэтому ее и будем использовать для фильтра.

    Я получила следующее правило: *catalog-view/*

    * – это любая последовательность символов

    Url’s maskМожно сразу же проверить правильно ли работает правило. Нажимаем на галочку «Check the mask», вводим ссылку на любой из товаров и нажимаем кнопку «Check». Если все работает правильно, то появится зеленое подсвечивание как на скриншоте.

    Используя правила, вы можете не только получить список всех товаров, но и разбить проект на определенные разделы. В случае с интернет-магазином, это могут быть, например, различные категории товаров.

    Теперь нам нужно выбрать формат файла, в который мы хотим выгрузить информацию: xml или csv. Для работы с контекстной рекламой или прайс-агрегаторами чаще всего используют формат xml. Поэтому его мы и выберем. Также в Textus есть возможность настроить выгрузку на ваш Google диск.

    Дальше остается только настроить время ежедневного запуска парсера. Таким образом, парсер автоматически будет запускаться каждый день в установленное время. И если на сайте произошли какие-то изменения, например, добавились товары, то в новой версии это будет учтено.

    время ежедневного запуска парсераНо прежде чем сохранить все настройки должна вас предупредить. Запустить парсер для проверки сразу после настройки не получится. Вам нужно установить самое ближайшее время и ждать пока парсер сработает или нет. Ведь мы не можем быть на 100% уверены, что настроили все правильно. А запустить парсер принудительно нет возможности. Только в указанное время (по Москве). Так что, вот и первый недостаток.

    Как только мы все настроили, сохраняем и ждем, когда сработает парсер. В поле «Last result» всегда находится самый актуальный файл.

    Last resultНу что ж, давайте посмотрим на результат.

    результатКак видим, все работает правильно. Парсер выгрузил все необходимые данные.

    Замечу, что в процессе изучения работы сервиса, я обнаружила еще несколько недостатков:

    • Форматы выгрузки подходят не для всех сервисов.
    • Неудобное отображение данных в формате xls (протестируйте сами и убедитесь).

    По первому пункту могу сказать, что сервисы, которые работают с контекстной рекламой, иногда требуют данные в формате yml. Так что, в таком случае, Textus вам не поможет. По крайней мере, пока. Ведь сервис разработан по большей части для системы Garpun, а для нее формат xml очень даже подходит. Но Textus находится еще на стадии тестирования. Будем надеяться, что команда Garpun его доработает. Ведь у них есть все шансы получить в итоге достаточно хороший сервис. Так что, желаю вам удачи!

    Ко всему описанному выше предлагаю посмотреть подробное видео о настройке Textus.

    5/5 - (2 голоса)