Добрый день, нужно написать скрипт для парсинга title из выдачи яндекса по поисковому слову.
Пример работы парсера:
Программа берет запрос (можно загрузить несколько запросов через запятую или пробел)
Вставляет его в яндекс
Получает выдачу топ 10
Берет тег title из всех сайтов топ 10
Сравнивает теги на совпадение, применение запятых, тире, слешей(всех разделителей и порядок слов)
Выбирается самый средний из всех, который попадает под эти критерии
Генерирует тег с добавление оригинальности, которая задается заранее (как правило это название сайта в конце тега)
После этого выгружается в файл или таблицу вида : Ключ | Title
Пример выдачи по запросу: купить двуспальную кровать
1. Двуспальные кровати - купить двуспальную кровать от производителя в Москве, цена в интернет-магазине Мебельвиа
2. Двуспальные кровати, купить кровать двуспальную — Орматек
3. Двуспальные кровати - купить двуспальную кровать в Москве, недорого от производителя в Интернет магазине
4. Двуспальные кровати от 2900 руб. Купить двуспальную кровать — МДМ
5. Кровати в Москве, цены в каталоге СТОЛПЛИТ
6. Двуспальные кровати, купить двуспальную кровать недорого в Москве
7. Кровати двуспальные от 2790 руб в Москве от производителя
8. Кровати двуспальные| Купить двуспальную кровать в интернет-магазине Сон Сити по низкой цене!
9. Недорогие двуспальные кровати, купить двуспальную кровать недорого в Москве в интернет-магазине ЛайфМебель
Из всех Этих тайтлов самое подходящее и среднее это:
3. Двуспальные кровати - купить двуспальную кровать в Москве, недорого от производителя в Интернет магазине