Есть xml дамп русской Википедии. Структура его следующая:
Задача такова:
Нужно удалить всё от <page> до </page> (с тегами page в том числе), если <title> начинается с ключевых слов: Файл:, Изображение:, Mediawiki: и Википедия:
После этого надо скопировать значение из титла, преобразовать его в url код и вставить после <text xml:space="preserve">{{оригинал статьи|http://ru.wikipedia.org/wiki/ ВОТ СЮДА }} Текст статьи с вики разметкой
чтобы имело вот такой вид:
[html]<text xml:space="preserve">{{оригинал статьи|http://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%B3%D0%BE%D0%BB%D0%BE%D0%B2%D0%BE%D0%BA }} Текст статьи с вики разметкой[html]
С программированием дела обстоят плохо. Поэтому ищу помощи на форумах. Помогите, ПОЖАЛУЙСТА!
Спустя 21 минута, 5 секунд (23.02.2009 - 13:26) Семён написал(а):
Посмотрите название форума - "Форум PHP программистов", а не "Бесплатные PHP фрилансеры". Если я не умею класть плитку, я же не пойду к плиточнику с улицы: "Положи мне новую плитку в туалете нахаляву, ок?" Мы можем помочь с логикой, подходом к задаче частично кодом, что использовать, но не написать за вас готовое решение!