[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Помогите спарсить текст с web-странички)
p0wer
Есть веб-страничка. На ней текст такого вида:

XX
http://site1.ru
http://site2.ru
http://site2.ru
UIN1;pass1
UIN2;pass2
UIN3;pass3
...
UIN50;pass50

Нужно сохранить в текстовый файл в столбик эти юины.
Где XX -- двухзначное или трёхзначное число.

Правда, в таком виде в исходном коде, а в браузере всё слитно через пробел.

Буду очень благодарен! smile.gif
+ в карму.





Спустя 11 часов, 40 минут, 18 секунд (16.02.2012 - 11:05) Zerstoren написал(а):
Заключите в тег <pre> данный текст.

И в карму вы ничего не поставите.
Минимум 10 сообщений быть должно.

Спустя 2 часа, 22 минуты, 17 секунд (16.02.2012 - 13:27) p0wer написал(а):
Это же взаимопомощь, поэтому и пишу сюда. Для тех, кто знает PHP — это делов 5 минут smile.gif
Надеюсь, найдётся добрый человек :3

Спустя 1 минута, 42 секунды (16.02.2012 - 13:29) inpost написал(а):
Что, в универе на зачёт надо?

Спустя 7 минут, 27 секунд (16.02.2012 - 13:36) p0wer написал(а):
Не, для себя. Но, к сожалению, пыху не знаю.

Спустя 2 минуты, 29 секунд (16.02.2012 - 13:39) inpost написал(а):
p0wer

 ! 

М
Не надо создавать дубли!
inpost


А по теме, ну что могу сказать, если не программист, то только за деньги. Оформляй заказ, по возможности указывай сумму.

Спустя 20 минут, 12 секунд (16.02.2012 - 13:59) p0wer написал(а):
Я посмотрел этот раздел, тут же могут написать и за доброе слово.
На то этот раздел и придуман.

Спустя 2 минуты, 20 секунд (16.02.2012 - 14:01) Игорь_Vasinsky написал(а):
file_get_contents() - поможет получить эту страницу в переменную.

Потом нужно посмотреть в исходнике страницы и составить паттерн для регулярки - она уже получит всё в массив.

Спустя 12 минут, 59 секунд (16.02.2012 - 14:14) inpost написал(а):
p0wer
Посмотри внимательно, никто тут не помогает, этот раздел мёртвый. В теории помогут 1 из 100, на практике всех игнорируют. Я лишь дал совет, как поступить, если ты заказчик и тебе необходимо выполнить проект.
К тому же форум для ПХП программистов, это значит, что программисты друг другу помогают, а не халявщикам и жадным людям.

Спустя 43 минуты, 45 секунд (16.02.2012 - 14:58) killer8080 написал(а):
$content = file_get_contents($url);
preg_match_all('#(UIN\d+);([^\s]+)#i', $content, $match);
echo '<pre>'.print_r($match, 1).'</pre>';

Спустя 1 день, 4 часа, 45 минут, 38 секунд (17.02.2012 - 19:44) p0wer написал(а):
Спасибо smile.gif Нашёлся добрый человек, дал регулярку, получилось вот что:

<?php
preg_match_all("/\s(\d+;\w+)/",file_get_contents('test.html'),$m);
file_put_contents('test.txt', implode("\r",$m[1]) ."\n", FILE_APPEND);
?>
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.