я тут пытаюсь парсить сайт http://www.bloggerei.de, прохожусь циклом и вытаскиваю инфу о зарегистрированных блогах. пробовал регулярками, но скорость была маленькая. потом открыл для себя библиотеку simple html dom parser. очень все интуитивно и понятно, уже много каталогов парсил и все было в разы быстрее, чем регулярки.
но с этим сайтом все по-другому. скрипт уже готов, все работает, но мне хотелось бы повысить скорость, сделать скрипт более умным.
include 'simple_html_dom.php';
error_reporting(0);
ini_set("max_execution_time", "90000");
$id=30440;
while($id<30441) {
$url= "http://www.bloggerei.de/blog/$id/d";
$html=file_get_html($url);
$inhalt=$html->find("table", 3)->find('table', 8); #inhalt der Tabelle
$thema=$inhalt->find('td',6)->plaintext;
$data=$inhalt->find('td',3)->plaintext;
вот пример как я это делаю. понятно, что не на каждом id есть инфа о блогах. как добавить в скрипт условие, чтоб возвращал мне только те id, где есть инфа? как повысить скорость работы скрипта?