Есть такой html-текст:
HTML |
<TR><TD> <B>10.02.2009</B> <a Href="../Docum/DocumShow_DocumID_148356.html" onClick="javascript:return DocumShow("DocumID_148356.html")">О НЕПРАВОМЕРНОСТИ ПРИМЕНЕНИЯ С 01.01.2009 ПРИ ИСЧИСЛЕНИИ НАЛОГА НА ПРИБЫЛЬ К ОСНОВНОЙ НОРМЕ АМОРТИЗАЦИИ ПОНИЖАЮЩЕГО КОЭФФИЦИЕНТА 0,5 В ОТНОШЕНИИ ЛЕГКОВЫХ АВТОМОБИЛЕЙ И ПАССАЖИРСКИХ МИКРОАВТОБУСОВ С ПЕРВОНАЧАЛЬНОЙ СТОИМОСТЬЮ БОЛЕЕ 600 000 РУБ. И 800 00</a> <B>(Письмо, Министерство финансов РФ (Минфин России), № 03-03-06/1/44, от 10.02.09)</B><BR><I>В соответствии с разъяснениями Министерства финансов РФ, с 01.01.2009 г. не применяется повышающий коэффициент 3 к основным средствам, приобретенным по договору лизинга и относящимся к первой - третьей амортизационным группам, независимо от даты принятия их к учету.</I></TD></TR>
|
И еще много таких блоков.
Каждый блок обрабатывается следующим скриптом
PHP |
$mass = file_get_contents("http://www.businesspravo.ru/Docum/DocumMonitList.asp?CPage=4"); if (preg_match("/<table BORDER=\"0\" Width=\"100%\">(.*)<\/table>/isU",$mass,$match)){ echo "<table id=\"list\">$match[1]</table>"; print "<hr />"; if (preg_match_all("/<TR><TD>(.*)<\/TD><\/TR>/isU",$match[1],$blocki,PREG_PATTERN_ORDER)){ echo "<table id=\"list\" border=1>"; echo "<tr><td><b>дата публикации</b></td><td><b>адрес ссылки</b></td><td><b>имя ссылки</b></td><td><b>документ</b></td><td><b>комментарий</b></td></tr>"; for ($i=0; $i< count($blocki[0]); $i++) { preg_match("/<a Href=\"(.*)\"/isU",$blocki[0][$i],$match_link); preg_match("/<a Href.*>(.*)<\/a>/isU",$blocki[0][$i],$match_link_name); preg_match_all("/<B>(.*)<\/B>/isU",$blocki[0][$i],$match_date,PREG_SET_ORDER); if (preg_match("/<I>(.*)<\/I>/isU",$blocki[0][$i],$link_comment)){ $link_comm=$link_comment[1]; }else{$link_comm="";}; print "<tr>"; print "<td>".$match_date[0][1]."</td>"; print "<td>$match_link[1]</td>"; print "<td>$match_link_name[1]</td>"; print "<td>".$match_date[1][0]."</td>"; print "<td>$link_comm</td>"; print "</tr>"; } echo "</table>"; echo "<hr><b>всего строк: $i</b>"; } } |
Получается оч замороченно, какнибудь можно заменить preg_match()?
Спустя 2 часа, 47 минут, 42 секунды (4.03.2009 - 21:55) bret написал(а):
Попробуй через DOM-функции
_____________