Доброго времени суток!
Подскажите, кто сталкивался с подобным, каким образом с помощью php можно разбить html-страницу на блоки: выделить основную часть с контентом, меню, футер и т.д., не зная структуру DOM?
Интересует в большей степени определение основного контента страницы.
В сети есть материалы на эту тему, но что-то я не совсем понял алгоритм реализации.
Например:
http://habrahabr.ru/post/210824/
http://www.vestnik.vsu.ru/pdf/analiz/2008/02/2008_02_20.pdf