как порезать html код php скриптом

php регулярные выражения regexp html парсинг

нужно порезать html статью на несколько кусков (5-10) желательно равной (+/-) длины и между этими кусками вставить свой текст,

такую задачу я решил, но вот проблема нарисовалась: иногда html статья делится так, что обрываются теги, в одном куске остается начало тега, в другом конец... как бы этого избежать? парсить через DOM?

Примечание:
ну допустим, нашли один закрывающий div или p
а если он вложен в несколько других, тогда все равно полезет :(
или я чего то недопонял?
Ответы:
вычисляем примерное кол-во симолов статьи, пропускаем (n/кол-во частей) символов, ищем первый подходящий закрывающий тэг (</p> или </div> например) и вставляем после него нужный код preg_replace'ом..
хмм под статьей, я полагал, подразумевается одноуровневая разметка, со вложенными такое не пройдет канеч.
Делал такое, но как уже не помню (((
Алгоритм приблизительно следующий:
Разбиваем на подстроки <tag>...</tag> - Str
if(sum + count(Str) <= maxCount)
 newStr .= Str


16 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.