Правила     Закладки     Карма    Календарь    Журналы    Помощь    Поиск    PDA    Чат   
        СМС-ки
   
Пейджер выключен!
 
Фильтр авторов:    показать 
  скрыть
  Ответ в темуСоздание новой темыСоздание опроса

> Разбивка строки на теги, preg_match_all возвращает самое большое вхождение
Alecs  
 ۩  Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Старик
***

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 123
Пользователь №: 1560
На форуме: 9 лет, 9 месяцев, 4 дня
Карма:




Здраствуйте.
Второй день туплю.
Есть строка типа: "<x:row r="2">...куча подтегов...</x:row><x:row r="3">...куча подтегов...</x:row> ... <x:row r="n">...куча подтегов...</x:row>".
Надо разбить ее на теги "x:row". Разные вариации типа `<x:row .*>.+?</x:row>` у меня в preg_match_all выделяют всю строку, то есть самый первый открывающий тег и самый последний закрывающий тег показывается как один единый.
Где я ошибаюсь?


--------------------
PM
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
kaww  
Дата
Цитировать сообщение

Пользователь сейчас на форуме



Здесь живет
******

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 1755
Пользователь №: 20757
На форуме: 6 лет, 10 месяцев, 1 день
Карма: 184




Судя по всему строка эта в формате xml, поэтому можно воспользоваться специальным инструментарием. который есть в php http://php.net/manual/ru/function.simplexml-load-string.php.
PMПисьмо на e-mail пользователю
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Alecs  
 ۩  Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Старик
***

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 123
Пользователь №: 1560
На форуме: 9 лет, 9 месяцев, 4 дня
Карма:




Файл весит 1,5 гигабайта. Часть парсеров уже отсеялась. Потоковые парсеры выдают ошибку при разборе. Копал долго, в результате понял что будет быстрее написать свой парсер (через file_get_contents), чем налаживать их.

PS: Это экселевский файл xlsx. Все опробованые библиотеки для эксель-файлов выдают ошибки, из за отклонений формирования пакета, хотя сам эксель файл читает, правда медленно(после пересохранения скорость увеличивается в разы). Поставщик файла ничего менять с положением вещей не собирается, так что придется выкручиваться мне.


--------------------
PM
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
Alecs  
 ۩  Дата
Цитировать сообщение

Пользователя сейчас нет на форуме



Старик
***

Профиль
Группа: Форумчанин
Завсегдатай форума
Сообщений: 123
Пользователь №: 1560
На форуме: 9 лет, 9 месяцев, 4 дня
Карма:




Решение:
$pattern = "`<x:row\s.*>.*</x:row>`U";


--------------------
PM
    0   Для быстрого поиска похожих сообщений выделите 1-2 слова в тексте и нажмите сюда Для быстрой цитаты из этого сообщения выделите текст и нажмите сюда
  Быстрый ответ
Информация о Госте
Введите Ваше имя
Кнопки кодов
Для вставки цитаты, выделите нужный текст и
НАЖМИТЕ СЮДА
Введите сообщение
Смайлики
:huh:  :o  ;) 
:P  :D  :lol: 
B)  :rolleyes:  <_< 
:)  :angry:  :( 
:unsure:  :blink:  :ph34r: 
     
Показать всё

Опции сообщения  Включить смайлики?
 Включить подпись?
 
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)
0 Пользователей:

Опции темы Ответ в темуСоздание новой темыСоздание опроса