Вот и я завяз в перекодировании...
Есть сайт - старый и большой - php+MySQL - весь на кириллице 1251.
Это данность, кодировку сайта изменить не предлагайте, это нереально.
Есть текст в UTF-8 - русский перемешан с ивритом, и всё это приправлено HTML. Иврит с огласовками, в этом и ценность. Такого типа каша: <span dir=rtl>עֶבֶד אֱלוֹהִים</span> (раб божий)
Большой текст, несколько тысяч страниц текста. Страницы нужно загрузить в БД для отображения страниц на сайте.
Я вижу один выход: надо перекодировать в вин-кириллицу, по ходу весь иврит заменив на метасимволы. Например вместо буквы מ использовать ее метасимвол מ.
Как бы это оптимизировать? Или ничего лучше не придумать как только заменять в str_replace массив еврейских символов массивом метасимволов?
_____________
Бесплатному сыру в дырки не заглядывают...