[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: & #1502; <= מ
FatCat
Вот и я завяз в перекодировании...

Есть сайт - старый и большой - php+MySQL - весь на кириллице 1251.
Это данность, кодировку сайта изменить не предлагайте, это нереально.

Есть текст в UTF-8 - русский перемешан с ивритом, и всё это приправлено HTML. Иврит с огласовками, в этом и ценность. Такого типа каша: <span dir=rtl>עֶבֶד אֱלוֹהִים</span> (раб божий)
Большой текст, несколько тысяч страниц текста. Страницы нужно загрузить в БД для отображения страниц на сайте.
Я вижу один выход: надо перекодировать в вин-кириллицу, по ходу весь иврит заменив на метасимволы. Например вместо буквы מ использовать ее метасимвол &#1502;.
Как бы это оптимизировать? Или ничего лучше не придумать как только заменять в str_replace массив еврейских символов массивом метасимволов?

_____________
Бесплатному сыру в дырки не заглядывают...
Invis1ble
по-моему, других вариантов и нет

_____________

Профессиональная разработка на заказ

Я на GitHub | второй профиль

FatCat
Я пока экспериментирую с urlencode... Если получится, отпишусь. Если не получится, тоже отпишусь.

_____________
Бесплатному сыру в дырки не заглядывают...
Invis1ble
urlencode займет на 1 байт меньше, по идее. Но тебе ведь придется при выводе конвертировать все в те же html-сущности, к тому же нужно будет еще как-то определять, что конвертировать, а что оставить в неизменном виде smile.gif

_____________

Профессиональная разработка на заказ

Я на GitHub | второй профиль

sergeiss
FatCat, а почему бы не использовать htmlentities() при сохранении в БД? Да, места займет немало. Но зато обработка будет автоматизирована полностью.

_____________
* Хэлп по PHP
* Описалово по JavaScript
* Хэлп и СУБД для PostgreSQL

* Обучаю PHP, JS, вёрстке. Интерактивно и качественно. За разумные деньги.

* "накапливаю умение телепатии" (С) и "гуглю за ваш счет" (С)

user posted image
FatCat
Цитата (sergeiss @ 8.06.2014 - 19:18)
htmlentities()

user posted image

Вместо нужного мне
<span dir=rtl>& #1502;& #1461;& #1510;& #1463; & #1495; & #1494;'</span>



Цитата (sergeiss @ 8.06.2014 - 19:18)
при сохранении в БД?

Именно этого и хочу с ивритом.
Но русский должен остаться в вин-кириллице. Вопрос не только места в БД, но и индексации поисковками.

_____________
Бесплатному сыру в дырки не заглядывают...
FatCat
Если кому понадобится, вот массивы для преобразования:
Свернутый текст
$il = array(
'%D7%90',
'%D7%91',
'%D7%92',
'%D7%93',
'%D7%94',
'%D7%95',
'%D7%96',
'%D7%97',
'%D7%98',
'%D7%99',
'%D7%9A',
'%D7%9B',
'%D7%9C',
'%D7%9D',
'%D7%9E',
'%D7%9F',
'%D7%A0',
'%D7%A1',
'%D7%A2',
'%D7%A3',
'%D7%A4',
'%D7%A5',
'%D7%A6',
'%D7%A7',
'%D7%A8',
'%D7%A9',
'%D7%AA',

'%D6%AA',
'%D6%AB',
'%D6%AC',
'%D6%AD',
'%D6%AE',
'%D6%AF',
'%D6%B0',
'%D6%B1',
'%D6%B2',
'%D6%B3',
'%D6%B4',
'%D6%B5',
'%D6%B6',
'%D6%B7',
'%D6%B8',
'%D6%B9',
'%D6%BA',
'%D6%BB',
'%D6%BC',
'%D6%BD',
);


$ru = array(
'&# 1488;',
'&# 1489;',
'&# 1490;',
'&# 1491;',
'&# 1492;',
'&# 1493;',
'&# 1494;',
'&# 1495;',
'&# 1496;',
'&# 1497;',
'&# 1498;',
'&# 1499;',
'&# 1500;',
'&# 1501;',
'&# 1502;',
'&# 1503;',
'&# 1504;',
'&# 1505;',
'&# 1506;',
'&# 1507;',
'&# 1508;',
'&# 1509;',
'&# 1510;',
'&# 1511;',
'&# 1512;',
'&# 1513;',
'&# 1514;',

'&# 1450;',
'&# 1451;',
'&# 1452;',
'&# 1453;',
'&# 1454;',
'&# 1455;',
'&# 1456;',
'&# 1457;',
'&# 1458;',
'&# 1459;',
'&# 1460;',
'&# 1461;',
'&# 1462;',
'&# 1463;',
'&# 1464;',
'&# 1465;',
'&# 1466;',
'&# 1467;',
'&# 1468;',
'&# 1469;',
);
Пробелы после "#" нужно будет конечно же убрать.

_____________
Бесплатному сыру в дырки не заглядывают...
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.