Форум PHP программистов > BOM при сохранении кодировки utf-8

[ Поиск ] - [ Пользователи ] - [ Календарь ]

Полная Версия: BOM при сохранении кодировки utf-8

Kreol2013

9.12.2012 - 12:29

Приветствую форумчане.
Прошу помощи в вопросе с перекодированием.
Написал скрипт для автоперевода при помощи сервиса bing
Изначально он был написан для перевода через copy-paste
на страничке отображалось текстовое поле и туда копировали наш перевод.
Задумалось не занимаясь копипастом работать прямо с файлом.
открыть файл - считать в текстовое поле - перевести - записать перевод.
И вот тут пошли грабли.
Файл изначально в кодировке UNIX ANSI с переносами строк 0x0A
при записи файла в массив, он перекодируется в ANSII
после прохождения через api переводчика текст становится utf-8
но при формировании результата он опять превращается в ASCII
И все бы хорошо, но при записи в файл перевода он перед переведенной строкой вставляет 3 байта BOM(не вначале файла).
\xEF\xBB\xBF - видно лишь в 16h
иногда можно увидеть и в поле перевода.

Итак вопрос как мне ПРОГРАММНО (не надо меня посылать руками конвертировать в Notepad++) удалять BOM а еще лучше вообще его не получать.
Результирующий файл должен быть лучше конечно в чистом UTF-8 без BOM либо в UNIX ANSI
не настаивать на использовании iconv и других кодировщиков в контексте "А чем Вам iconv не угодил?" без самостоятельной проверки не рекомендуется.
Извините если дерзко написал, но хочется конструктивных ответов, а не воду, которую я и так уже на протяжении дня перечитал и перепробовал. Хотя все может оказаться куда более проще либо наоборот.

Используется denwer 5.3 + eclipse
скрипт большой выкладываю так
https://www.dropbox.com/s/syy02y7vkcr6vu4/index111.rar
С ув. Антон.

Быстрый ответ:

Здесь расположена полная версия этой страницы.