Страница: 1 |
Страница: 1 |
Вопрос: UTF-8
Добавлено: 30.05.05 19:00
Автор вопроса: misha-k44
Никто не подскажет, где можно найти описание как перекодировать текст в UTF-8 (например из UCS Little Endian) и обратно?
С уважением,
Михаил
Ответы
Всего ответов: 2
Номер ответа: 1
Автор ответа:
Павел
Администратор
ICQ: 326066673
Вопросов: 368
Ответов: 5968
Web-сайт:
Профиль | | #1
Добавлено: 31.05.05 09:30
Функции Win32 API WideCharToMultiByte и MultiByteToWideChar.
Номер ответа: 2
Автор ответа:
misha-k44
Вопросов: 5
Ответов: 7
Профиль | | #2
Добавлено: 31.05.05 18:36
Нет, Павел, эти функции работают с текстами в Unicode, закодированными в формате UCS Little Endian, в котором на кодировку 1 символа идет 2 байта. Немногим отличается формат UCS Big Endian - он отличается порядком байтов (и разумеется заголовком). Формат UTF-8 записывает иначе, там в 3 байтах прячется 2 символа; кстати это любимый формат Red Hat...
Значит, прежде чем пользоваться указанными API надо перекодировать в стандартный вид из UTF-8. Но найти описание, пусть даже на английском - я не смог. Где только я не искал! Но не смог...