В свет вышла очередная версия стандарта Unicode — 16.0 . Выпуск представляет собой значительное обновление, которое включает новые символы, таблицы кодов, дополнительные файлы данных, а также обновлённые приложения и синхронизированные стандарты.
Обновление добавило в стандарт 5185 новых символов, включая 3995 дополнительных египетских иероглифов, семь новых систем письма и семь новых эмодзи. Также в Unicode включены более 700 символов, использовавшихся в устаревших вычислительных средах. Общее количество символов в стандарте теперь достигает 154 998. Полный список новых символов и систем письма доступен в обновлённых таблицах кодов . Дополнительные сведения о новых эмодзи можно найти на странице Emoji Recently Added, v16.0 .
Особое внимание уделено обновлениям, связанным с иероглифами Восточной Азии. В таблицы кодов для более чем 36 000 унифицированных иероглифов CJK (Китай, Япония, Корея) добавлены новые японские источники данных «Moji Jōhō Kiban». Эти источники отражены в кодовых таблицах практически всех блоков унифицированных иероглифов CJK через добавление новых представительных глифов в колонке «J».
В новой версии стандарта обновлён базовый документ спецификаций , который теперь доступен для просмотра онлайн по главам с удобной навигацией и ссылками.
Два новых приложения также вошли в состав Unicode 16.0. Первое, UAX #53 , описывает алгоритм обработки арабских буквенных сочетаний и их правильное отображение. Ранее этот документ был опубликован как технический отчёт, теперь же он включён в стандарт для обеспечения единообразного отображения текстов на арабском языке.
Приложение UAX #57 посвящено базе данных египетских иероглифов Unikemet. Описание формата файла данных Unikemet.txt включает информацию для точной идентификации египетских иероглифов и их свойств, полезных для различных систем.
Полные сведения о нововведениях Unicode 16.0 доступны на официальном сайте Unicode .
Источник: SecurityLab