unicode

  • ХабрахабрФото Цемна стронэ Моцы

    Цемна стронэ Моцы

    Початково рыцер Еди, под вплывем Дартха Сидиоуса прешедл на цемна стронэ Моцы и прыял тытул „Дартх Вадер”. Вы поняли что-то из предыдущего предложения? Это польский язык. Это не перевод, это польский язык как он есть, просто записаный кириллицей. Вчера, я случайно оказался на польском сайте, там всё было написано по польски, ничего не понятно, и мне вдруг стало любопытно, что…

    Читать далее »
  • ХабрахабрФото [Перевод] 7 ложных предположений о том, как устроены строки

    [Перевод] 7 ложных предположений о том, как устроены строки

    Как Unicode уничтожает большинство ваших предположений о том, как на самом деле работают строки Когда речь идет о написании чего-то простого, мы, программисты, обычно действуем интуитивно. В случае с простыми вещами мы полагаемся на четкий набор предположений вместо конкретных знаний о том, как эти вещи работают. Например, мы предполагаем, что если b = a + 1, то b больше a,…

    Читать далее »
  • ХабрахабрФото [Перевод] Unicode: как человечество пришло к международному стандарту кодирования символов

    [Перевод] Unicode: как человечество пришло к международному стандарту кодирования символов

    Уверена, что большинство читателей хоть немного знакомы с терминами «Unicode» и «UTF-8». Но все ли знают, что именно стоит за ними? По сути они относятся к стандартам кодирования символов, также известным как наборы символов. Концепция появилась во времена оптического телеграфа, а не в компьютерную эру, как можно было подумать. Еще в 18 веке существовала потребность в быстрой передаче информации на…

    Читать далее »
  • ХабрахабрФото [Перевод] Под капотом у Emoji

    [Перевод] Под капотом у Emoji

    В течение последних нескольких недель Nikita Prokopov внедрял поддержку эмодзи для Skija. Он решил поделиться несколькими мелкими деталями того, как это «самое большое новшество в человеческом общении со времен изобретения буквы » работает под капотом. Примечание переводчика: Хабр не поддерживает эмодзи, поэтому пришлось выкручиваться и заменить эмодзи картинками. Unicode Каждый символ на компьютере кодируется числом. Самая популярная кодировка — Unicode,…

    Читать далее »
  • ХабрахабрФото [Перевод] Правда о регистре символов, которую должны знать программисты

    [Перевод] Правда о регистре символов, которую должны знать программисты

    На конференции North Bay Python в 2018 году я делал доклад об именах пользователей. Информация из доклада по большей части была собрана мною за 12 лет поддержки django-registration. Этот опыт дал мне гораздо больше знаний, чем я планировал получить, о том, насколько сложными могут быть «простые» вещи. В начале доклада я, правда, упомянул, что это не будет очередное разоблачение из…

    Читать далее »
  • ХабрахабрФото [Перевод] Правда о регистре символов, которую должны знать программисты

    [Перевод] Правда о регистре символов, которую должны знать программисты

    На конференции North Bay Python в 2018 году я делал доклад об именах пользователей. Информация из доклада по большей части была собрана мною за 12 лет поддержки django-registration. Этот опыт дал мне гораздо больше знаний, чем я планировал получить, о том, насколько сложными могут быть «простые» вещи. В начале доклада я, правда, упомянул, что это не будет очередное разоблачение из…

    Читать далее »
  • ХабрахабрФото Ещё один велосипед: храним юникодные строки на 30-60% компактнее, чем UTF-8

    Ещё один велосипед: храним юникодные строки на 30-60% компактнее, чем UTF-8

    Если вы разработчик и перед вами стоит задача выбора кодировки, то почти всегда правильным решением будет Юникод. Конкретный способ представления зависит от контекста, но чаще всего тут тоже есть универсальный ответ — UTF-8. Он хорош тем, что позволяет использовать все символы Юникода, не тратя слишком много байт в большинстве случаев. Правда, для языков, использующих не только латиницу, «не слишком много»…

    Читать далее »
  • ХабрахабрФото [Из песочницы] Обработка изображений ReactJS — NodeJS

    [Из песочницы] Обработка изображений ReactJS — NodeJS

    Доброго времени суток. Разбор полетов провожу на Reactjs (сторона клиента) и Nodejs (сторона сервера). Недавно в моем маленьком проекте встал вопрос, как легко и просто можно обмениваться изображениями по типу клиент — сервер. Сегодня мы научимся отправлять бинарные данные (конкретно изображения ) со стороны клиента и обрабатывать их на сервере. Добро пожаловать в под кат.Если ваше web-приложение — это соц.сеть…

    Читать далее »
  • ХабрахабрФото Как добавить новые символы в Unicode: опыт обывателя

    Как добавить новые символы в Unicode: опыт обывателя

    Все знают про общепринятый стандарт Unicode. Его (UTF-8) использует абсолютное большинство веб-ресурсов. А Unicode Consortium под управлением Марка Дэвиса — одного из ключевых контрибьюторов оригинальной спецификации 1987 года — периодически вносит обновления. На днях к апдейтам вроде китайского письма нюй-шу или горизонтальной квадратной письменности монголов добавили кучу эмодзи. Но мало кто знает, что иногда в плановые обновления попадают и более…

    Читать далее »
  • ХабрахабрФото Взлом с помощью Юникода (на примере GitHub)

    Взлом с помощью Юникода (на примере GitHub)

    Юникод исключительно сложен. Мало кто знает все хитрости: от невидимых символов и контрольных знаков до суррогатных пар и комбинированных эмодзи (когда при сложении двух знаков получается третий). Стандарт включает 216 кодовых позиций в 17-ти плоскостях. По сути, изучение Юникода можно сравнить с изучением отдельного языка программирования. С другой стороны, злоумышленники могут использовать особенности Юникода в своих целях, что и делают.…

    Читать далее »


Кнопка «Наверх»