rashidfarooq Ответов: 5

Что такое символы не Юникода


уважаемый друг.

Я знаю о символах Юникода, но я не знаю, что такое символы, отличные от Юникода. Так же можно, если кто-то объяснит на примерах, что такое символы не Юникода.

sruthima

пожалуйста, объясните мне " точную разницу между юникодом и не юникодом"

5 Ответов

Рейтинг:
40

Emilio Garavaglia

"Не Юникодный символ", как и всякое не-понятие, расплывчат.
На простом английском языке означает "каждый символ, идентификация которого не назначена с помощью таблиц Юникода".

Это просто может означать две вещи:
каждый "номер"то есть трактовать машину как "character"но превысить спецификацию Unicode (например, 32-битное число больше 221 или это попадает в "неназначенные пробелы" или "картографические пространства" спецификаций Unicode.
Другими словами, то, что существует для машины, но не имеет смысла для читателя-человека.

Или же он может относиться к символу, идентичность которого определяется не с помощью спецификации Unicode, а из какой-то другой спецификации, которая не была заменена Unicode.
Например, SBC/MBCS на основе кодовых страниц Windows, набор символов EBCDIC и т. д.
Символы, которые, если принять за Unicode, приведут к глифам, отличным от тех, которые были предназначены.

Или, более того, все, что вы можете назвать "символом", которое определяется вами самостоятельно, независимо от спецификаций Unicode.


CPallini

Причина моего голосования 5
Отлично.

J.Surjith Kumar

Хорошее объяснение мое 5.

Рейтинг:
2

R. Giskard Reventlov

Слишком ленив, чтобы гуглить?

Здесь: Разница между Unicode и Nonunicode[^]


rashidfarooq

Брат, я пришел сюда после здорового поиска в Google. Ссылку, которую вы сюда вклеили, я уже прошел. Если Вы читаете эту статью, она рассказывает только о символах Юникода, а не о символах, отличных от Юникода, в отличие от названия.
Итак, если у вас есть какие-либо объяснительные идеи о символах, отличных от Юникода, Пожалуйста, скажите мне.

R. Giskard Reventlov

1: не твой брат.
2: "Unicode-это система кодирования символов, аналогичная ASCII". Разве это не дало бы вам маленькую подсказку?

Рейтинг:
1

AnnieMacD

Эмилио выше упоминал EBCDIC (расширенный двоично - десятичный код обмена). Он был разработан IBM и (как и ASCII) имеет 256 символов, представленных от 0 до 255.

Вот вся информация, которая вам понадобится в Википедии: кодировка символов[^]

Даже Азбука Морзе упоминается, поскольку это была ранняя система кодирования! Вы занимаетесь этим проектом?


Emilio Garavaglia

ASCII имеет всего 127 символов, первые 32 действуют как "элементы управления".
каждая вещь более 127-это проприетарное расширение.

Рейтинг:
1

AnnieMacD

Вот веб-сайт, который показывает вам, а не объясняет разницу.
Инструменты Unicode[^]

Набор символов ASCII является подмножеством Unicode и представляет собой символы со значениями от 0 до 255. Unicode расширяет это понятие, включив в него множество наборов символов для различных языков, которые не используют латиницу. Она также включает в себя все виды символов. Получайте удовольствие от этого!


rashidfarooq

Но это ссылка, предоставляющая руководство для символов Юникода. Но я ничего не хочу знать о символах Юникода.
Я хочу знать только и только о символах, отличных от Юникода.

Если вы знаете, пожалуйста, скажите мне.

[no name]

Итак, о каких персонажах вы хотите знать? Будьте конкретны, и мы постараемся вам помочь. Слово "характер" имеет довольно широкое значение в английском языке, например, телевизионный персонаж (Барт Симпсон), знаки препинания-это персонажи, личность-это персонаж и т. д. Более подробную информацию, пожалуйста.

rashidfarooq

Я знаю о наборе символов ASCII, который состоит из от 0 до 255 символов. И я также знаю о наборе символов Unicode, который состоит примерно из 107000 символов. Но не могли бы вы привести мне какой-нибудь пример символа, отличного от Юникода?

Рейтинг:
0

Theo Buys

Что такое символы, отличные от Юникода? Вы можете создавать свои собственные символы и сопоставлять их с юникодом. Таким образом, все символы являются юникодом, даже те, которые вы не можете видеть. Но символы юникода могут передаваться в разных форматах, таких как UTF-8, UTF-16 и т. д. Эти форматы (UTF: Unicode Transformation Format) не всегда являются родными для таких ОС, как Windows, которые нуждаются в преобразовании в широкие символы фиксированного размера (wchar_t). Не путайте UTF-8 с многобайтовыми жалами, которые используются в старых окнах 9x и основаны на кодовых страницах символов.

Я думаю, что вы должны спросить: Что такое форматы символов, отличные от Unicode?