Представление кириллицы в UTF-8 - русские символы - таблица

Представление кириллицы в UTF-8

Стандарт VRML97 предусматривает возможность формирования текста с помощью node Text на любом языке. Для этого текст в UTF-8 представляется в стандарте UNICODE.

Это значит, что символы ASCII-7 (код до 128) представляются "как есть" по принципу 1 байт 1 символ. Символы старшей части кодовой таблицы (код > 128), где располагаются символы кириллицы, представляются 16-битными (двухбайтными) кодами:

110XXXXX 10XXXXXX

-- где X обозначены двоичные разряды для размещения кода символа в соответствии с таблицей UNICODE.


Символ	UNICODE	HEX-16	DEC 8 x 2	CP-1251
А	    0410	D090	208 144	192
Б	    0411	D091	208 145	193
В	    0412	D092	208 146	194
Г	    0413	D093	208 147	195
Д	    0414	D094	208 148	196
Е	    0415	D095	208 149	197
Ж	    0416	D096	208 150	198
З	    0417	D097	208 151	199
И	    0418	D098	208 152	200
Й	    0419	D099	208 153	201
К	    041A	D09A	208 154	202
Л	    041B	D09B	208 155	203
М	    041C	D09C	208 156	204
Н	    041D	D09D	208 157	205
О	    041E	D09E	208 158	206
П	    041F	D09F	208 159	207
Р	    0420	D0A0	208 160	208
С	    0421	D0A1	208 161	209
Т	    0422	D0A2	208 162	210
У	    0423	D0A3	208 163	211
Ф	    0424	D0A4	208 164	212
Х	    0425	D0A5	208 165	213
Ц	    0426	D0A6	208 166	214
Ч	    0427	D0A7	208 167	215
Ш	    0428	D0A8	208 168	216
Щ	    0429	D0A9	208 169	217
а	    042A	D0AA	208 170	218
Ы	    042B	D0AB	208 171	219
Ь	    042C	D0AC	208 172	220
Э	    042D	D0AD	208 173	221
Ю	    042E	D0AE	208 174	222
Я	    042F	D0AF	208 175	223
а	    0430	D0B0	208 176	224
б	    0431	D0B1	208 177	225
в	    0432	D0B2	208 178	226
г	    0433	D0B3	208 179	227
д	    0434	D0B4	208 180	228
е	    0435	D0B5	208 181	229
ж	    0436	D0B6	208 182	230
з	    0437	D0B7	208 183	231
и	    0438	D0B8	208 184	232
й	    0439	D0B9	208 185	233
к	    043A	D0BA	208 186	234
л	    043B	D0BB	208 187	235
м	    043C	D0BC	208 188	236
н	    043D	D0BD	208 189	237
о	    043E	D0BE	208 190	238
п	    043F	D0BF	208 191	239
р	    0440	D180	209 128	240
с	    0441	D181	209 129	241
т	    0442	D182	209 130	242
у	    0443	D183	209 131	243
ф	    0444	D184	209 132	244
х	    0445	D185	209 133	245
ц	    0446	D186	209 134	246
ч	    0447	D187	209 135	247
ш	    0448	D188	209 136	248
щ	    0449	D189	209 137	249
ъ	    044A	D18A	209 138	250
ы	    044B	D18B	209 139	251
ь	    044C	D18C	209 140	252
э	    044D	D18D	209 141	253
ю	    044E	D18E	209 142	254
я	    044F	D18F	209 143	255

//Символы вне общего правила:
Ё	0401	D001	208 001	168
ё	0451	D191	209 145	184
  • В первой колонке таблицы содержатся символы кириллицы (русские буквы).
  • Во второй колонке их код по таблице UNICODE (стандартное двухбайтное представление).
  • В третьей колонке приводятся HEX-коды 2-х байт, представляющих данный символ в тексте VRML97.
  • В 4-й колонке те же 2 байта в десятичной кодировке (вводятся через ALT и цифровую клавиатуру).
  • В 5 колонке для справок представлены коды символов согласно кодировке Windows-1251.

Таким образом, чтобы получить в тексте символ "ю" (1251-код 254) надо ввести туда два байта: в первом десятичный код 209, во втором десятичный код 142.

Key Words for FKN + antitotal forum (CS VSU):