🍺ASCII相关文章汇总如下🍺:
- 🎈ASCII码对照表(255个ascii字符汇总)🎈
- 🎈ASCII码对照表(Unicode 字符集列表)🎈
- 🎈ASCII码对照表(emoji表情符号)🎈
- 🎈ASCII码对照表(Python代码实现打印)🎈
- 🎈ASCII码对照表(C++17 实现ANSI、UTF8、Unicode编码互转)🎈
- 🎈ASCII码对照表(HTML颜色代码表)🎈
- 🎈ASCII码对照表(Matplotlib颜色对照表)🎈
- 🎈ASCII码对照表【2024年汇总】🎈
文章目录
- 1、简介
- 2、表格形式
- 3、图片形式
- 4、常用转义字符
- 5、ASCII、Unicode 和 UTF-8 之间的关系
- 5.1 ASCII 编码
- 5.2 非 ASCII 编码
- 5.3 Unicode
- 5.4 UTF-8
- 5.5 Little endian 和 Big endian
- 结语
1、简介
ASCII(发音:,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本延伸美国标准信息交换码则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。
ASCII 由电报码发展而来。靠前版标准发布于1963年 ,1967年经历了一次主要修订[5][6],最后一次更新则是在1986年,至今为止共定义了128个字符;其中33个字符无法显示(一些终端提供了扩展,使得这些字符可显示为诸如笑脸、扑克牌花式等8-bit符号),且这33个字符多数都已是陈废的控制字符。控制字符的用途主要是用来操控已经处理过的文字。在33个字符之外的是95个可显示的字符。用键盘敲下空白键所产生的空白字符也算1个可显示字符(显示为空白)。
- 1、ASCII码 是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646 。在这个页面,你可以找到8位的256个字符、ASCII码表和Windows-1252 (code page 1252,它是国际标准ISO 8859-1的一个扩展字符集) 标准保持一致;
- 2、ASCII码 是 American Standard Code for Information Interchange 的缩写,而不是ASCⅡ(罗马数字2),有很多人在这个地方产生误解;
- 3、ASCII码 规范于1967年靠前次发布,最后一次更新是在1986年,它包含了33个控制字符(具有某些特殊功能但是无法显示的字符)和95个可显示字符;
ASCII ,它的全称是"美国信息交换标准代码"。它设计于60年代早期,是计算机和诸如打印机、磁带驱动器之类的硬件设备的标准字符集。
ASCII 是 7 比特字符集,包含了 128 个不同的字符值。
ASCII 支持 0-9 的数字,A-Z大写和小写英文字母,以及一些特殊字符。
被广泛使用于现代计算机、HTML和因特网上的字符集都是基于 ASCII 。
ASCII英文全称:American Standard Code for Information Interchange,即:美国信息交换标准代码,是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII靠前次以规范标准的类型发表是在1967年,1986年定义了常用的128个字符。
ASCII码对照表中文发音为阿斯克码表,标准ASCII码表通常作为各种符号的16进制对照表使用,但通常讲的ASCII码其实是指ASCII码的十进制值。比如:字母a的ascii码值为97,空格的ascii码值为32。
这里汇集了最完整的ASCII码对照表,包含32个字符的ASCII控制字符对照表(即非打印字符对照表)、96个字符的ASCII打印字符对照表、128个字符的ASCII扩展字符对照表。覆盖了常用的128个字符和128个扩展字符。常用的128个字符,对应ASCII十六进制编码范围为0x00-0x7F,即十进制的0-127,包含32个非打印控制字符和96个打印字符,打印字符包括可显示字符(数字、字母、符号)和空格及删除命令。
2、表格形式
0~31 之间的ASCII码常用于控制像打印机一样的外围设备。
十进制 DEC | 八进制 OCT | 十六进制 HEX | 二进制 BIN | 符号 Symbol | HTML 实体编码 | 中文解释 Description | 英文解释 Description | |
---|---|---|---|---|---|---|---|---|
0 | 000 | 00 | 00000000 | NUL | � | 空字符 终止符 | Null char | |
1 | 001 | 01 | 00000001 | SOH |  | 标题开始 | Start of Heading | |
2 | 002 | 02 | 00000010 | STX |  | 正文开始 | Start of Text | |
3 | 003 | 03 | 00000011 | ETX |  | 正文结束 | End of Text | |
4 | 004 | 04 | 00000100 | EOT |  | 传输结束 | End of Transmission | |
5 | 005 | 05 | 00000101 | ENQ |  | 询问 | Enquiry | |
6 | 006 | 06 | 00000110 | ACK |  | 收到通知 | Acknowledgment | |
7 | 007 | 07 | 00000111 | BEL |  | 铃 | Bell | |
8 | 010 | 08 | 00001000 | BS |  | 退格 | Back Space | |
9 | 011 | 09 | 00001001 | HT | 	 | 水平制表符 | Horizontal Tab | |
10 | 012 | 0A | 00001010 | LF | 
 | 换行符 \n | Line Feed | |
11 | 013 | 0B | 00001011 | VT |  | 垂直制表符 | Vertical Tab | |
12 | 014 | 0C | 00001100 | FF |  | 换页符 | Form Feed | |
13 | 015 | 0D | 00001101 | CR | 
 | 回车符 \r | Carriage Return | |
14 | 016 | 0E | 00001110 | SO |  | 移出 | Shift Out / X-On | |
15 | 017 | 0F | 00001111 | SI |  | 移入 | Shift In / X-Off | |
16 | 020 | 10 | 00010000 | DLE |  | 数据链路转义 | Data Line Escape | |
17 | 021 | 11 | 00010001 | DC1 |  | 设备控制 1 | Device Control 1 (oft. XON) | |
18 | 022 | 12 | 00010010 | DC2 |  | 设备控制 2 | Device Control 2 | |
19 | 023 | 13 | 00010011 | DC3 |  | 设备控制 3 | Device Control 3 (oft. XOFF) | |
20 | 024 | 14 | 00010100 | DC4 |  | 设备控制 4 | Device Control 4 | |
21 | 025 | 15 | 00010101 | NAK |  | 拒绝接收 | Negative Acknowledgement | |
22 | 026 | 16 | 00010110 | SYN |  | 同步空闲 | Synchronous Idle | |
23 | 027 | 17 | 00010111 | ETB |  | 传输块结束 | End of Transmit Block | |
24 | 030 | 18 | 00011000 | CAN |  | 取消 | Cancel | |
25 | 031 | 19 | 00011001 | EM |  | 介质中断 | End of Medium | |
26 | 032 | 1A | 00011010 | SUB |  | 替换 | Substitute | |
27 | 033 | 1B | 00011011 | ESC |  | 换码符 | Escape | |
28 | 034 | 1C | 00011100 | FS |  | 文件分隔符 | File Separator | |
29 | 035 | 1D | 00011101 | GS |  | 组分隔符 | Group Separator | |
30 | 036 | 1E | 00011110 | RS |  | 记录分离符 | Record Separator | |
31 | 037 | 1F | 00011111 | US |  | 单元分隔符 | Unit Separator |
十进制 DEC | 八进制 OCT | 十六进制 HEX | 二进制 BIN | 符号 Symbol | HTML 实体编码 | 中文解释 Description | 英文解释 Description | |
---|---|---|---|---|---|---|---|---|
32 | 040 | 20 | 00100000 |   | 空格 | Space | ||
33 | 041 | 21 | 00100001 | ! | ! | 感叹号 | Exclamation mark | |
34 | 042 | 22 | 00100010 | " | " | 双引号 | Double quotes (or speech marks) | |
35 | 043 | 23 | 00100011 | # | # | 井号 | Number | |
36 | 044 | 24 | 00100100 | $ | $ | 美元符 | Dollar | |
37 | 045 | 25 | 00100101 | % | % | 百分号 | Per cent sign | |
38 | 046 | 26 | 00100110 | & | & | 与 | Ampersand | |
39 | 047 | 27 | 00100111 | ' | ' | 单引号 | Single quote | |
40 | 050 | 28 | 00101000 | ( | ( | 左括号 | Open parenthesis (or open bracket) | |
41 | 051 | 29 | 00101001 | ) | ) | 右括号 | Close parenthesis (or close bracket) | |
42 | 052 | 2A | 00101010 | * | * | 星号 | Asterisk | |
43 | 053 | 2B | 00101011 | + | + | 加号 | Plus | |
44 | 054 | 2C | 00101100 | , | , | 逗号 | Comma | |
45 | 055 | 2D | 00101101 | - | - | 连字号或减号 | Hyphen | |
46 | 056 | 2E | 00101110 | . | . | 句点或小数点 | Period, dot or full stop | |
47 | 057 | 2F | 00101111 | / | / | 斜杠 | Slash or pide | |
48 | 060 | 30 | 00110000 | 0 | 0 | 0 | Zero | |
49 | 061 | 31 | 00110001 | 1 | 1 | 1 | One | |
50 | 062 | 32 | 00110010 | 2 | 2 | 2 | Two | |
51 | 063 | 33 | 00110011 | 3 | 3 | 3 | Three | |
52 | 064 | 34 | 00110100 | 4 | 4 | 4 | Four | |
53 | 065 | 35 | 00110101 | 5 | 5 | 5 | Five | |
54 | 066 | 36 | 00110110 | 6 | 6 | 6 | Six | |
55 | 067 | 37 | 00110111 | 7 | 7 | 7 | Seven | |
56 | 070 | 38 | 00111000 | 8 | 8 | 8 | Eight | |
57 | 071 | 39 | 00111001 | 9 | 9 | 9 | Nine | |
58 | 072 | 3A | 00111010 | : | : | 冒号 | Colon | |
59 | 073 | 3B | 00111011 | ; | ; | 分号 | Semicolon | |
60 | 074 | 3C | 00111100 | < | < | 小于 | Less than (or open angled bracket) | |
61 | 075 | 3D | 00111101 | = | = | 等号 | Equals | |
62 | 076 | 3E | 00111110 | > | > | 大于 | Greater than (or close angled bracket) | |
63 | 077 | 3F | 00111111 | ? | ? | 问号 | Question mark | |
64 | 100 | 40 | 01000000 | @ | @ | 电子邮件符号 | At symbol | |
65 | 101 | 41 | 01000001 | A | A | 大写字母 A | Uppercase A | |
66 | 102 | 42 | 01000010 | B | B | 大写字母 B | Uppercase B | |
67 | 103 | 43 | 01000011 | C | C | 大写字母 C | Uppercase C | |
68 | 104 | 44 | 01000100 | D | D | 大写字母 D | Uppercase D | |
69 | 105 | 45 | 01000101 | E | E | 大写字母 E | Uppercase E | |
70 | 106 | 46 | 01000110 | F | F | 大写字母 F | Uppercase F | |
71 | 107 | 47 | 01000111 | G | G | 大写字母 G | Uppercase G | |
72 | 110 | 48 | 01001000 | H | H | 大写字母 H | Uppercase H | |
73 | 111 | 49 | 01001001 | I | I | 大写字母 I | Uppercase I | |
74 | 112 | 4A | 01001010 | J | J | 大写字母 J | Uppercase J | |
75 | 113 | 4B | 01001011 | K | K | 大写字母 K | Uppercase K | |
76 | 114 | 4C | 01001100 | L | L | 大写字母 L | Uppercase L | |
77 | 115 | 4D | 01001101 | M | M | 大写字母 M | Uppercase M | |
78 | 116 | 4E | 01001110 | N | N | 大写字母 N | Uppercase N | |
79 | 117 | 4F | 01001111 | O | O | 大写字母 O | Uppercase O | |
80 | 120 | 50 | 01010000 | P | P | 大写字母 P | Uppercase P | |
81 | 121 | 51 | 01010001 | Q | Q | 大写字母 Q | Uppercase Q | |
82 | 122 | 52 | 01010010 | R | R | 大写字母 R | Uppercase R | |
83 | 123 | 53 | 01010011 | S | S | 大写字母 S | Uppercase S | |
84 | 124 | 54 | 01010100 | T | T | 大写字母 T | Uppercase T | |
85 | 125 | 55 | 01010101 | U | U | 大写字母 U | Uppercase U | |
86 | 126 | 56 | 01010110 | V | V | 大写字母 V | Uppercase V | |
87 | 127 | 57 | 01010111 | W | W | 大写字母 W | Uppercase W | |
88 | 130 | 58 | 01011000 | X | X | 大写字母 X | Uppercase X | |
89 | 131 | 59 | 01011001 | Y | Y | 大写字母 Y | Uppercase Y | |
90 | 132 | 5A | 01011010 | Z | Z | 大写字母 Z | Uppercase Z | |
91 | 133 | 5B | 01011011 | [ | [ | 左中括号 | Opening bracket | |
92 | 134 | 5C | 01011100 | \ | \ | 反斜杠 | Backslash | |
93 | 135 | 5D | 01011101 | ] | ] | 右中括号 | Closing bracket | |
94 | 136 | 5E | 01011110 | ^ | ^ | 音调符号 | Caret - circumflex | |
95 | 137 | 5F | 01011111 | _ | _ | 下划线 | Underscore | |
96 | 140 | 60 | 01100000 | ` | ` | 重音符 | Grave accent | |
97 | 141 | 61 | 01100001 | a | a | 小写字母 a | Lowercase a | |
98 | 142 | 62 | 01100010 | b | b | 小写字母 b | Lowercase b | |
99 | 143 | 63 | 01100011 | c | c | 小写字母 c | Lowercase c | |
100 | 144 | 64 | 01100100 | d | d | 小写字母 d | Lowercase d | |
101 | 145 | 65 | 01100101 | e | e | 小写字母 e | Lowercase e | |
102 | 146 | 66 | 01100110 | f | f | 小写字母 f | Lowercase f | |
103 | 147 | 67 | 01100111 | g | g | 小写字母 g | Lowercase g | |
104 | 150 | 68 | 01101000 | h | h | 小写字母 h | Lowercase h | |
105 | 151 | 69 | 01101001 | i | i | 小写字母 i | Lowercase i | |
106 | 152 | 6A | 01101010 | j | j | 小写字母 j | Lowercase j | |
107 | 153 | 6B | 01101011 | k | k | 小写字母 k | Lowercase k | |
108 | 154 | 6C | 01101100 | l | l | 小写字母 l | Lowercase l | |
109 | 155 | 6D | 01101101 | m | m | 小写字母 m | Lowercase m | |
110 | 156 | 6E | 01101110 | n | n | 小写字母 n | Lowercase n | |
111 | 157 | 6F | 01101111 | o | o | 小写字母 o | Lowercase o | |
112 | 160 | 70 | 01110000 | p | p | 小写字母 p | Lowercase p | |
113 | 161 | 71 | 01110001 | q | q | 小写字母 q | Lowercase q | |
114 | 162 | 72 | 01110010 | r | r | 小写字母 r | Lowercase r | |
115 | 163 | 73 | 01110011 | s | s | 小写字母 s | Lowercase s | |
116 | 164 | 74 | 01110100 | t | t | 小写字母 t | Lowercase t | |
117 | 165 | 75 | 01110101 | u | u | 小写字母 u | Lowercase u | |
118 | 166 | 76 | 01110110 | v | v | 小写字母 v | Lowercase v | |
119 | 167 | 77 | 01110111 | w | w | 小写字母 w | Lowercase w | |
120 | 170 | 78 | 01111000 | x | x | 小写字母 x | Lowercase x | |
121 | 171 | 79 | 01111001 | y | y | 小写字母 y | Lowercase y | |
122 | 172 | 7A | 01111010 | z | z | 小写字母 z | Lowercase z | |
123 | 173 | 7B | 01111011 | { | { | 左大括号 | Opening brace | |
124 | 174 | 7C | 01111100 | | | | | 垂直线 | Vertical bar | |
125 | 175 | 7D | 01111101 | } | } | 右大括号 | Closing brace | |
126 | 176 | 7E | 01111110 | ~ | ~ | 波浪号 | Equivalency sign - tilde | |
127 | 177 | 7F | 01111111 |  | 删除 | delete |
十进制 DEC | 八进制 OCT | 十六进制 HEX | 二进制 BIN | 符号 Symbol | HTML 实体编码 | 中文解释 Description | 英文解释 Description | |
---|---|---|---|---|---|---|---|---|
128 | 200 | 80 | 10000000 | € | € | 欧盟符号 | Euro sign | |
129 | 201 | 81 | 10000001 | |||||
130 | 202 | 82 | 10000010 | ‚ | ‚ | 单低 9 引号 | Single low-9 quotation mark | |
131 | 203 | 83 | 10000011 | ƒ | ƒ | 带钩的 拉丁小写字母f | Latin small letter f with hook | |
132 | 204 | 84 | 10000100 | „ | „ | 双低 9 引号 | Double low-9 quotation mark | |
133 | 205 | 85 | 10000101 | … | … | 水平省略号 | Horizontal ellipsis | |
134 | 206 | 86 | 10000110 | † | † | 剑号 | Dagger | |
135 | 207 | 87 | 10000111 | ‡ | ‡ | 双剑号 | Double dagger | |
136 | 210 | 88 | 10001000 | ˆ | ˆ | 修正字符 抑扬音符号 | Modifier letter circumflex accent | |
137 | 211 | 89 | 10001001 | ‰ | ‰ | 千分号 | Per mille sign | |
138 | 212 | 8A | 10001010 | Š | Š | 带弯音号的 拉丁大写字母 S | Latin capital letter S with caron | |
139 | 213 | 8B | 10001011 | ‹ | ‹ | 左单书名号 | Single left-pointing angle quotation | |
140 | 214 | 8C | 10001100 | Œ | Œ | 拉丁大写组合 OE | Latin capital ligature OE | |
141 | 215 | 8D | 10001101 | |||||
142 | 216 | 8E | 10001110 | Ž | Ž | 带弯音号的 拉丁大写字母 z | Latin capital letter Z with caron | |
143 | 217 | 8F | 10001111 | |||||
144 | 220 | 90 | 10010000 | |||||
145 | 221 | 91 | 10010001 | ‘ | ‘ | 左单引号 | Left single quotation mark | |
146 | 222 | 92 | 10010010 | ’ | ’ | 右单引号 | Right single quotation mark | |
147 | 223 | 93 | 10010011 | “ | “ | 左双引号 | Left double quotation mark | |
148 | 224 | 94 | 10010100 | ” | ” | 右双引号 | Right double quotation mark | |
149 | 225 | 95 | 10010101 | • | • | Bullet | ||
150 | 226 | 96 | 10010110 | – | – | 半长破折号 | En dash | |
151 | 227 | 97 | 10010111 | — | — | 全长破折号 | Em dash | |
152 | 230 | 98 | 10011000 | ˜ | ˜ | 小波浪线 | Small tilde | |
153 | 231 | 99 | 10011001 | ™ | ™ | Trade mark sign | ||
154 | 232 | 9A | 10011010 | š | š | 带弯音号的 拉丁小写字母 s | Latin small letter s with caron | |
155 | 233 | 9B | 10011011 | › | › | 右单书名号 | Single right-pointing angle quotation mark | |
156 | 234 | 9C | 10011100 | œ | œ | 拉丁小写组合 oe | Latin small ligature oe | |
157 | 235 | 9D | 10011101 | |||||
158 | 236 | 9E | 10011110 | ž | ž | 带弯音号的 拉丁小写字母 z | Latin small letter z with caron | |
159 | 237 | 9F | 10011111 | Ÿ | Ÿ | 带弯音号的 拉丁大写字母 Y | Latin capital letter Y with diaeresis | |
160 | 240 | A0 | 10100000 |   | Non-breaking space | |||
161 | 241 | A1 | 10100001 | ¡ | ¡ | 反向感叹号 | Inverted exclamation mark | |
162 | 242 | A2 | 10100010 | ¢ | ¢ | 分币符号 | Cent sign | |
163 | 243 | A3 | 10100011 | £ | £ | 英磅符号 | Pound sign | |
164 | 244 | A4 | 10100100 | ¤ | ¤ | Currency sign | ||
165 | 245 | A5 | 10100101 | ¥ | ¥ | 人民币符号 | Yen sign | |
166 | 246 | A6 | 10100110 | ¦ | ¦ | Pipe, Broken vertical bar | ||
167 | 247 | A7 | 10100111 | § | § | 章节符号 | Section sign | |
168 | 250 | A8 | 10101000 | ¨ | ¨ | 通用货币符号 | Spacing diaeresis - umlaut | |
169 | 251 | A9 | 10101001 | © | © | 版权符号 | Copyright sign | |
170 | 252 | AA | 10101010 | ª | ª | 阴性顺序 指示符号 | Feminine ordinal indicator | |
171 | 253 | AB | 10101011 | « | « | 左角引号 | Left double angle quotes | |
172 | 254 | AC | 10101100 | ¬ | ¬ | Not sign | ||
173 | 255 | AD | 10101101 | | ­ | Soft hyphen | ||
174 | 256 | AE | 10101110 | ® | ® | Registered trade mark sign | ||
175 | 257 | AF | 10101111 | ¯ | ¯ | Spacing macron - overline | ||
176 | 260 | B0 | 10110000 | ° | ° | 温度符号 | Degree sign | |
177 | 261 | B1 | 10110001 | ± | ± | 加/减号 | Plus-or-minus sign | |
178 | 262 | B2 | 10110010 | ² | ² | 上标 2 | Superscript two - squared | |
179 | 263 | B3 | 10110011 | ³ | ³ | 上标 3 | Superscript three - cubed | |
180 | 264 | B4 | 10110100 | ´ | ´ | Acute accent - spacing acute | ||
181 | 265 | B5 | 10110101 | µ | µ | 微符号 | Micro sign | |
182 | 266 | B6 | 10110110 | ¶ | ¶ | 段落符号, pilcrow | Pilcrow sign - paragraph sign | |
183 | 267 | B7 | 10110111 | · | · | 中点 | Middle dot - Georgian comma | |
184 | 270 | B8 | 10111000 | ¸ | ¸ | Spacing cedilla | ||
185 | 271 | B9 | 10111001 | ¹ | ¹ | 上标 1 | Superscript one | |
186 | 272 | BA | 10111010 | º | º | 阳性顺序 指示符 | Masculine ordinal indicator | |
187 | 273 | BB | 10111011 | » | » | 右角引号 | Right double angle quotes | |
188 | 274 | BC | 10111100 | ¼ | ¼ | 分数四分之一 | Fraction one quarter | |
189 | 275 | BD | 10111101 | ½ | ½ | 分数二分之一 | Fraction one half | |
190 | 276 | BE | 10111110 | ¾ | ¾ | Fraction three quarters | ||
191 | 277 | BF | 10111111 | ¿ | ¿ | 反向问号 | Inverted question mark | |
192 | 300 | C0 | 11000000 | À | À | 带重音符 的大写字母 A | Latin capital letter A with grave | |
193 | 301 | C1 | 11000001 | Á | Á | 带尖锐重音 的大写字母 A | Latin capital letter A with acute | |
194 | 302 | C2 | 11000010 | Â | Â | 带音调符号 的大写字母 A | Latin capital letter A with circumflex | |
195 | 303 | C3 | 11000011 | Ã | Ã | 带代字号 的大写字母 A | Latin capital letter A with tilde | |
196 | 304 | C4 | 11000100 | Ä | Ä | 带元音变音 (分音符号) 的大写字母 A | Latin capital letter A with diaeresis | |
197 | 305 | C5 | 11000101 | Å | Å | 带铃声 的大写字母 A | Latin capital letter A with ring above | |
198 | 306 | C6 | 11000110 | Æ | Æ | 大写字母 AE 双重元音 | Latin capital letter AE | |
199 | 307 | C7 | 11000111 | Ç | Ç | 带变音符号 的大写字母 C | Latin capital letter C with cedilla | |
200 | 310 | C8 | 11001000 | È | È | 带重音符 的大写字母 E | Latin capital letter E with grave | |
201 | 311 | C9 | 11001001 | É | É | 带尖锐重音 的大写字母 E | Latin capital letter E with acute | |
202 | 312 | CA | 11001010 | Ê | Ê | 带音调符号 的大写字母 E | Latin capital letter E with circumflex | |
203 | 313 | CB | 11001011 | Ë | Ë | 带元音变音 (分音符号) 的大写字母 E | Latin capital letter E with diaeresis | |
204 | 314 | CC | 11001100 | Ì | Ì | 带重音符 的大写字母 I | Latin capital letter I with grave | |
205 | 315 | CD | 11001101 | Í | Í | 带尖锐重音 的大写字母 I | Latin capital letter I with acute | |
206 | 316 | CE | 11001110 | Î | Î | 带音调符号 的大写字母 I | Latin capital letter I with circumflex | |
207 | 317 | CF | 11001111 | Ï | Ï | 带元音变音 (分音符号) 的大写字母 I | Latin capital letter I with diaeresis | |
208 | 320 | D0 | 11010000 | Ð | Ð | Latin capital letter ETH | ||
209 | 321 | D1 | 11010001 | Ñ | Ñ | 带代字号 的大写字母 N | Latin capital letter N with tilde | |
210 | 322 | D2 | 11010010 | Ò | Ò | 带重音符 的大写字母 O | Latin capital letter O with grave | |
211 | 323 | D3 | 11010011 | Ó | Ó | 带尖锐重音 的大写字母 O | Latin capital letter O with acute | |
212 | 324 | D4 | 11010100 | Ô | Ô | 带音调符号 的大写字母 O | Latin capital letter O with circumflex | |
213 | 325 | D5 | 11010101 | Õ | Õ | 带代字号 的大写字母 O | Latin capital letter O with tilde | |
214 | 326 | D6 | 11010110 | Ö | Ö | 带元音变音 (分音符号) 的大写字母 O | Latin capital letter O with diaeresis | |
215 | 327 | D7 | 11010111 | × | × | 大写字母 OE 连字 | Multiplication sign | |
216 | 330 | D8 | 11011000 | Ø | Ø | 带斜杠 的大写字母 O | Latin capital letter O with slash | |
217 | 331 | D9 | 11011001 | Ù | Ù | 带重音符 的大写字母 U | Latin capital letter U with grave | |
218 | 332 | DA | 11011010 | Ú | Ú | 带尖锐重音 的大写字母 U | Latin capital letter U with acute | |
219 | 333 | DB | 11011011 | Û | Û | 带音调符号 的大写字母 U | Latin capital letter U with circumflex | |
220 | 334 | DC | 11011100 | Ü | Ü | 带元音变音 (分音符号) 的大写字母 U | Latin capital letter U with diaeresis | |
221 | 335 | DD | 11011101 | Ý | Ý | 带元音变音 (分音符号) 的大写字母 Y | Latin capital letter Y with acute | |
222 | 336 | DE | 11011110 | Þ | Þ | Latin capital letter THORN | ||
223 | 337 | DF | 11011111 | ß | ß | 德语高调 小写字母 s | Latin small letter sharp s - ess-zed | |
224 | 340 | E0 | 11100000 | à | à | 带重音符 的小写字母 a | Latin small letter a with grave | |
225 | 341 | E1 | 11100001 | á | á | 带尖锐重音 的小写字母 a | Latin small letter a with acute | |
226 | 342 | E2 | 11100010 | â | â | 带音调符号 的小写字母 a | Latin small letter a with circumflex | |
227 | 343 | E3 | 11100011 | ã | ã | 带代字号 的小写字母 a | Latin small letter a with tilde | |
228 | 344 | E4 | 11100100 | ä | ä | 带元音变音 (分音符号) 的小写字母 a | Latin small letter a with diaeresis | |
229 | 345 | E5 | 11100101 | å | å | 带铃声的 小写字母 a | Latin small letter a with ring above | |
230 | 346 | E6 | 11100110 | æ | æ | 小写字母 ae 双重元音 | Latin small letter ae | |
231 | 347 | E7 | 11100111 | ç | ç | 带变音符号 的小写字母 c | Latin small letter c with cedilla | |
232 | 350 | E8 | 11101000 | è | è | 带重音符 的小写字母 e | Latin small letter e with grave | |
233 | 351 | E9 | 11101001 | é | é | 带尖锐重音 的小写字母 e | Latin small letter e with acute | |
234 | 352 | EA | 11101010 | ê | ê | 带音调符号 的小写字母 e | Latin small letter e with circumflex | |
235 | 353 | EB | 11101011 | ë | ë | 带元音变音 (分音符号) 的小写字母 e | Latin small letter e with diaeresis | |
236 | 354 | EC | 11101100 | ì | ì | 带重音符 的小写字母 i | Latin small letter i with grave | |
237 | 355 | ED | 11101101 | í | í | 带尖锐重音 的小写字母 i | Latin small letter i with acute | |
238 | 356 | EE | 11101110 | î | î | 带音调符号 的小写字母 i | Latin small letter i with circumflex | |
239 | 357 | EF | 11101111 | ï | ï | 带元音变音 (分音符号) 的小写字母 i | Latin small letter i with diaeresis | |
240 | 360 | F0 | 11110000 | ð | ð | Latin small letter eth | ||
241 | 361 | F1 | 11110001 | ñ | ñ | 带代字号 的小写字母 n | Latin small letter n with tilde | |
242 | 362 | F2 | 11110010 | ò | ò | 带重音符 的小写字母 o | Latin small letter o with grave | |
243 | 363 | F3 | 11110011 | ó | ó | 带尖锐重音 的小写字母 o | Latin small letter o with acute | |
244 | 364 | F4 | 11110100 | ô | ô | 带音调符号 的小写字母 o | Latin small letter o with circumflex | |
245 | 365 | F5 | 11110101 | õ | õ | 带代字号 的小写字母 o | Latin small letter o with tilde | |
246 | 366 | F6 | 11110110 | ö | ö | 带元音变音 (分音符号) 的小写字母 o | Latin small letter o with diaeresis | |
247 | 367 | F7 | 11110111 | ÷ | ÷ | 小写字母 oe 连字 | Division sign | |
248 | 370 | F8 | 11111000 | ø | ø | 带斜杠 的小写字母 o | Latin small letter o with slash | |
249 | 371 | F9 | 11111001 | ù | ù | 带重音符 的小写字母 u | Latin small letter u with grave | |
250 | 372 | FA | 11111010 | ú | ú | 带尖锐重音 的小写字母 u | Latin small letter u with acute | |
251 | 373 | FB | 11111011 | û | û | 带音调符号 的小写字母 u | Latin small letter u with circumflex | |
252 | 374 | FC | 11111100 | ü | ü | 带元音变音 (分音符号) 的小写字母 u | Latin small letter u with diaeresis | |
253 | 375 | FD | 11111101 | ý | ý | 带元音变音 (分音符号) 的小写字母 y2 | Latin small letter y with acute | |
254 | 376 | FE | 11111110 | þ | þ | Latin small letter thorn | ||
255 | 377 | FF | 11111111 | ÿ | ÿ | Latin small letter y with diaeresis |
3、图片形式
- 可显示字符
可显示字符编号范围是32-126(0x20-0x7E),共95个字符。 - 控制字符
ASCII控制字符的编号范围是0-31和127(0x00-0x1F和0x7F),共33个字符。 - 靠前部分:ASCII非打印控制字符表
ASCII表上的数字0–31分配给了控制字符,用于控制像打印机等一些外围设备。 - 第二部分:ASCII打印字符
数字 32–126 分配给了能在键盘上找到的字符,当您查看或打印文档时就会出现。 - 第三部分:扩展ASCII打印字符
扩展的ASCII字符满足了对更多字符的需求。
扩展的ASCII包含ASCII中已有的128个字符,又增加了128个字符,总共是256个。
即使有了这些更多的字符,许多语言还是包含无法压缩到256个字符中的符号。因此,出现了一些ASCII的变体来囊括地区性字符和符号。例如,许多软件程序把ASCII表(又称作ISO8859-1)用于北美、西欧、澳大利亚和非洲的语言。
ASCII码又分为: 标准ASCII码和扩展ASCII码。
标准ASCII码
标准ASCII 码也叫基础ASCII码,使用7 位二进制数来表示所有的大写和小写字母,数字0 到9、标点符号, 以及在美式英语中使用的特殊控制字符。其中0~31及127(共33个)是控制字符或通信专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(响铃)等;通信专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为8、9、10 和13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
32~126(共95个)是字符(32是空格),其中48~57为0到9十个***数字。
65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。
扩展ASCII码
- 扩展ASCII 字符是从128 到255(0x80-0xff)的字符。许多基于x86的系统都支持使用扩展(或“高”)ASCII。它将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。针对扩展的ASCII码,不同的国家有不同的字符集,所以它并不是国际标准。
- 扩展ASCII 字符是从128 到255(0x80-0xff)的字符。许多基于x86的系统都支持使用扩展(或“高”)ASCII。它将每个字符的第8 位用于确定附加的128 个特殊符号字符、外来语字母和图形符号。针对扩展的ASCII码,不同的国家有不同的字符集,所以它并不是国际标准。
4、常用转义字符
转义字符 | 意义 | ASCII码值(十进制) |
---|---|---|
\a | 响铃(BEL) | 7 |
\b | 退格(BS) | 8 |
\f | 换页(FF) | 12 |
\n | 换行(LF) | 10 |
\r | 回车(CR) | 13 |
\t | 水平制表(HT) | 9 |
\v | 垂直制表(VT) | 11 |
\\ | 反斜杠 | 92 |
\? | 问号字符 | 63 |
\' | 单引号字符 | 39 |
\" | 双引号字符 | 34 |
\0 | 空字符(NULL) | 0 |
\ddd | 任意字符 | 三位八进制 |
\xhh | 任意字符 | 二位十六进制 |
5、ASCII、Unicode 和 UTF-8 之间的关系
5.1 ASCII 编码
计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从00000000到11111111。
上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为 ASCII 码,一直沿用至今。
ASCII 码一共规定了128个字符的编码,比如空格SPACE是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的一位统一规定为0。
5.2 非 ASCII 编码
英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的。比如,在法语中,字母上方有注音符号,它就无法用 ASCII 码表示。于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号。比如,法语中的é的编码为130(二进制10000010)。这样一来,这些欧洲国家使用的编码体系,可以表示最多256个符号。
5.3 Unicode
可以想象,如果有一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个具特色的的编码,那么乱码问题就会消失。这就是 Unicode,就像它的名字都表示的,这是一种所有符号的编码。
Unicode 当然是一个很大的***,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示***字母Ain,U+0041表示英语的大写字母A,U+4E25表示汉字严。具体的符号对应表,可以查询unicode.org,或者专门的汉字对应表。
需要注意的是,Unicode 只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。
比如,汉字严的 Unicode 是十六进制数4E25,转换成二进制数足足有15位(100111000100101),也就是说,这个符号的表示至少需要2个字节。表示其他更大的符号,可能需要3个字节或者4个字节,甚至更多。
它们造成的结果是:1)出现了 Unicode 的多种存储方式,也就是说有许多种不同的二进制格式,可以用来表示 Unicode。2)Unicode 在很长一段时间内无法推广,直到互联网的出现。
5.4 UTF-8
互联网的普及,强烈要求出现一种统一的编码方式。UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。其他实现方式还包括 UTF-16(字符用两个字节或四个字节表示)和 UTF-32(字符用四个字节表示),不过在互联网上基本不用。重复一遍,这里的关系是,UTF-8 是 Unicode 的实现方式之一。
UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。
UTF-8 的编码规则很简单,只有二条:
1)对于单字节的符号,字节的靠前位设为0,后面7位为这个符号的 Unicode 码。因此对于英语字母,UTF-8 编码和 ASCII 码是相同的。 2)对于n字节的符号(n > 1),靠前个字节的前n位都设为1,第n + 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码。
下表总结了编码规则,字母x表示可用编码的位:
Unicode符号范围(十六进制) | UTF-8编码方式(二进制) |
---|---|
0000 0000-0000 007F | 0xxxxxxx |
0000 0080-0000 07FF | 110xxxxx 10xxxxxx |
0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx |
0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx |
1)ANSI是默认的编码方式。对于英文文件是ASCII编码,对于简体中文文件是GB2312编码(只针对 Windows 简体中文版,如果是繁体中文版会采用 Big5 码)。 2)Unicode编码这里指的是notepad.exe使用的 UCS-2 编码方式,即直接用两个字节存入字符的 Unicode 码,这个选项用的 little endian 格式。 3)Unicode big endian编码与上一个选项相对应。我在下一节会解释 little endian 和 big endian 的涵义。 4)UTF-8编码,也就是上一节谈到的编码方法。
5.5 Little endian 和 Big endian
UCS-2 格式可以存储 Unicode 码(码点不超过0xFFFF)。以汉字严为例,Unicode 码是4E25,需要用两个字节存储,一个字节是4E,另一个字节是25。存储的时候,4E在前,25在后,这就是 Big endian 方式;25在前,4E在后,这是 Little endian 方式。
靠前个字节在前,就是"大头方式"(Big endian),第二个字节在前就是"小头方式"(Little endian)。
那么很自然的,就会出现一个问题:计算机怎么知道某一个文件到底采用哪一种方式编码?
Unicode 规范定义,每一个文件的最前面分别加入一个表示编码顺序的字符,这个字符的名字叫做"零宽度非换行空格"(zero width no-break space),用FEFF表示。这正好是两个字节,而且FF比FE大1。
如果一个文本文件的头两个字节是FE FF,就表示该文件采用大头方式;如果头两个字节是FF FE,就表示该文件采用小头方式。
结语
如果您觉得该方法或代码有一点点用处,可以给作者点个赞,或打赏杯咖啡;
╮( ̄▽ ̄)╭如果您感觉方法或代码不咋地//(ㄒoㄒ)//,就在评论处留言,作者继续改进;
o_O???如果您需要相关功能的代码定制化开发,可以留言私信作者;
(✿◡‿◡)感谢各位大佬童鞋们的支持!
( ´ ▽´ )ノ ( ´ ▽´)っ!!!
TAG:e000011