您所在的位置: 首页 > 读书频道 > 设计开发 > 其它开发 >

1.5 字符集

http://book.51cto.com  2007-08-31 13:41  Peter Prinz, Tony Crawford  机械工业出版社华章公司  我要评论(0)

字符集
编译器转换源代码文件时,编译器所处的环境称为翻译环境(translation environment);编译器执行时,所处的环境称为运行环境(execution environment)。对C 语言来说,翻译环境和运行环境是不同的。因此,C 定义了两个字符集(character set):源代码字符集(source character set)是用于组成C 源代码的字符集合,而运行字符集(execution
character set)是可以被执行程序解释的字符集合。在许多C 的实现版本中,这两个字符集是一样的。如果不一样,那么编译器把源代码中的字符和字符串字面值转换成运行字符集中的对应元素。
这两种字符集都包含基本字符集(basic character set)和扩展字符(extended character)。
C 语言没有指定扩展字符,这通常由所在区域语言所决定的。扩展字符连同基本字符集,就形成了扩展字符集(extended character set)。
基本源代码字符集和基本运行字符集都包含了下面的字符类型:
拉丁字母

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z

十进制阿拉伯数字

0 1 2 3 4 5 6 7 8 9

下面 29 个符号
! " # % & ' () * + , - . / : ; < = > ? [ \ ] ^ _ { | } ~

五种空格符
空格、水平制表符(tab)、垂直制表符、换行、换页(form feed)。
基本的运行字符集还包括四个不可打印的字符:作为字符串结束符的空(null)字符、警
报(alert)、退格(backspace)以及CR(carriage return,回车)。为了在字母和字符串
中表示这些字符,输入对应的转义符(escape sequence)即可,这些转义符都是以反斜
线(backslash)开始的:“\0”表示空字符,“\a”表示警报,“\b”退格,而“\r”表
示CR(回车)。请参见第3 章中更详细的描述。
不同厂商的C 实现版本可能使用不同的字符码(字符的实际数值),C 语言本身规定如下
规则:
● 基本字符集中的每个字符必须用一个字节(byte)表示。
● 空字符是一个字节,其所有的位都是0。
● 0 之后的每个十进制数字,编码都要依次比前者大1。

【责任编辑:雪花 TEL:(010)68476606-8007】

回书目   上一节   下一节
Prototype and script.aculo.us终极揭秘
Red Hat Linux 9系统配置与服务器管理
ARM嵌入式Linux系统开发技术详解
Ubuntu标准教程
嵌入式Linux设备驱动开发详解
 
 验证码: (点击刷新验证码)   匿名发表
  • Linux C编程实战

  • 作者:童永清
  • 本书系统地介绍了在Linux平台下用C语言进行程序开发的过程,集趣味性、实战性于一体的160多段代码实例,帮助读者快速掌握在Linu..
Copyright©2005-2008 51CTO.COM 版权所有