java和Unicode
程序设计如何支持除了拉丁文字符集外的任何语言,己成为一个大问题。许多国家语言定义的是8位字符集,但是如果你要在一个文件中同时使用拉丁文字符集和西里尔字符集(Cyrillic)就会产生问题。如果你要处理日文,用8位字符集表示将是不可能的。Unicode是一个标准字符集,它是为满足所有语言的字符需要而制定的。它用16位编码表示一个字符,即一个字符占两个字节,从而可以表达多达65535个不同的字符。这样就叮对许多字符进行编码,也就有足够的空间设置每个国家的字符集编码。其中可以包含日文使用的需要数千个字符编码的Kanji字符集。
我们将在第2章中看到,Java源代码使用的也是Unicode字符集。严格地说,只有注释、标识符、字符和文本串可以使用Unicode前128个之外的字符。Java内部也支持Unicode来表示字符和串,所以它潜在地具有理解国际性语言的能力。你熟悉的ASCII码与Unicade前l28个字符是一一对应的,所不同的是每个字符占用两个字节,你不必在意所要处理的字符编码,当然除非你从一开始就要建立一种支持多语言的应用程序。
考无忧小编推荐:
更多计算机等级考试真题及答案>>>点击查看
想知道更多关于计算机等级报考指南、考试时间和考试信息的最新资讯在这里>>>点击查看
本文网址:http://www.k51.com.cn/info/jsjdjks/1802/0226785.html