问:什么是Unicode?
答:Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论什么语言。Unicode标准已经被这些工业界的领导们所采用,例如:Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys和其它许多公司。最新的标准都需要Unicode,例如XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML等等,并且,Unicode是实现ISO/IEC 10646的正规方式。许多操作系统,所有最新的浏览器和许多其他产品都支持它。Unicode标准的出现和支持它工具的存在,是近来全球软件技术最重要的发展趋势。
问:为什么使用Unicode?
答:基本上,计算机只是处理数字。它们指定一个数字,来储存字母或其他字符。在创造Unicode之前,有数百种指定这些数字的编码系统。没有一个编码可以包含足够的字符:例如,单单欧州共同体就需要好几种不同的编码来包括所有的语言。即使是单一种语言,例如英语,也没有哪一个编码可以适用于所有的字母,标点符号,和常用的技术符号。这些编码系统也会互相冲突。也就是说,两种编码可能使用相同的数字代表两个不同的字符,或使用不同的数字代表相同的字符。任何一台特定的计算机(特别是服务器)都需要支持许多不同的编码,但是,不论什么时候数据通过不同的编码或平台之间,那些数据总会有损坏的危险。
问:举个例子吧。
答:比如,简体中文(GB)、繁体中文(BIG5)、日文中,“赵”都是一个字,但是编码不同。在不同的编码下,BIG5的赵是0xBBAF,而0xBBAF在GB里面就被显示为“化”,这就是乱码。而Unicode采用统一的编码,“赵”只有一个,不必管他在哪种文字里。
问:Unicode的优点是什么?
答:举一个最明显的例子就是Windows 2000/XP以及微软Office2000及其后的产品。因为这些软件都是Unicode内核,因此,无论何种文字,都可以在上面正常显示,而且是同屏显示。以前,简体中文的Word文件拿到英文版打开就会是乱码,简体中文的程序在Windows英文版上运行会出现乱码,而现在一切都解决了。
问:中国京剧戏考为什么使用Unicode?
答:因为有些剧本中的生僻字,只在扩展字库或繁体字库中才有,有的甚至没有。而Unicode不仅包含了所有常用字和大部分生僻字,而且因为其可扩展,在现在没有的情况下,将来也是可以扩充的。例如最新的Unicode 4.0标准,较3.0增加了很多生僻字。目前有70207个汉字。再有一点就是Unicode在将来会取代现有的GBK及BIG5。
问:我如何能够看到不是乱码的剧本?
答:如果您阅读PDF的格式,只需要有Adobe Reader即可。如果您是在网站上直接阅读剧本,有时可能会出现乱码,请查看菜单(或右键单击剧本)中,选择编码,然后点Unicode (UTF-8) 即可。注意,有些字在早期的 Unicode 定义中还没有,所以建议您阅读PDF格式的剧本。详情请见这里。
分享到:
相关推荐
关于GBK和Unicode字符集转换乱码问题
unicode 汉字字符集 汉字完整版
MFC在unicode字符集下的多字节串口调试助手,涉及到了MFC在unicode编码和多字节编码之间的转换,所用的编译器为VS2013,可以直接在VS2013中运行
Unicode标准字符集,V6.1版,是从Unicode联盟网站下载的,比一般windows常用的Unicode字符集多出很多附加字符,如埃及的象形文字 等
【Unicode字符集】Unicode字符集系列
Unicode字符集,Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,...
Java,每一个软件开发人员绝对必须掌握的关于 Unicode 和字符集的最基础的知识
unicode 字符集 与 多字节字符集转换/kekegeneral
Unicode 字符集的转换
一个浏览Unicode字符集的工具,可以加载不同的字体.研究Unicode字符集的绝好工具.
Unicode字符集 8.0,2015-06-17最新标准
标准的现代维吾尔文字符集unicode编码表
在VS2008中,默认的字符集形式是Unicode,但在VC6.0等工程中,默认的字符集形式是多字节字符集(MBCS:Multi-Byte Character Set),这样导致在VC6.0中非常简单实用的各类字符操作和函数在VS2008环境下运行时会报...
Unicode字符集.pdf
If you are an existing user, make sure you know the Top 10 Features and that you reclaimed shortcuts Visual Studio usurped over the years, including Shift+Alt+O assigned to Open Web Site....
unicode字符集下编写多字节的串口调试助手,涉及到了unicode和多字节之间的转换
UnicodeConv 3.0.0 Unicode Converter Library 3.0.0 Delphi 3/4/5/6/7 and Kylix Implementation
Unicode字符集和多字节字符集关系[借鉴].pdf
Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码Unicode编码
Unicode编码表,包括中文、英文、日文、韩文、拉丁文等多种语言。Excel格式。