- 博客(7)
- 资源 (2)
- 收藏
- 关注
转载 Ansi,UTF8,Unicode,ASCII编码
转自http://calmzeal.cnblogs.com/archive/2006/03/02/341332.aspx 原作者:calmzeal最近在看c# String Handling and Regular Expressions handBook,打算把正则表达式好好学一下,顺便复习一下字符串.关于上述编码,一直迷迷糊糊,查了些资料,总算大致了解了1. ASCII和Ansi编
2007-06-14 10:06:00 523
转载 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
Unicode: unicode.org制定的编码机制, 要将全世界常用文字都函括进去.在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.UCS: ISO制定的ISO10646标准所定义的 Universal Charac
2007-06-14 10:02:00 632
转载 UTF-8 and Unicode FAQ
UTF-8 and Unicode FAQby Markus Kuhn 中国LINUX论坛翻译小组 xLoneStar[译] 2000年2月这篇文章说明了在 POSIX 系统 (Linux,Unix) 上使用 Unicode/UTF-8 所需要的信息. 在将来不远的几年里, Unicode 已经很接近于取代 ASCII 与 Latin-1 编码的位置了. 它不仅允许你处理处理事实上存在
2007-06-14 09:58:00 556
转载 有关汉字字符标准的说明
有关汉字字符标准的说明 GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码gbk编码是对gb2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有gb2312编码,在此基础上进行编码
2007-06-14 09:25:00 625
转载 字符,字节和编码
字符,字节和编码[转载:http://www.regexlab.com/zh/encoding.htm]级别:初级摘要:本文将完整,通俗地介绍字符编码,软件国际化等相关概念,也就是编码问题,内容涵盖常说的“中文问题”,“乱码问题”。本文针对亚洲的读者,讲解了产生乱码问题的原理以及解决办法。同时也针对西方的读者,讲解了字符编码的概念,为西方国家的朋友开发国际化软件打一个必要的基础。
2007-06-14 09:22:00 665
转载 关于编码、unicode、utf-8的讨论
作者: straw 整理日期:2004年6月15日我先来贴几段吧==========不知道你有没有这样的感受:为什么PHP很少有乱码问题而用Java做WEB应用却这么麻烦呢?为什么在Google上能用简体中文查到繁体中文,甚至日文的结果?而且用Google的时候发现它居然能自动根据我使用浏览器的语言选择自动调出中文界面? 很多国际化应用的让我理解了这么一个道理:Unicode是为更方便
2007-06-14 09:20:00 933
原创 应该搞清楚的几个问题.
1,编码.a.何谓编码?b.win系统底层采用何种编码?是如何处理各种类型的外部编码的?c.了解linux编码. 资料1:原文地址:http://blog.csdn.net/cxzhq2002/archive/2006/06/08/779927.aspxfunction StorePage(){d=document;t=d.selection?(d.selection.
2007-06-14 08:34:00 723
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人