撒网要见鱼
撒网要见鱼
  • 发布:2016-02-02 14:15
  • 更新:2016-02-02 14:15
  • 阅读:5512

【分享】常见字符集,字符编码编码和相互之间的转换以及Base64加密

分类:HTML5+

最近在用JS时,涉及到了不同编码之间的转换.于是汇总了一些网上的资料,整合成了自己的文档.

知识点涉及:
1.字符编码基础,几种常见字符编码的基本概念
2. 不同编码之间的转换,如UTF-8转UTF-16,如UTF-16转GBK;
3. Base64加密,GBK型与UTF-8型加密等
4. 示例demo(js实现),比如如何用js将utf-16编码(js内置编码)转为UTF-8和GBK;比如如何将UTF-16编码的字符串(js内部的字符串)进行base64GBK和UTF-8编码

基础知识:(感谢@maq的提醒,这里普及下,字符集和字符编码的区别)

字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。

字符编码(Character Encoding):是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。即在符号集合与数字系统之间建立对应关系,它是信息处理的一项基本技术。通常人们用符号集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。元件不同状态的组合能代表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码

常用字符集和字符编码

常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。经常说的GB2312即是字符集也是字符编码,所以经常将字符集和字符编码混着说.
参考来源:http://www.cnblogs.com/skynet/archive/2011/05/03/2035105.html

**注:**原文是在csdn博客上的,这里就不重复了.直接给出链接.(里面包含demo)

http://blog.csdn.net/u010979495/article/details/50601511

1 关注 分享
木杉丶

要回复文章请先登录注册

maq

maq

楼主有心人,文章不错,资料汇总得挺全。

我个人的经验,字符集(charactor set)和编码方式(charactor encoding)是两个不同的概念,理解这一点对于理解中文编码相关问题会很有帮助。这两个概念经常被混为一谈,主要原因是 GB2312/GBK 既是一个字符集,也是一种编码方式。
2016-02-02 15:58