Lib-code

嵌入式-编码转换

快速入门

下载

git clone https://github.com/ChenxuanZhao/lib-code.git

目录说明

├─Core       // 源码
│  ├─Inc     // 头文件
│  ├─Lib     // LIB 库
│  └─Src     // 源代码
├─Demo       // 例程
└─Lib-creat  // Lib 库创建

Keil 工程设置

Encoding: Encode in UTF-8 without signature

参考资料

UTF-8

简介

UTF-8 (8位元，Universal Character Set/Unicode Transformation Format) 是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符，而且其编码中的第一个字节仍与ASCII相容，使得原来处理ASCII字符的软件无须或只进行少部份修改后，便可继续使用。因此，它逐渐成为电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码

字符集

UTF-8编码规则：如果只有一个字节则其最高二进制位为0；如果是多字节，其第一个字节从最高位开始，连续的二进制位值为1的个数决定了其编码的字节数，其余各字节均以10开头。UTF-8转换表表示如下：

Unicode编码 (hex)	UTF-8 字节流 (bin))
000000 - 00007F	0xxxxxxx
000080 - 0007FF	110xxxxx 10xxxxxx
000800 - 00FFFF	1110xxxx 10xxxxxx 10xxxxxx
010000 - 10FFFF	11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
更多资料

UCS2

Unicode（统一码、万国码、单一码）是计算机科学领域里的一项业界标准，包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发，1994年正式公布。

通用字符集（Universal Character Set, UCS）是由ISO制定的ISO 10646（或称ISO/IEC 10646）标准所定义的标准字符集。UCS-2用两个字节编码，UCS-4用4个字节编码。

更多资料

项目进展

MCU

C51
Arm

单字符

UTF-8 -> UCS2
UCS2 -> UTF-8

字符串

UTF-8 -> UCS2 编码
UCS2 编码 -> UTF-8

实际应用

GSM 模块收发中文短信

维护者

Chenxuan Zhao

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
Core		Core
Demo		Demo
Lib-creat		Lib-creat
Markdown		Markdown
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Lib-code

目录

快速入门

下载

目录说明

Keil 工程设置

参考资料

UTF-8

简介

字符集

UCS2

项目进展

MCU

单字符

字符串

实际应用

维护者

许可证

About

Releases

Packages

Languages

License

ChenxuanZhao/lib-code

Folders and files

Latest commit

History

Repository files navigation

Lib-code

目录

快速入门

下载

目录说明

Keil 工程设置

参考资料

UTF-8

简介

字符集

UCS2

项目进展

MCU

单字符

字符串

实际应用

维护者

许可证

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages