开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

C++字符串:UTF-8还是16位编码？

在C++中，字符串通常表示为const char*指针。字符串编码的选择会影响其内存占用及性能，UTF-8和16位编码是常用的两种编码方式。以下是它们的一些详细信息：

UTF-8 编码：是Unicode字符集的一种变长字符编码格式。它将世界上所有字符编码为一个统一的字节序列。UTF-8支持多字节字符，因此可以表示世界上大多数语言的字符。
16位编码：是一种固定长度的字节表示，也称为ASCII编码。16位编码包括128个字符，如大小写字母、数字和特殊符号。它是最早的一种编码方式，但因其受限的字符集限制了它无法表示所有Unicode字符。

C++中字符串采用默认编码为UTF-8，但也可以使用内置方法将其设置为16位编码。以下是一个例子：

#include<iostream>
#include<string>

int main() {
    // 初始化一个字符串为UTF-8编码
    std::string utf8String = "我爱编程";

    // 设置一个字符串为16位编码
    std::string ansiString = "ASCII";
    std::string alternateEncoding;
    if (ansiString.empty()) {
        alternateEncoding = "16bit";
    } else {
        alternateEncoding = "ANSI_CHARSET";
    }

    // 输出编码为16位编码的字符串
    std::cout << "16-bit encoding used: \""<< alternateEncoding<< "\".\n";

    return 0;
}

在实际应用中，选择使用哪种字符串编码需要考虑如下方面：

字符集完整性：UTF-8编码可以表示来自大多数语言的字符，更适用于需要处理多语言环境的项目。而16位编码仅涵盖了基础ASCII字符集，对一些特殊字符处理则不够理想。
内存占用和性能：通常情况下，UTF-8编码在内存和性能上比16位编码更具优势。UTF-8编码的每个字节都只占一位，而ASCII编码使用16位。这意味着更大的字符空间，更低的内存分配和更快的执行速度。

在选择字符串编码时，还需要注意内存的使用（字符集大小和相关字节序列），以及字符编码转换时的性能损耗。

相关搜索:PostgreSQL C++ libpq编码UTF-8问题打印utf-8编码的字符串将字符串编码为UTF-8和7位编码如何识别UTF-8编码的字符串 utf-8编码和获取字符串片我应该高兴地使用UTF-8还是应该准备好改变编码？nodejs UTF-8编码字符串有黑色问号将wstring转换为以UTF-8编码的字符串将“utf-8”编码字符串列表转换为常规字符串 JSON字符编码 - 浏览器是否支持UTF-8,还是应该使用数字转义序列？javascript UTF-16或UTF-8中的字符串编码尝试使用套接字发送以utf-8编码的字符串 MSVC是双编码UTF-8字符串，为什么？Python 3打印utf-8编码字符串问题 ISO-8859-1编码字符串到UTF-8字符串如何确保JSON字符串是用Java进行UTF-8编码的如何使用utf-8将字符串编码为字节数组？UTF-8编码字符串的字节计数不符合预期替换qt c++中编码字符串的"=“字符编码:将文件从MacRoman更改为UTF-8会中断字符串

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Android JNI 基础知识

自从 Android Studio 升级到 2.3 版本以后，使用 CMake 进行编译就方便多了，不需要再写 Android.mk 了，也不需要用 javah 来生成头文件了，直接写好 native 方法，快捷方式就可以生成对应的 C++ 方法，只要专注写好 C++ 代码，CMake 就可以指定的 CPU 架构生成对应的 SO 库。

03

C++11 Unicode支持

在C++98中，为了支持Unicode字符，使用wchar_t类型来表示“宽字符”，但并没有严格规定位宽，而是让wchar_t的宽度由编译器实现，因此不同的编译器有着不同的实现方式，GNU C++规定wchar_t为32位，Visual C++规定为16位。由于wchar_t宽度没有一个统规定，导致使用wchar_t的代码在不同平台间移植时，可能出现问题。这一状况在C++11中得到了一定的改善，从此Unicode字符的存储有了统一类型：（1）char16_t：用于存储UTF-16编码的Unicode字符。（2）char32_t：用于存储UTF-32编码的Unicode字符。至于UTF-8编码的Unicode数据，C++11还是使用了8bits宽度的char类型数组来表示，而char16_t和char32_t的宽度由其名称可以看出，char16_t为16bits，char32_t为32bits。

03

讲讲网络模块中加解密那点儿事--AES+BASE64提问理论代码

这次想来讲讲网络安全通信这一块，也就是网络层封装的那一套加密、解密，编码、解码的规则，不会很深入，但会大概将这一整块的讲一讲。

03

技术日志挑战——第一天：0724

今天的项目工作是CAD软件设计的一个后置处理模块开发，这个模块尽管是所有里面相对最简单和直观的，但是开发起来也是很有难度的，需要不断循环计算左右两边的数据信息，然后计算得到想要的数据信息。

01

C++11 原生字符串

原生字符串（Raw String）指不进行转义“所见即所得”的字符串。很多编程语言早已支持原生字符串，如C#、Python、Shell等。C++作为一门高级程序设计语言，自然不能自甘落后，从C++11开始，C++也开始支持原生字符串。

03

【QT】QString、QLatin1String、QStringLiteral

QString提供了一个Unicode字符串，QString存储的是一串QChar,而QChar提供了16位的Unicode字符，后台使用隐式共享减少了内存的开销。

02

C++ 新特性学习（六） — 新的字符串编码和伪随机数

使用u””为能至少储存UTF-16的16位元编码,对应’\u’表示16位元的字符。

01

C++：String类的使用

这其实是将在常量区的常量字符串拷贝到数组中，我们会在数组的结尾多开一个空间存储\0，这样我们如果想在访问的时候，比如打印，我们总是认为这个字符串是会读取到\0结束的

01

Android JNI出坑指南

笔者结合自身经验、网上资料对 JNI 的坑进行总结，如果有不正确或遗漏之处欢迎指出。

07

Node进阶-探究不在V8堆内存中存储的Buffer对象

## 前言写完上一篇文章想学Node.js，stream先有必要搞清楚留下了悬念， stream对象数据流转的具体内容是什么？本篇文章将为大家进行深入讲解。

02

JNI：操作字符串String

第一个参数传入一个指向 Java 中的 String 字符串对象的 jstring 变量；

04

技术日志挑战——第2天：0725

今天在做一个用固定宽度的带覆盖两条线之间的空隙的程序，需要根据重叠率进行计算，目前用的方法是之前的方式，发现有一些问题，就是有一些点会计算不到。

01

Node进阶-探究不在V8堆内存中存储的Buffer对象

Buffer对象，类似数组，它的元素为16进制的两位数，即0到255的数值。可以看出stream中流动的数据是Buffer类型，二进制数据，接下来开始我们的Buffer探索之旅。

02

原生JS实现base64解码与编码

base64是用规定的64种字符来表示任意二进制数据的一种编码格式，而且这64种字符均是可见字符，而之所以要是可见的是因为在不同设备上处理不可见字符时可能发生错误。通常，电子邮件数据、公钥证书会经常使用。

01

Python基础知识之一

参考：http://www.jianshu.com/p/ff2de81e1b83 http://www.jianshu.com/p/6199b5c26725

03

Python字符串的前世今生

1991年，Guido van Rossum发布了Python编程语言的第一个版本，自此，世界迎来了巨变。互联网的发展，要求支持不同的自然语言，这促使了Unicode的发展。Unicode定义了一个通

01

字符编码与字符串表达式

简单来说，字符编码的本质是建立整数和字符的映射。从而使得字符可以在计算机内以整数的形式表示，方便传输。比如，我们可以定义 ‘a’ = 1，’b’ = 2，’c’ = 3，就是在进行字符编码。

01

linux unicode

std::string is a basic_string templated on a char, and std::wstring on a wchar_t.

03

C11与C99的变化对比

C11标准是C语言标准的第三个版本，前一个标准版本是C99标准。2011年12月8日，国际标准化组织(ISO)和国际电工委员会

00

JavaScript如何实现UTF-16编码转换为UTF-8编码——utfx.js源码解析

当你在前端需要通过二进制数据与服务端进行通信时，你可能会遇到二进制数据的编码问题。大部分服务端的字符串编码类型都为UTF-8，而JavaScript中字符串编码类型是UTF-16，因此，你需要一个能够将字符串在两种编码方式间进行转换的方法。

03

刨根究底字符编码之十一——UTF-8编码方式与字节序标记

接下来将分别介绍Unicode字符集的三种编码方式：UTF-8、UTF-16、UTF-32。这里先介绍应用最为广泛的UTF-8。

03

【VC++】字符串详解&窗口&第一个windows程序

根本原因是程序使用了标准函数，而在你的机器上，没有这个标准函数对应的动态库实现，如果想要顺利运行则需要到官方网站下载对应版本的动态库安装即可

01

各种编码格式，你懂得！！！

GBK,ISO-8859-1,GB2312的本质区别编码有几种，计算机最初是在美国等国家发明的所以表示字符只有简单的几个字母只要对字母进行编码就好我们标准码 iso-8859-1 这就是一个标准但是后来计算机普及了于是就中国要使用计算机了但是机器不认得中文，于是就有了国际码。 gbk gb2312都是这类。两个其实一个，一个是标准（发布的代号），一个是简称。后来多了个阿拉伯语、日语、韩语......所以就出来统一编码UniCode ISO-8859-1编码是单字节编码，向下兼容ASCII，其编码范围是0x00-0xFF，0x00-0x7F之间完全和ASCII一致，0x80-0x9F之间是控制字符，0xA0-0xFF之间是文字符号。此字符集主要支持欧洲使用的语言。

05

从 JS 里的 MD5 转换踩坑开始说起

写 JS 代码的同学们不知道有没有注意过，后台接口通过 JSON 处理汉字字符、emoji 时，返回的是像 \u00ff 这样转义处理的字符，而不是它们的明文原文。这是为什么呢？

05

从一个单元测试用例来说说编程中的编码问题

在编程中，大多数程序员都离不开编码问题: 系统的默认区域和语言设置，代码文件的编码，以及代码中字符串的编码。

03

[1155]python--AES加密

安装：pip install pycryptodome -i https://pypi.douban.com/simple

02

《深入浅出Node.js》-理解Buffer

Buffer 是一个像 Array 的对象，主要用来操作字节。Buffer 是一个典型的 JavaScript 与 C++ 结合的模块，它将性能相关的部分用 C++ 实现，将非性能相关的部分用 JavaScript 实现。

02

宽字符wchar_t和窄字符char——putwchar、wprintf

先说下窄字符char，这个大部分读者应该很清楚，char类型的变量占一个字节（byte）（也就是8个bit（比特））,能表示256个字符，那char的范围有两种

04

python encode和decode函数说明[通俗易懂]

如上面代码，str\str1\str2均为字符串类型（str）,给字符串操作带来较大的复杂性。

03

Base64笔记

昨天的《MIME笔记》中提到，MIME主要使用两种编码转换方式----Quoted-printable和Base64----将8位的非英语字符转化为7位的ASCII字符。

04

【Golang】深究字符串——从byte rune string到Unicode与UTF-8

Go语言使用UTF-8编码，因此任何字符都可以用Unicode表示。为此，Go在代码中引入了一个新术语，称为 rune。rune是int32的类型别名:

01

【Base64笔记】「建议收藏」

昨天的《MIME笔记》中提到，MIME主要使用两种编码转换方式—-Quoted-printable和Base64—-将8位的非英语字符转化为7位的ASCII字符。

04

Python字符编码全解析

字符编码是计算机编程中不可回避的问题，不管你用 Python2 还是 Python3，亦或是 C++, Java 等，我都觉得非常有必要厘清计算机中的字符编码概念。本文主要分以下几个部分介绍：基本概念常见字符编码简介 Python 的默认编码 Python2 中的字符类型 UnicodeEncodeError & UnicodeDecodeError 根源基本概念字符（Character）在电脑和电信领域中，字符是一个信息单位，它是各种文字和符号的总称，包括各国家文字、标点符号、图形符号、数字

06

使用rapidJson C++库生成JSON字符串

RapidJSON 是一个 C++ 的 JSON 解析器及生成器,它是腾讯公司开发的一款高效的 C++ JSON 解析／生成器，提供 SAX 及 DOM 风格 API，中文官网地址为：http://rapidjson.org/zh-cn/，从这里可以看到它的详细说明文档；对应的Github地址为：https://github.com/Tencent/rapidjson,从rapidjson-github上面获取它的最新的源代码，然后把include目录下的rapidjson目录放在自己指定项目下或者自己项目工程对应的include等目录下，使用时包含rapid目录下对应的头文件就可以了，无需编译成静态库文件。它的灵感来自 RapidXml。

01

Android Native 开发之 NewString 与 NewStringUtf 解析

本文将从一个 Native Crash 分析入手，带大家了解我们平时开发中，那些容易忽略但又很值得学习的底层源码知识。

EasyC++06-char类型和输入输出优化

char的全称是character，也就是字符的意思。顾名思义，char类型是专门为了存储字符而设计的。

01

[Qt]中文乱码问题-1

原文链接：https://blog.csdn.net/humanking7/article/details/81292013

02

python中的encode()和decode()函数

对于很多人来说，python的中字符转码是一件很头疼的事情，本来期望结果输出的是中文，结果来一段像这样\xe4\xbd\xa0\xe5\xa5\xbd像是乱码的字符串。

02

C++数据类型

C++是一种强类型语言，任何变量或函数必须遵循“先申明后使用”的原则。定义数据类型有两个方面的作用：一是决定该类型的数据在内存中如何存储，二是决定可对该类型的数据进行哪些合法的运算。

02

今天一次把 Unicode 和 UTF-8 说清楚

在日常开发过程中，Unicode & UTF-8 并不是很受关注的知识，但在阅读源码或文章时，出现频率很高。如果你没有理解清楚 Unicode、UTF-8、UTF-16 和 UTF-32 之前的关系，会带来阅读障碍。在这篇文章里，我将带你理解 Unicode 字符集的原理，希望能帮上忙。

02

C++STL-string类的使用

网上有句话说：“不懂STL，不要说你会C++”，可见STL对C++的重要性。STL(standard template libaray-标准模板库)：是 C++标准库的重要组成部分，不仅是一个可复用的组件库，而且是一个包罗数据结构与算法的软件框架。

00

转载：python的编码处理（一）

最近业务中需要用 Python 写一些脚本。尽管脚本的交互只是命令行 + 日志输出，但是为了让界面友好些，我还是决定用中文输出日志信息。

02

每个开发必须了解的Unicode和字符集的那些事！

你曾经对神秘的Content-Type标签感到好奇吗？就是那个在HTML中经常用到但是很少有人了解为什么要去使用它的标签。

03

使你的C/C++代码支持Unicode

分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow

03

文本输入与输出 - Java core II

保存数据时，可以选择二进制或文本格式。整数1234存储成二进制时，写成由字节00 00 04 D2构成的序列（十六进制表示法。）存储文本格式时，被存成字符串"1234"。

08

C++字符编码于MSVC和GCC之间的区别

转载自：http://blog.csdn.net/dbzhang800/article/details/7540905

00

字符编码实战

那么就带来一个问题，怎么用二进制来表示我们程序中需要使用的信息呢，比如数字、字符、表情等等。

07

教你一招 | Python3新特性（一）：字符串

从python2转到python3的第一个问题就是字符串的问题，我花了些时间把我能想到的和字符串处理有关的东西都整理如下。 1、Python2的字符串编码在python2.X中的字符串编码有点麻烦，它所有的“普通字符串”是ascii码存储的，unicode字符串是16位unicode码存储的，这个时候就经常出现转换、乱码的问题。 1.1 python2中的普通字符串 >>> a="abc" >>> print a abc >>> print repr(a) 'abc' >>> type(a) <type

【C++】string类的基本使用

下面这篇文章写的非常不错，十分推荐大家看看。（我的建议是搞懂UTF-8的编码规则即可，UTF-16和32不常用，所以掌握UTF-8的编码原理就足够了，因为这些知识只要了解即可，知道有这么回事就行，不必过于细究。）

01

day07（数据类型的相互转换，字符编

一，复习： ''' 1，深浅拷贝　　ls = [1,'a',[10]] 　　值拷贝：直接赋值 ls1 = ls，ls中的任何值发生改变，ls1也随之发生改变　　浅拷贝：通过copy()方法 ls2 = ls.copy()，ls中存放的值的地址没有改变, 但内部的值发生改变，ls2会随之改变　　　　-- ls = [1, 'a', [10]] => [1, 'a', [100]] = ls2 　　深拷贝：通过deepcopy()方法 ls3 = deepcopy(ls)，ls中存放的值发生任何

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭