为什么'é‘和'é’编码为不同的字节？

文章/答案/技术大牛

发布

1回答

、、、

问题上下文 expected = [os.path.join(tmp_tree.root_path, "é")] assert resu

浏览 5提问于2016-09-20得票数 5

回答已采纳

1回答

(编码的)字符集-为什么要映射到unicode中的代码点？

、、、

据我所知，编码字符集将数字(称为代码点)映射/分配到(抽象)字符(例如，德语字符ü到unicode中的代码点00FC )。这个代码点可以用不同的方式编码(例如，以字节模式表示)：所以这个过程是： (摘要)字符->映射到码位(编码)字符集-->码位编码为1...n<e

浏览 0提问于2017-08-25得票数 1

1回答

ToBase64String，C# 3.5

、

在将zip文件转换为base64编码字符串时，我使用MIME支持发送邮件所需的字符串然而，我收到的所有攻击都是corrupted.It，似乎base64编码是不正确的。

浏览 2提问于2011-08-21得票数 1

回答已采纳

2回答

NSData subStringFromIndex:等效项

、、

我收到一个至少有50个字符的NSData字符流。通常，我会尝试将其转换为NSString并使用subStringFromIndex:选择器，但似乎NSString是以NULL结尾的(如果我错了，请纠正我)，我宁愿跳过数据/字符串转换。有没有人知道有没有办法在NSData中获取特定索引处的字符？例如，假设返回的数据为：假设我想把7和8去掉，并且只剩下这两个。为了得到7和8，我尝试了这样<em

浏览 0提问于2013-07-18得票数 0

回答已采纳

1回答

理解Javascript / V8中的字符串堆大小

、、

有谁能很好地理解/解释如何在Chrome(V8) Javascript中确定字符串的堆大小？1)一个相同的两个字符串的多个副本。( "dt")具有不同的@对象Ids，它们都被指定为OneByteStrings。堆转储表示，每个副本都有一个较浅的和保留的大小为32个字节。目前尚不清楚两个字节字符串的保留大

浏览 5提问于2016-11-09得票数 10

回答已采纳

2回答

为什么Java跨平台与String.length字符不一致？

、、

但是我不明白为什么下面的程序HelloUnicode.java在不同的平台上产生不同的结果。相同的字节长度，不同的字符串长度。为什么？通过将字符串中的"“替换为”\uD83D\uDE42 42“，我得到了以下结果：String: I have a ?“\uD83D\ the 42”在Windows机器上被编码为0x3F是我无法

浏览 2提问于2019-05-21得票数 9

回答已采纳

2回答

put文件中的?字符在C#控制台应用程序中被解释为

、、

我见过两个字符相同的问题，但注意到这与这个特定的问题有关，所以这里就是这样。我对存储在我的数据库中的</e

浏览 0提问于2014-10-14得票数 1

2回答

编码后，数据大小不断增加

、

我有一个XML格式的文本数据，它的长度约为816814字节。它包含一些图像数据和一些文本数据。我们使用ZLIB算法进行压缩，压缩后的数据长度为487239字节。压缩后，我们使用BASE64Encoder对数据进行编码。但是在对压缩数据进行编码之后，大小增加，编码数据的长度为666748字节。 为什么，编码后的数

浏览 1提问于2012-12-14得票数 1

2回答

为什么Python中的bytearray函数将一个字节转换成两个字节？

、、

我正在尝试用Python创建一个数据编码器。我使用自己独特的底层对称算法将单个8位字节编码成另一个8位字节，然后使用相同的算法对其进行解码。>>> byte = by

浏览 1提问于2021-07-12得票数 1

1回答

Python3 -1和cp1252在解码未映射字符时的不同行为

、、、、

我试图在Python3中读取一个文本文件，该文本文件指定具有未映射字符(例如字节0x8d)的编码cp1252。UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 14: character maps to <undefined> 我想了解为什么在使用编码拉丁语-1读取同一个文件时，没有得到相同的异常，而字节0x8d表示为十

浏览 5提问于2019-10-22得票数 1

1回答

将iOS传输给Java

、、、、

encryptedData = [NSData dataWithBytes:cipherBuffer length:cipherBufferSize];PKCS8EncodedKeySpec keySpec = new PKCS8EncodedKeySpec当我在Java中直接加密相同的短语时，输出以2字节<e

浏览 0提问于2013-07-23得票数 0

回答已采纳

3回答

为什么UTF-8使用多个字节来表示某些字符？

、

我最近参加了一个关于字符编码的。我对其中提到的某一点感到担忧。我的问题是为什么这是必需的？可以

浏览 0提问于2011-08-21得票数 7

回答已采纳

2回答

在Java中读取字符流

InputStream类提供读取字节数据的流，而Reader类提供字符数据的流。为了从流中读取字符数据，我们使用InputStreamReader，它实际上是一个将字节流转换为字符流的桥。难道不可以直接从流中读取字符数据，而不是最初将其作为字节流读取，然后将其转换为字符流吗？

浏览 3提问于2013-06-24得票数 0

5回答

为什么Encoding.Default.GetBytes()在VB.NET和C#中返回不同的结果？

、、

我们最近遇到了一些来自供应商的示例代码，用于散列web服务调用的密钥，他们的示例是VB.NET，我们将其转换为C#。这导致散列产生不同的输入。事实证明，他们生成加密密钥的方式是将字符数组转换为字符串，然后再转换回字节数组。这导致我发现VB.NET和C#的默认编码器对某些字符的工作方式不同。;Dim b As Char() = {Chr(149)} Console.Writ

浏览 4提问于2009-05-29得票数 7

回答已采纳

2回答

java getBytes对getBytes(字符集)的奇怪行为

、、、

0 0 -1 -3 •-107 在这两个部分中:为什么输出getBytes()和getBytes(charSet)是不同的，即使我特别提到了字符串的字符集为什么utf-32节中的getByte的两个字节输出都不同于实际的byte[] b？(也就是说，如何将字符串转换回原来的字节数组？)

浏览 5提问于2015-07-24得票数 1

回答已采纳

3回答

UTF-8编码如何识别单字节和双字节字符？

、、、

最近我遇到了一个关于字符编码的问题，当我深入研究字符集和字符编码时，这个疑问出现在我的脑海中。UTF-8编码是最流行的，因为它与ASCII.Since UTF-8向后兼容UTF-8是可变长度编码格式，它如何区分单字节和双字节characters.For例如，"Aݔ“存储为"410754”(A的Unicode是41，阿拉伯字符的

浏览 0提问于2017-06-15得票数 26

回答已采纳

1回答

图像数据，iphone

我正在使用下面的代码将图像数据转换为字节。UIImageJPEGRepresentation(m_imageView.image,90);同样的图像正在使用.net转换为字节，因为他们使用了一些编码技术…… iphonesdk和.net字节不同步...我是否需要为该bytes....if使用编码技术，因此请为我提

浏览 1提问于2011-05-11得票数 0

3回答

为什么我需要在String.getBytes(charsetName)中使用编码

通常，当我需要将字符串转换为byte[]时，我会使用不带参数的getBytes()。我检查过了，它不是保存，我应该使用字符集。为什么我要这么做-字母'A‘总是会被解析成0x41？不是吗？

浏览 1提问于2013-09-13得票数 0

1回答

在Win-1252和Latin9中，欧元符号字符怎么能大于0 0xFF？

、、

在和 (拉丁语-9)代码页中，欧元符号(欧元)的值为0x20AC--这是十进制的8364！但是，如果这个编码中的任何字符都必须适合于一个没有符号的字节(即最大值可以是255)，这怎么可能呢？US的值为0-127,128-255是不同字符编码之间的变化。a € b 并将其保存到编码为“la

浏览 4提问于2015-08-27得票数 0

回答已采纳

1回答

多字节字符集编码与utf8不同吗？

、、、

我已经对unicode做了大量的阅读，并得出结论，Unicode是一个字符集，而utf8是一种可能的编码方式，碰巧是多字节编码。然而，当我被告知我的windows机器可能具有与utf8不同的地区设置时，进一步的读数让我有点困惑。如果我的应用程序处理utf8，那么我首先需要从多字节用户输入转换为宽字符，然后转换到utf8。我的第一个问题是，为什么我需要这样做，因为

浏览 3提问于2022-01-02得票数 -1

点击加载更多