C/C++为什么对二进制数据使用无符号字符？ [英] C/C++ Why to use unsigned char for binary data?

查看：139 发布时间：2022/6/23 22:24:29 c++ c character-encoding bytebuffer rawbytestring

本文介绍了C/C++为什么对二进制数据使用无符号字符？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

是否真的需要像某些使用字符编码或二进制缓冲区的库中那样使用unsigned char来保存二进制数据？要理解我的问题，请看下面的代码-

char c[5], d[5];
c[0] = 0xF0;
c[1] = 0xA4;
c[2] = 0xAD;
c[3] = 0xA2;
c[4] = '';

printf("%s
", c);
memcpy(d, c, 5);
printf("%s
", d);

printf's和𤭢都正确输出，其中f0 a4 ad a2是Unicode码点U+24B62 (𤭢)的十六进制编码。

Evenmemcpy也正确复制了字符保留的位。

什么理由可能主张使用unsigned char而不是plain char？

在其他相关问题中突出显示unsigned char，因为它是C规范保证没有填充的唯一(字节/最小)数据类型。但如上面的例子所示，输出似乎不受任何填充的影响。

我已经用VC++Express 2010和MinGW编译了上面的代码。尽管VC给出了警告

warning C4309: '=' : truncation of constant value

输出似乎没有反映这一点。

附注：这可以标记为Should a buffer of bytes be signed or unsigned char buffer?的可能副本，但我的意图不同。我想问的是，为什么似乎可以与char一起工作的内容要键入unsigned char？

更新：引用N3337，

Section 3.9 Types

对于平凡的任何对象(基类子对象除外) 可复制类型T，无论对象是否持有类型的有效值 T，则可以将组成对象的底层字节(1.7)复制到字符或无符号字符的数组。如果字符数组的内容或将无符号字符复制回对象中，则对象应然后保持其原始值。

鉴于上述事实，而且我最初的示例是在char默认为signed char的Intel机器上，我仍然不确定是否应该优先使用unsigned char而不是char。

还有别的事吗？