Unicode转换为字符串会留下前导字节顺序标记 [英] Unicode conversion to String leaves leading Byte order mark

查看：39 发布时间：2022/4/15 18:33:27 c# unicode character-encoding c#-3.0 byte-order-mark

本文介绍了Unicode转换为字符串会留下前导字节顺序标记的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

在.NET 3.5 C#应用程序中，我正在将Unicode编码的字节数组转换为字符串。

字节数组如下：

{255, 254, 85, 0, 83, 0, 69, 0}

使用Encoding.Unicode.GetString(var)，我将字节数组转换为字符串，它返回：

{65279 '', 85 'U', 83 'S' , 69 'E'}

前导字符65279似乎是Zero Width No-Break Space，它在Unicode编码中用作字节顺序标记，它的出现在我的应用程序的其余部分中造成了问题。

目前我使用的解决方法是var.Trim(new char[]{'uFEFF','u200B'});，工作正常。

但真正的问题是，GetString不应该注意删除字节顺序标记吗？或者我在转换字节数组时做错了什么？