从编译到运行，Java String 编码究竟是如何工作的 [英] From compilation to runtime, how does Java String encoding really work

查看：20 发布时间：2022/1/7 21:29:55 java string character-encoding

本文介绍了从编译到运行，Java String 编码究竟是如何工作的的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我最近意识到我并不完全了解 Java 的字符串编码过程.

I recently realized that I don't fully understand Java's string encoding process.

考虑以下代码:

public class Main
{
    public static void main(String[] args)
    {
        System.out.println(java.nio.charset.Charset.defaultCharset().name());
        System.out.println("ack char: ^"); /* where ^ = 0x06, the ack char */
    }
}

由于控制字符是在 windows-1252 和 ISO-8859-1 之间的不同解释，我选择了 ack 字符进行测试.

Since the control characters are interpreted differently between windows-1252 and ISO-8859-1, I chose the ack char for testing.

我现在用不同的文件编码编译它，UTF-8，windows-1252, 和 ISO-8859-1.两者都编译为完全相同的东西，由 md5sum 验证.

I now compile it with different file encodings, UTF-8, windows-1252, and ISO-8859-1. The both compile to the exact same thing, byte-per-byte as verified by md5sum.

然后我运行程序:

$ java Main | hexdump -C
00000000  55 54 46 2d 38 0a 61 63  6b 20 63 68 61 72 3a 20  |UTF-8.ack char: |
00000010  06 0a                                             |..|
00000012

$ java -Dfile.encoding=iso-8859-1 Main | hexdump -C
00000000  49 53 4f 2d 38 38 35 39  2d 31 0a 61 63 6b 20 63  |ISO-8859-1.ack c|
00000010  68 61 72 3a 20 06 0a                              |har: ..|
00000017

$ java -Dfile.encoding=windows-1252 Main | hexdump -C
00000000  77 69 6e 64 6f 77 73 2d  31 32 35 32 0a 61 63 6b  |windows-1252.ack|
00000010  20 63 68 61 72 3a 20 06  0a                       | char: ..|
00000019

无论使用哪种编码，它都能正确输出0x06.

It correctly outputs the 0x06 no matter which encoding is being used.

好的，它仍然输出相同的 0x06，它会被 windows-1252 代码页解释为可打印的 [ACK] 字符.

Ok, it still outputs the same 0x06, which would be interpreted as the printable [ACK] char by windows-1252 codepages.

这就引出了几个问题:

正在编译的 Java 文件的代码页/字符集是否预期与编译它的系统的默认字符集相同?两者总是同义词吗?
编译后的表示似乎不依赖于编译时字符集，情况确实如此吗?
这是否意味着如果 Java 文件中的字符串不使用当前字符集/语言环境的标准字符，则它们在运行时可能会被不同地解释?
关于 Java 中的字符串和字符编码，我还应该了解什么?

从编译到运行，Java String 编码究竟是如何工作的 [英] From compilation to runtime, how does Java String encoding really work

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

从编译到运行，Java String 编码究竟是如何工作的 [英] From compilation to runtime, how does Java String encoding really work

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭