为什么非破坏空间不是java中的空白字符？ [英] Why is non-breaking space not a whitespace character in java?

查看：113 发布时间：2018/12/4 11:54:53 java unicode

本文介绍了为什么非破坏空间不是java中的空白字符？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

在寻找一种从解析的HTML中修剪不间断空间的正确方法时，我首先偶然发现java的spartan定义 String.trim（）最不恰当的记录。我想避免明确列出符合修剪条件的字符，所以我假设在Character类上使用Unicode支持的方法可以帮我完成工作。

While searching for a proper way to trim non-breaking space from parsed HTML, I've first stumbled on java's spartan definition of String.trim() which is at least properly documented. I wanted to avoid explicitly listing characters eligible for trimming, so I assumed that using Unicode backed methods on Character class would do the job for me.

那是我发现 Character.isWhitespace（char）明确排除不间断空格：

That's when I discovered that Character.isWhitespace(char) explicitly excludes non-breaking spaces:

它是一个Unicode空格字符（ SPACE_SEPARATOR ， LINE_SEPARATOR 或 PARAGRAPH_SEPARATOR ）但不是一个不间断的空间（'\ u00A0'，' \\\ '，'\ u202F'）。

为什么？

对应的实施.NET等价物不那么有区别。

为什么非破坏空间不是java中的空白字符？ [英] Why is non-breaking space not a whitespace character in java?

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

为什么非破坏空间不是java中的空白字符？ [英] Why is non-breaking space not a whitespace character in java?

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭