non-english相关内容

有没有按非英语字母表排序的标准方法?例如,罗马尼亚字母表是&aă&b c...

可能的重复项: How do I sort unicode strings alphabetically in Python? 作为世界其他地区的公民,我真的对计算机默认不适用于处理国际问题感到恼火。许多网站仍然不使用Unicode,而PHP仍处于黑暗时代。 当我想要对罗马尼亚语的单词或姓名列表进行排序时,我总是必须编写自己的函数,这几乎没有什么效率。必须有某种区域设置才能使排序函数 ..
发布时间:2022-04-20 10:28:18 Python

使用正则表达式匹配utf-8编码的任意汉字

比如我想把一个m组成的字符串匹配到n个汉字,那么我可以使用: [单汉字正则表达式]{m,n} 是否有单个汉字的正则表达式,可以是任何存在的汉字? 解决方案 匹配中文(好吧,CJK)字符的正则表达式是 \p{script=Han} 可以简单地理解为 \p{Han} 这假设您的正则表达式编译器满足要求RL1.2来自UTS#18的属性Unicode 正则表达式.Perl 和 Java ..
发布时间:2021-12-26 13:32:38 其他开发

如何更改非英语单词的字体大小?

在Word 2007文档中,我手动选择了一个包含英语和英语的句子.多种字体大小的孟加拉语单词.当我在面板的“字体大小"列表框中输入一些数值并按Enter时,整个句子的字体大小都会更改(包括孟加拉语单词). 当我在Word-VBA宏中选择相同的句子并在最后一行尝试 Selection.font.Size = 8 只有英文单词的字体大小会改变. 我试图遍历每个字符,但是得到了相同的 ..
发布时间:2021-05-08 20:53:37 其他开发

在Javascript中对非英文名称进行排序

我正在使用以下脚本来对HTML表中的列进行排序(按字母顺序).该脚本的工作原理很吸引人,只是我不能完全控制非英语字符.例如,如果我有一个以“Ü"开头的单词,那么就不会像"U"那样对待它(应该如此).有一种简单的方法可以在进行排序之前对字符进行音译(例如ü-> u,ä-> a等)?请注意,我不想使用jQuery. var ..
发布时间:2020-07-08 11:03:15 前端开发

使用Java的数据库中的非英文字符

我必须使用Java代码在MySql中保存非英语(特殊字符),当我尝试这样做时,数据将另存为?????? String dataStr = "κωνσταντίνα"; System.out.println("Before " + dataStr); String dataStr1 = new String(dataStr.getBytes( ..
发布时间:2020-07-01 19:49:47 Java开发

如何将角色从基本多语言平面中转出?

对于基本多语言平面中的字符,我们可以使用'\ uxxxx'对其进行转义.例如,您可以使用/[\ u4e00- \ u9fff]/来匹配一个常见的汉字(0x4e00-0x9fff是CJK统一表意文字的范围). 但是对于超出基本多语言平面的字符,其代码大于0xffff.因此,您不能使用格式'\ uxxxx'对其进行转义,因为'\ u20000'表示字符'\ u2000'和字符'0',而不是代码为 ..
发布时间:2020-07-01 19:49:43 其他开发

从python中的句子中删除非英语单词

我写了一个代码,该代码将查询发送给Google并返回结果.我从这些结果中提取摘要(摘要)以进行进一步处理.但是,有时这些片段中包含非英语单词,我不希望它们.例如: /\u02b0w\u025bn w\u025bn unstressed \u02b0w\u0259n w\u0259n/ 我只想在这句话中加上“不加强调"的字眼. 我怎样才能做到这一点? 谢谢 解决方案 PyEnch ..
发布时间:2020-07-01 19:49:39 Python

使用matplotlib以英语作为日期刻度的语言

我是说法语的人,所以我的操作系统界面(GNU/Linux Xubuntu)是法语 因此,当我使用Matplotlib以datetime作为X数据绘制时间序列时,返回的图将以法语表示的月份 如何获取其他语言(通常是英语)的印刷日期? 解决方案 您可以使用 locale 模块.要获取英语,请尝试将locale设置为en_US. 编辑: 在Ubuntu上的bash中,您可能需要 ..
发布时间:2020-07-01 19:48:30 其他开发

C#中的正则表达式中的外语字符

在C#代码中,我试图传递中文字符:" 中文ABC123". 当我通常使用"^[a-zA-Z0-9\s]+$"使用字母数字时, 它不能通过"中文ABC123",并且正则表达式验证失败. 我还需要为C#添加哪些其他表达式? 解决方案 要匹配来自任何语言的任何字母字符,请使用: \p{L} 如果您还想匹配数字: [\p{L}\p{Nd}]+ \p{L} .. ..
发布时间:2020-07-01 19:48:22 C#/.NET

在Python中检测具有非英文字符的字符串

我有一些混合使用英语和没有英语字母的字符串.例如: w='_1991_اف_جي2' 如何使用Regex或Python中的其他任何快速方法来识别这些类型的字符串? 我不希望将字符串中的字母与字母列表一一比较,而要一枪又快地完成. 解决方案 您只需检查字符串是否只能使用ASCII字符(拉丁字母+其他字符)进行编码.如果无法编码,则说明它具有其他字母的字符. 请注意注释# ..
发布时间:2020-07-01 19:47:19 Python

使用正则表达式匹配utf-8编码中的任何中文字符

例如,我想将由m组成的字符串与n汉字匹配,那么我可以使用: [single Chinese character regular expression]{m,n} 单个汉字是否有一些正则表达式,可以是存在的任何汉字? 解决方案 与汉字(CJK)匹配的正则表达式为 \p{script=Han} 可以简单地理解为 \p{Han} 这假定您的正则表达式编译器满足要求 ..
发布时间:2020-07-01 19:47:15 其他开发

如何对非英语字符串进行排序?

我确实查找了答案,并且它们对于标准字母很有用。但是我的情况与此不同。 所以,我在用Java编程。我正在写某个程序。该程序在某些地方具有一些字符串项目列表。 我想根据字母对那些字符串项进行排序。 如果我要按英文字母对其进行排序,这将很容易,因为通常所有代码页与美国信息交换标准代码(ASCII)兼容,并且它们已经对所有英文字母进行了排序,因此,如果我想对列表进行排序,则只需比较char的 ..
发布时间:2020-06-04 19:20:13 Java开发

使用非英语字符处理SEO友好URL

我有这样的URL:.com/topic.php?id=6我可以将它们转换为:.com/topic/5.html这可行,但是现在我要转换.com/topic/title.html“标题"是动态的,例如çağdaş,并且可以包含非-英文字符,例如Ş或Ğ或Ü 在这种情况下,我首先将字符转换为可接受的等效形式,例如Ş到S或Ü到U如果将çağdaş转换为cagdas,则我的URL看起来像这样.com/ ..
发布时间:2020-05-26 18:37:50 数据库

word-vba宏无法更改非英语单词的字体大小

在Word 2007文档中,我手动选择了一个包含英语和英语的句子.多种字体大小的孟加拉语单词.当我在面板的“字体大小"列表框中输入一些数值并按Enter时,整个句子的字体大小将成功更改(包括孟加拉语单词). 但是,当我在VBA单词宏中选择相同的句子并在最后一行尝试 时, Selection.font.Size=8 仅英语单词的字体大小被更改. 有什么问题吗? 我也尝试遍历每个字 ..
发布时间:2020-05-13 01:46:57 其他开发