有没有按非英语字母表排序的标准方法?例如,罗马尼亚字母表是&aă&b c... [英] Is there a standard way to sort by a non-english alphabet? For example, the romanian alphabet is "a ă â b c..."

查看:32
本文介绍了有没有按非英语字母表排序的标准方法?例如,罗马尼亚字母表是&aă&b c...的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

可能的重复项:
How do I sort unicode strings alphabetically in Python?

作为世界其他地区的公民,我真的对计算机默认不适用于处理国际问题感到恼火。许多网站仍然不使用Unicode,而PHP仍处于黑暗时代。

当我想要对罗马尼亚语的单词或姓名列表进行排序时,我总是必须编写自己的函数,这几乎没有什么效率。必须有某种区域设置才能使排序函数遵循指定语言的字母顺序,对吗?

我主要对Python、Java和JavaScript感兴趣。

编辑:正如Chris Morgan所指出的,我找到了适用于Pythonhere的答案。

推荐答案

在PYTHON中,您始终可以使用带键参数的排序函数。例如,在土耳其语中,我们有‘ç’、‘ı’,‘ş’等字母。如果我想要根据该字母进行排序,我会使用一个字母排序的关键字字符串,并按如下方式对字符串进行排序:

>>> letters="abcçdefgğhıijklmnoöprsştuüvyz" #Turkish alphabet
>>> sorted("açobzöğge")
['a', 'b', 'e', 'g', 'o', 'z', 'ç', 'ö', 'ğ'] #Python's default
>>> sorted("açobzöğge", key=lambda i: letters.index(i))
['a', 'b', 'ç', 'e', 'g', 'ğ', 'o', 'ö', 'z'] #With key parameter

注意:使用Python3;处理Unicode更容易。

编辑,正如评论所说,如果我们使用词典,这个过程会更有效:

>>> letters="abcçdefgğhıijklmnoöprsştuüvyz"
>>> d={i:letters.index(i) for i in letters}
>>> sorted("açobzöğge", key=d.get)
['a', 'b', 'ç', 'e', 'g', 'ğ', 'o', 'ö', 'z']

这篇关于有没有按非英语字母表排序的标准方法?例如,罗马尼亚字母表是&aă&b c...的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆