transliteration相关内容

C# 中的 Slugify 和字符转写

我正在尝试将以下 slugify 方法从 PHP 转换为 C#:http://snipplr.com/view/22741/slugify-a-string-in-php/ 编辑:为方便起见,这里是上面的代码: /*** 修改字符串以删除所有非 ASCII 字符和空格.*/静态公共函数 slugify($text){//将非字母或数字替换为 -$text = preg_replace('~ ..
发布时间:2022-01-18 13:22:27 C#/.NET

Python 和字符规范化

你好我从包含特殊字符(例如 u"ıöüç")的外国来源检索基于文本的 utf8 数据,同时我想将它们规范化为英语,例如 "ıöüç" -> "iouc" .实现这一目标的最佳方法是什么? 解决方案 我推荐使用 Unidecode 模块: >>>从 unidecode 导入 unidecode>>>unidecode(u'ıöüç')'iouc' 注意你是如何输入一个 unicode ..
发布时间:2021-12-28 16:41:23 Python

如何在 c# 中将字符串从 utf8 转换(音译)为 ASCII(单字节)?

我有一个字符串对象 “带有多个字符甚至特殊字符" 我正在尝试使用 UTF8Encoding utf8 = new UTF8Encoding();ASCIIEncoding ascii = new ASCIIEncoding(); objects 以便将该字符串转换为 ascii.我可以请人为这个简单的任务带来一些启发,那就是打猎我的下午. 编辑 1:我们试图完成的是摆脱一些特 ..
发布时间:2021-12-27 15:35:26 C#/.NET

您如何映射替换 Javascript 中的字符,类似于 Perl 中的“tr"函数?

我一直在尝试弄清楚如何将字符串中的一组字符映射到类似于 Perl 中的 tr 函数的另一组字符. 我发现了这个网站显示了 JS 和 Perl 中的等效功能,但遗憾的是没有 tr 等价物. Perl 中的tr(音译)函数将字符一一映射,所以 data =~ tr|\-_|+/|; 会映射 - =>+ 和 _ =>/ 如何在 JavaScript 中有效地做到这一点? 解 ..
发布时间:2021-12-10 18:09:44 前端开发

从 Unicode 字符中删除变音符号 (ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ)

我正在研究一种可以在带有变音符号的字符之间进行映射的算法(波浪号、 例如: ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ -->ná -->一种ä -->一种ấ -->一种ṏ -->○ 等 我想用 Java 来做这件事,虽然我怀疑它应该是 Unicode-y 并且应该可以在任何语言中轻松实现. 目的:允许轻松搜索带有变音符号的单词.例如,如果我有一个网球运动员数据库 ..
发布时间:2021-11-25 13:21:11 Java开发

Java Swing 项目中的 Google 音译 API

我正在使用 Java Swing 进行音译项目.它可以访问互联网,但我无法设置它.我们怎么做?我们需要下载 Google API 库还是只调用一个函数就可以了? 以下是一些有用的音译链接: Google Transliterate API 开发人员指南 可供下载的 Java 版 Google API 库 (我认为它有谷歌的所有 API 库:翻译、音译、搜索等) 我花了 ..
发布时间:2021-11-15 02:16:18 Java开发

ICU自定义音译

我希望使用 ICU 库进行音译,但我想为一组特定的自定义音译提供自定义音译文件,以便在编译时合并到 ICU 核心中,以便在其他地方以二进制形式使用.出于兼容性原因,我正在使用 ICU 4.2 的源代码. 据我所知,从 他们网站的 ICU 数据页面,一种方式关于这个是在 ICUHOME/source/data/translit/中创建文件 trnslocal.mk ,在这个文件中有一行 TRA ..
发布时间:2021-09-09 19:16:28 其他开发

如何在我的Java Web应用程序中使用Google音译API?

如何在我的Java应用程序中使用 Google Transliteration API. 如果我输入 String (以英语或阿拉伯语输入),则Google Transliterator API会将其翻译为相应的其他语言,并提供音译字符串.我也想知道使用Google翻译器或音译器更好吗? 如何执行此操作?任何建议,请.我需要在我的JAVA程序中使用它. 解决方案 有一个测试代码 ..
发布时间:2021-05-11 20:17:03 Java开发

Java Swing项目中的Google音译API

我正在使用Java Swing进行音译项目.它可以访问互联网,但是我无法设置它.我们该怎么做?我们需要下载Google API库还是只是一个函数调用就可以? 以下是一些有用的音译链接: Google Transliterate API开发者指南 用于Java的Google API库可供下载 (我认为它具有Google的所有API库:翻译,音译,搜索等) 我花了很多时间 ..
发布时间:2020-09-05 20:10:03 Java开发

音译和模糊搜索,例如Google的建议

我需要用字符的音译进行模糊搜索,例如: 我有一个ASP.NET应用程序数据库,它有一个带有西班牙语单词列表的表(200,000个条目),还有一个带有输入字段的页面.关键是我不懂西班牙语,也不知道如何用西班牙语拼写搜索词,但我知道它的发音.因此,在文本框中输入搜索词,例如"beautiful",但是在记录错误中显示"prekieso",并且我需要从数据库中获取正确的版本:"precioso". ..

将CJK音译为拉丁语-最好使用C ++

我正在尝试编写一个可以将CJK音译为拉丁语(即拼音,罗马字等)的程序.例如,您提供中文,日文或韩文文档作为输入,然后将音译版本转换为拉丁文作为输出. 我在这个领域是新手,所以请在这里与我同在. 显然,首先,我需要先检测语言的类型(中文,日文或韩文).然后,据我到目前为止所了解的,为了进行音译,我需要将文本分成单词,因为在这些语言中单词之间没有 space .这称为分词.最后,在找到单词 ..
发布时间:2020-07-11 19:25:09 C/C++开发

Python-编解码器将ascii编码为unicode:错误

:)我正在尝试将输入文件(当前为英文)的音译恢复为原始格式(印地文)的过程 样本或输入文件的一部分看起来像这样: E-k- b-u-d-z*dhi-m-aan- p-ksii# E-k- ghn-e- j-ngg-l- m-e-ng E-k- b-h-u-t- UUNNc-aa p-e-dr thaa# U-s- k-ii p-t-z*t-o-ng s-e- l-d-ii shaak ..
发布时间:2020-07-11 19:25:05 Python

Google音译建议CSS不正确

我按照步骤解决了无法通过HTTPS提供音译API的问题:我提取了Google JSAPI& Transliteration.I.js到我自己的文件中,并添加了https. 但是在那之后,建议会在页面底部的div中弹出,而不像通常的下拉菜单那样. 不胜感激. 解决方案 这是一个逐步的过程: 首先,有一个指向API的链接: ..
发布时间:2020-07-11 19:25:00 其他开发

我可以在Python中使用Google Transliteration吗?

我知道Google允许从英语到几种语言的音译(www.google.com/transliterate). 我有一个英语单词列表.我想将每个单词音译(不 翻译)到孟加拉语(Google支持的语言)-以Unicode单词列表的形式获取输出. 是否可以在Python中使用音译API来做到这一点? 解决方案 这是入门文档:如果只需要使用一次,那么使用示例代码在浏览器中执行音译可能是最 ..
发布时间:2020-07-11 19:23:55 Python

在Ruby中使用Iconv进行音译

当我尝试用西里尔utf-8字符串音译 Iconv.iconv('ascii//ignore//translit', 'utf-8', string).to_s (请参阅问题/1726404/transliteration-in-ruby ) 除了那些需要音译的符号之外,我得到了所有东西. 例如:'r-строка'→ 'r-'和'Gévry'→ "Gvry". 怎么了? ..
发布时间:2020-07-11 19:23:40 其他开发

将重音符号转换为ASCII字符

从1600万个字符串变量的向量中删除德语(或法语)重音符号的最佳方法是什么. 例如从“干燥综合征"转变为“干燥综合征" 将单个字符转换成单个字符要比音译(例如 )更好 ä=> aeö=> oeü=> ue. 例如,使用正则表达式是一种选择,但是有什么更好的选择(针对此的R包)? gsub('ü','u',gsub('ö','o',"Sjögren's syndrome ..
发布时间:2020-07-11 19:23:34 其他开发