non-ascii-characters相关内容

c读取非ASCII字符

我正在解析一个包含诸如æ ø å之类的字符的文件。如果我们假设我已按如下方式存储文本文件的一行 #define MAXLINESIZE 1024 char * buffer = malloc(MAXLINESIZE) ... fgets(缓冲区,MAXLINESIZE,句柄) ... 如果我想计数一行上的字符数。如果我尝试执行以下操作: char * ..
发布时间:2020-10-01 00:23:53 其他开发

尝试调用Google搜索API时出现Unicode错误

我需要执行Google搜索来检索查询的结果数.我在这里找到了答案-通过Python应用进行Google搜索 但是,对于一些查询,我遇到以下错误.我认为查询具有Unicode字符. UnicodeDecodeError:"ascii"编解码器无法解码位置28的字节0xc3:序数不在范围(128)中 我搜索了google,发现我需要将unicode转换为ascii,并找到以下代码. ..
发布时间:2020-09-07 20:38:37 Python

正则表达式拉丁字符过滤器和非拉丁字符过滤器

我正在开发一个程序,其中需要过滤非拉丁字符的单词和句子.问题是,我只找到拉丁字符单词和句子,但没有找到混合了拉丁字符和非拉丁字符的单词和句子.例如,"Hello"是拉丁字母,我可以使用以下代码对其进行匹配: Match match = Regex.Match(line.Line, @"[^\u0000-\u007F]+", RegexOptions.IgnoreCase); if (mat ..
发布时间:2020-09-07 20:08:55 C#/.NET

将特殊字符(即Umlaut)转换为最可能的ascii表示形式

我正在寻找一种方法或转换表,它知道如何将Umlauts和特殊字符转换为它们最可能的ascii表示形式. 示例: Ärger = aerger Bôhme = bohme Søren = soeren pjérà = pjera 有人知道吗? 更新: 除了公认的答案,我还发现PECL Normalizer 是很有意思,尽管由于服务器没有它并且没有为我更改,所以我无法使用它. ..
发布时间:2020-09-07 20:05:32 PHP

字符看起来像ASCII 63,但不是,所以我无法删除它

我正在从文本文件中读取文本.文本文件必须读取的第一个字符串是"Algood",并注意空格.在记事本中,此字符串中似乎有一个空格,但实际上没有.当我在Visual Studio的QuickWatch中测试第6个(从零开始的索引)字符时,它显示为: "�"c 当我使用Asc函数获取ASCII码时,它告诉我ASCII码为63.63是一个问号.但是,当我测试以查看字符串是否包含ASCII 63时 ..
发布时间:2020-09-07 19:49:18 其他开发

为什么此LSEP符号显示在Chrome而不是Firefox或Edge上?

因此,此网页使用这些符号进行呈现,并且可以在此网站/应用程序中找到它们,但在其他任何网站上都找不到.谁能告诉我 这个符号是什么? 为什么只在一个浏览器中显示? 解决方案 该字符是U + 2028行分隔符,它是一种换行符.将其视为与HTML的 等效的Unicode. 为什么会出现在这里:我的猜测是内部数据库使用LSEP不会与原义的换行符或HTML标记冲突(这可能会破坏数据 ..

从数据文件中删除非ASCII字符

我有一堆正在读入R的csv文件,并包含在.rdata格式的package/data文件夹中.不幸的是,数据中的非ASCII字符未能通过检查. tools软件包具有两个功能来检查非ASCII字符(showNonASCII和showNonASCIIfile),但我似乎找不到一个要删除/清除它们的字符. 在探索其他UNIX工具之前,在R中完成所有这些工作将非常棒,这样我就可以维护从原始数据到最终产 ..
发布时间:2020-09-07 19:28:10 其他开发

接受非ASCII字符

考虑此程序: #include int main(int argc, char* argv[]) { printf("%s\n", argv[1]); return 0; } 我这样编译: x86_64-w64-mingw32-gcc -o alpha alpha.c 问题是,如果我给它提供一个非ASCII参数: $ ./alpha rói ..
发布时间:2020-09-07 01:41:07 其他开发

Python:ASCII编解码器无法对破折号进行编码

我正尝试使用热敏打印机支持CP437的编码.这意味着我需要翻译一些字符;在这种情况下,短划线为连字符.但是python甚至不会对破折号进行编码.当我尝试解码字符串并将连字符替换为连字符时,出现以下错误: Traceback (most recent call last): File "pftest.py", line 46, in str = str.decod ..

如何在Python中将\ xXY编码的字符转换为UTF-8?

我有一个包含"\ xaf","\ xbe"等字符的文本,据我从我想将它们在Python中转换为等效的UTF-8.通常的string.encode("utf-8")抛出UnicodeDecodeError.有没有更好的方法,例如,使用codecs标准库? 示例此处有200个字符. 解决方案 您的文件已经是UTF-8编码的文件. # saved encoding-sample to ..
发布时间:2020-07-13 04:38:32 Python

Python中的N-curses:如何捕获和打印非ASCII字符?

我想用ncurses/python创建一个小程序,并能够使用法文和日文输入/输入.我知道我应该设置语言环境并使用unicode标准. 但是如何处理screen.getch()的结果呢?无论语言如何,我都希望在ncurses窗口中显示键入的字符. 我知道必须进行一些unicode转换,但是找不到做什么(我已经搜索了很多:对于业余爱好者来说,这种字符转换业务并不容易理解). 其他问题 ..
发布时间:2020-07-04 22:58:37 Python

从外观上将非ASCII代码转换为等效的ASCII

我在mysql数据库中有成千上万的名称,其中包含扩展的ASCII代码.我想将它们转换为普通的英文字母.这是一个示例: 信达浦济州岛转换为->信达浦济州岛 那我该怎么办呢?我知道Java和Groovy,以及其他许多脚本语言,但是运气不高.有什么建议吗? 解决方案 我在浏览了stackoverflow中的许多帖子后找到了答案:import java.text.Normalizer; ..
发布时间:2020-06-14 18:53:16 其他开发