non-ascii-characters 第2页 - IT屋-程序员软件开发技术分享社区

创建一个有效的单词计数器，包括中文/日语和其他重音语言

在尝试弄清楚如何获得有效的字符串计数器后，我知道 PHP 具有的现有函数 str_word_count 但不幸的是它没有做我需要它做的事情，因为我需要计算包含英文、中文的单词数、日语和其他重音字符. 然而，str_word_count 无法计算单词的数量，除非您在第三个参数中添加字符，但这疯狂，这可能意味着我必须添加每个字符中文、日文、重音字符(等)语言，但这不是我需要的. 测试: ..

格式化包含非 ascii 字符的列

所以我想对齐包含非 ascii 字符的字段.以下似乎不起作用: for word1, word2 in [['hello', 'world'], ['こんにちは', '世界']]:打印 "{: ..

发布时间：2021-08-31 18:39:41 python python-2.7 unicode string-formatting non-ascii-characters Python

使用 SQL Server 在 varchar 列中查找非 ASCII 字符

如何使用 SQL Server 返回包含非 ASCII 字符的行? 如果你能展示如何为一列做到这一点会很棒. 我现在正在做类似的事情，但它不起作用选择 *从 Staging.APARMRE1 作为 arwhere ar.Line like '%[^!-~ ]%' 额外的功劳，如果它可以跨越一个表中的所有 varchar列，那就太好了！在这个解决方案中，最好返回三列: 该记录 ..

发布时间：2021-08-25 19:09:36 sql-server tsql sql-server-2005 non-ascii-characters 数据库

报告实验室无法处理希伯来语 (unicode)

我正在尝试通过以下 python 编程生成 pdf，但生成的输出没有正确显示希伯来字母 # -*- 编码:utf-8 -*-从 reportlab.pdfgen 导入画布定义你好(c):c.drawString(100,100, "מה שלומך")c = canvas.Canvas("hello.pdf")你好ç)c.showPage()c.save() 解决方案这段代码(见下文)有效 ..

发布时间：2021-07-07 20:36:37 python reportlab non-ascii-characters Python

Python:替换字符串列表中的非 ascii 字符

我知道在 stackoverflow 上有很多非 ascii 字符问题，但由于我是一个新手，我没有成功实现它们的运气，而且我发现整个“unicode"概念难以理解. 所以我有一个清单 - mylist = [“苹果"、“三星"、“东芝"、“不知道"、“想不起来"] 我想访问索引 3 和 4 处的单引号并将它们替换为撇号. 我试过了: # -*- 编码:utf-8 -*-mylis ..

发布时间：2021-07-07 19:42:59 python replace non-ascii-characters Python

帮助替换 Python 中的非 ASCII 字符

我有一堆使用 Python 中的 HTTPLIB2 包下载的 HTML 文件.' '显示为“Â". 02/12/2004正在显示 02/12/2004 是所需的格式. 如何在 Python 中用 ' ' 替换 'Â '?非常感谢！解决方案您遇到了编 ..

发布时间：2021-07-07 19:36:45 python non-ascii-characters replace Python

正则表达式用于python中的重音不敏感替换

在 Python 3 中，我希望能够以“不区分重音"的方式使用 re.sub()，就像我们可以使用 re.I 不区分大小写替换的标志. 可能类似于 re.IGNOREACCENTS 标志: original_text = "¿80°C，我和克洛伊在咖啡馆里喝咖啡."口音正则表达式 = r'a cafe're.sub(accent_regex, 'X', original_text, fla ..

发布时间：2021-07-06 20:15:27 python regex unicode non-ascii-characters accent-insensitive Python

Python:ascii 编解码器不能编码短划线

我正在尝试使用热敏打印机打印诗歌基金会每日诗歌 RSS 提要中的一首诗a> 支持 CP437 编码.这意味着我需要翻译一些字符；在这种情况下，连字符的短划线.但是 python 甚至不会编码开始的破折号.当我尝试解码字符串并用连字符替换破折号时，出现以下错误: 回溯(最近一次调用最后一次): 中的文件“pftest.py"，第 46 行str = str.decode('utf-8')文件 ..

发布时间：2021-06-26 19:39:45 python-2.7 printing utf-8 non-ascii-characters utf8-decode 其他开发

UnicodeEncodeError: 'ascii' 编解码器无法编码字符?

我正在尝试通过正则表达式传递大串随机 html 并且我的 Python 2.6 脚本对此感到窒息: UnicodeEncodeError: 'ascii' 编解码器无法编码字符我将它追溯到这个词末尾的商标上标:Protection™——我不需要捕获非 ascii 的东西，但它很麻烦，我希望将来会更多地遇到它. 有处理非ascii字符的模块吗?或者，在 python 中处理/转义 ..

发布时间：2021-06-26 18:31:08 regex python-2.6 non-ascii-characters 其他开发

“UnicodeEncodeError: 'ascii' 编解码器无法编码字符";

我正在尝试通过正则表达式传递大串随机 html 并且我的 Python 2.6 脚本对此感到窒息: UnicodeEncodeError: 'ascii' 编解码器无法编码字符我将其追溯到这个词末尾的商标上标:Protection™ -- 我希望将来还会遇到类似的其他人. 有处理非ascii字符的模块吗?或者，在 python 中处理/转义非 ascii 内容的最佳方法是什么? ..

发布时间：2021-06-26 18:30:19 regex unicode python-2.6 non-ascii-characters 其他开发

我已经阅读了 Stackoverflow 上的其他问题，但仍然没有更深入的了解.对不起，如果这已经得到回答，但我没有得到任何建议在那里工作. >>>进口重新>>>m = re.match(r'^/by_tag/(?P\w+)/(?P(\w|[.,!#%{}()@])+)$','/by_tag/xmas/xmas1.jpg')>>>打印 m.groupdict(){'标签':'圣诞节'，'文件名' ..

发布时间：2021-06-25 20:17:30 python regex unicode non-ascii-characters character-properties Python

如何使用 urlopen 获取非 ascii 网址?

我需要从包含非 ascii 字符的 URL 中获取数据，但 urllib2.urlopen 拒绝打开资源并引发: UnicodeEncodeError: 'ascii' codec can't encode character u'\u0131' in position 26: ordinal not in range(128) 我知道 URL 不符合标准，但我没有机会更改它. 使用 P ..

发布时间：2021-06-25 19:21:08 python unicode urllib2 non-ascii-characters urlopen Python

Powershell Invoke-RestMethod 不正确的字符

我正在使用 Invoke-RestMethod 从我正在使用的应用程序中获取页面名称.我注意到当我在页面上执行 GET 时，它会像这样返回页面名称此页面 â 正在运行但是实际的页面名称是此页面 - 正在运行这是我的请求的样子 Invoke-WebRequest -Uri ("https://example.com/rest/api/content/123789" ..

发布时间：2021-06-19 20:42:54 powershell webrequest non-ascii-characters 其他开发

正则表达式 - PCRE (PHP) - 字边界 (\b) 和重音字符

为什么在下面的例子中字母 é 算作与 \b 匹配的词边界? 模式:/\b(cum)\b/i 文本:écumé 匹配不需要的“cum". 有没有可能克服这个问题? 解决方案当您将 u 修饰符添加到正则表达式时，它会起作用 /\b(cum)\b/iu ..

发布时间：2021-06-14 20:44:16 php regex utf-8 pcre non-ascii-characters PHP

查找文件名中带有非ASCII字符的文件

有没有一种方法可以查找带有非ASCII字符的文件?我当然可以使用管道-并用perl过滤文件，但是为了提高效率，我想全部在 find 中进行设置.我尝试了以下方法: find.-type f -name'* [^ [:ascii:]] *' 它根本不起作用. 修改: 我现在正在尝试使用 find.-类型f -regex'.* [^ [:ascii:]].*' 这是一个em ..

发布时间：2021-05-07 19:28:14 find non-ascii-characters 其他开发

如何编码和解码非Ascii字符?

我正在开发一个要在其中编码西班牙语文本的应用程序.但是问题在于，它没有对特殊字符进行编码，例如á，é，í，ó，ú，ü，Á，Á，É，Í，Ó，Ú，Ü，Ñ，ñ.我该怎么做?我想对西班牙文本进行编码/解码. 解决方案好，我正在回答自己的问题，希望它将对某人有所帮助；在给定的字符串中打印西班牙语或任何其他非ASCII字符用其Unicode转义字符集替换所有非ASCII字符例如，用\ u00e1 代 ..

发布时间：2021-04-29 20:41:40 c# encoding decoding non-ascii-characters C#/.NET

Python imaplib:正确显示非ASCII字符

我正在使用Python 3.5和 imaplib 从GMail提取电子邮件并打印其正文.正文包含非ASCII字符.这些以奇怪的方式被“编码"，我无法找到解决方法. 导入电子邮件导入imaplibc = imaplib.IMAP4_SSL('imap.gmail.com')c.login('example@gmail.com'，'password')c.选择(``收件箱'')_，data = c. ..

发布时间：2021-04-21 20:25:33 python python-3.x character-encoding email non-ascii-characters Python

将包含多字节字符的字符串拆分为字符串数组

我有这段代码，旨在使用CHUNK_SIZE作为拆分大小(以字节为单位)将字符串拆分为字符串数组(我这样做是为了分页结果).在大多数情况下，当字符为1个字节时，这是可行的，但是当我在精确的分割位置处有一个多字节字符(例如2个字节的法语字符(如é或4个字节的中文字符)时，我最终得到在我的第一个数组元素的末尾和第二个数组元素的开头，有2个不可读的字符. 是否有一种方法可以解决该代码以解决多字节字符 ..

发布时间：2021-04-21 20:21:16 java string split character non-ascii-characters Java开发

如何在C ++中打印希腊字母delta

我有一个基于控制台的小型应用程序，它将解决物理方程式.我试图问用户是否要在给定情况下找到ΔV，但我不知道如何将字母delta打印到控制台.这是我的代码: cout>选择; 这不会在控制台上打印“ΔV".“Δ"甚至没有显 ..

发布时间：2021-04-19 20:48:46 c++ c++11 unicode console non-ascii-characters C/C++开发

如何使用echo写非ASCII字符?

如何使用echo写非 ASCII 字符?是否有转义序列，例如 \ 012 或类似的东西? 我要使用以下命令将ASCII字符附加到文件中: echo ??>>文件解决方案使用 echo -e"\ 012" ..

发布时间：2021-04-10 18:34:51 linux bash ascii echo non-ascii-characters 服务器开发

non-ascii-characters相关内容