cjk相关内容

Python CSV文件UTF-16到UTF-8打印错误

网络上有很多关于此问题的主题,但是我似乎找不到适合我具体情况的答案。 我有一个CSV文件。我不确定对其做了什么,但是当我尝试打开它时,我得到了: UnicodeDecodeError:'utf8'编解码器无法解码位置0的字节0xff:无效的起始字节 这里是完整的 Traceback : 跟踪(最近一次通话): 文件“ keywords.py”,第31行,在 ..
发布时间:2020-10-01 21:12:42 Python

数据库如何对汉字排序?

我当前正在编写一个Web应用程序,需要对一组汉字进行一些排序,我想知道汉字是否按数据库排序,如果可以的话,如何对它进行排序? 作为参考,我将使用PostgreSQL。 解决方案 PostgreSQL使用操作系统区域设置对文本进行排序设施。这与 sort 之类的操作系统工具所提供的完全相同。因此,在初始化数据库系统时,请将语言环境设置为有用的内容,例如 zh_HK.utf8 。 ..
发布时间:2020-10-01 21:12:39 其他开发

如何转换成韩文缩写

您好,我正在使用韩国的Android应用程序。 在这里,我实现了一个带有字母部分标题的列表视图来显示联系人。我使用String类的substring方法获取第一个字母作为节标题。对于韩国人,我也使用子字符串方法获取首字母。在这里,我需要将韩语首字母显示为Korean contactㄷㄹㅎㅎㅍㅍㅎ。我真的不知道韩国联系人列表中的哪个首字母与这些韩国首字母匹配。 所以请帮助我如何做或给我参 ..
发布时间:2020-10-01 21:12:35 Java开发

处理韩文断字

我正在建立一个显示朝鲜文字的网站。客户(美国本地人)非常不高兴,因为文本在单词中间被打断了。例如,这是一个图像:红色背景文本是一个单词。 我尝试使用 断字:全部保留; ,但Chrome / Safari不支持。 我能做什么?我在网上搜索了几个小时,却一无所获。这是cjk网站中所期望的东西,还是我找不到的解决方案? 这是一个响应网站,所以我不能费劲 ..
发布时间:2020-10-01 21:12:31 前端开发

具有核心文字的自定义UITableViewCell

在@yaslam的帮助下,我在Core Text中创建了一个UILabel,可以使用Furigana使用CTRubyAnnotation以水平和垂直方式显示日语文本。不幸的是,我有一个问题。我需要在自定义单元格中使用此标签,并且需要该单元格根据文本动态调整单元格的高度。但不起作用细胞不会膨胀 你能帮我吗? 非常感谢 这里的代码 import UIKit 协议Simp ..
发布时间:2020-10-01 21:12:26 移动开发

当系统语言为英文时,显示日文中文字母而不是中文样式的中文字母

我的问题与此类似(在日语中显示日语而不是中文一个textview ),但有些不同。提议的解决方案是在应用程序中嵌入日语字体。 但是我不想在应用程序中嵌入日语字体,因为这会增加应用程序的大小,我将不得不购买昂贵的字体许可。看来Android模拟器(Android 8.1)已经具有日语字体。如何使用它,而不是嵌入字体? 我的意思是,当我将系统语言更改为日语时,它是这样的: 但是,当系 ..
发布时间:2020-10-01 21:12:18 移动开发

如何将utf8转换为std :: string?

我正在处理此代码,该代码接收到一个cpprest sdk响应,该响应包含一个base64_encoded有效负载,它是一个json。这是我的代码段: typedef std :: wstring string_t; //在cpprest lib中的basic_types.h中定义lib void demo(){ http_response response; //用于处理resp ..
发布时间:2020-10-01 21:11:10 C/C++开发

被各种分隔符分割,同时保留分隔符?

我想分割文本 过公元年?因为无论你如何选择。简体字危及了对古代文学的研究输入! 使用这三个(或更多)?!。字符作为分隔符。 i当然可以使用 $ lines = preg_split('/[。,!,?]/ u',$ body); 但是我不想让结果行保留其结束定界符。 啊。。。或什么!?? !!!! 解决方案 尝试一下: $ lines = preg_spli ..
发布时间:2020-10-01 21:11:07 PHP

显示韩文字符-iOS App

我正在尝试在我的iPhone应用程序中显示韩语文本。该应用程序将一个字母的Unicode一对一地附加到NSMutableString上,并在每个字母附加后在屏幕上显示该字符串。 我知道有一些连接规则字母(Jamo)。 是否具有将所有这些规则自动应用到字母字符串的功能,还是我需要编写代码进行更改(例如,更改如果前面有元音,则与尾辅音相辅相成)? 解决方案 FCA。是您发邮件给我的 ..
发布时间:2020-10-01 21:10:59 移动开发

日语Windows OS上的C#应用​​程序-以全角字符显示拉丁语

我有一个C#winform应用程序,该应用程序安装在日语Windows 7上。 有些标签显示的字体非常宽,导致它们的字体大小不正确。 经过一些研究,我被告知可能是半角/全角问题。 是否有任何办法可以强制所有字符串显示为半角宽度? 例如,此部分显示不正确: modelSizeLabel.Text = String.Format(“ X:{0:0.0},Y:{1:0.0},Z: ..
发布时间:2020-10-01 21:10:44 C#/.NET

如何在Perl中使用正则表达式计算文件中的中文单词?

我尝试按照perl代码对文件的中文单词进行计数,这似乎可以正常工作,但并没有得到正确的结果。非常感谢您的帮助。 错误消息是 使用在字符串(_)或word_counting.pl第21行的字符串中未初始化的值$ valid的第21行。 总和= 125,有效词= 在我看来,这是问题所在是文件格式。 “总值”是125,即字符串数(125行)。最奇怪的部分是我的 ..
发布时间:2020-10-01 21:10:42 其他开发

如何在Ruby正则表达式中匹配韩文字符?

我对使用正则表达式的用户名进行了一些基本验证,例如 [\w -_] + ,我想添加对韩文字母的支持,同时 我不想允许特殊字符,例如 {} []!@#$%^& ; *()等,我只想将 \w 替换为与给定字母匹配的内容,除了 [a-zA-Z0-9] 。 这表示用户名,例如안녕应该是有效的,但不是안녕[] 。 我需要在Ruby 1.9中做到这一点。 / p> 解决方案 您 ..
发布时间:2020-10-01 21:10:35 其他开发

识别文本为简体中文还是繁体中文

给出一个已知为中文并以UTF-8编码的文本块,有没有办法确定它是简体还是繁体? 解决方案 我不知道这是否行得通,但我会尝试使用iconv来查看它是否可以在字符集之间正确转换,并将同一转换的结果与// TRANSLIT和// IGNORE进行比较。如果两个结果匹配,则字符集转换未遇到任何无法翻译的字符,因此您应该匹配。 $ test1 = iconv(“ UTF-8”,“ big5 ..
发布时间:2020-10-01 21:09:33 PHP

用Ruby将unicode转换为字符

我找到了一个用unicode编写的汉字字典。我正在尝试从这本词典中建立一个字符数据库,但是我不知道如何将unicode转换为字符。. p“国” .unpack(“ U *”)。first #this使unicode 22269 如何将 22269 转换回与上一行相反的字符值。 解决方案 [22269] .pack('U *')#=> “国”或“ \345\233\ ..
发布时间:2020-10-01 21:09:31 其他开发

在VB6中的PRINTER上进行Unicode打印

我正在尝试在打印机(实际上是PDFCreator)上打印Unicode(中文)字符串,但是我得到的只是垂直打印的字符。 我使用从 gdi32.dll 导入的 TextOutW 函数: TextOutW dest.hDC,x,y,StrConv(szText,vbUnicode),Len(szText) 如果我尝试打印“ 0.12”(如果我打印汉字,无论如何我都会得到相 ..
发布时间:2020-10-01 21:09:21 其他开发

日语ASCII码

在哪里可以获得与日语汉字,平假名和片假名字符相对应的ASCII码列表。我正在做一个Java函数和Javascript来确定它是否是日语字符。 解决方案 ASCII 代表美国信息交换标准代码,仅包含128个字符(甚至不是所有字符都可以打印),并且是基于大约1960年美国使用的需求。 我相信您希望 Unicode 代码点,用于某些字符,您可以在unicode.org提供的图表。 ..
发布时间:2020-10-01 21:08:10 其他开发

验证活动记录回调中的日语字符

我有一个日语项目,需要验证半角和全角日语字符,半角允许14个字符,全角允许7个字符。 现在在我的模型上 class客户 validates_length_of:name,:maximum => 14 结束 不是一个好选择 我当前正在使用ror 2.3.5 可以使用全角和半角 解决方案 以下代码可能只是将您推送到行上方,以满足您到目前为止在尽可能 ..
发布时间:2020-10-01 21:06:55 其他开发

日语的空白字符是什么?

我需要分割一个字符串并提取用空格字符分隔的单词。来源可能是英语或日语。英文空格字符包括制表符和空格,而日语文本也使用这些字符。 (IIRC,所有广泛使用的日语字符集都是US-ASCII的超集。) 因此,我用来分割字符串的字符集包括正常的ASCII空间。 但是,在日语中,还有另一个空格字符,通常称为“全角空格”。根据我的Mac的Character Viewer实用程序,这是U + 300 ..
发布时间:2020-10-01 21:06:49 其他开发