cjk相关内容

单词之间没有空格的语言词汇突破(例如,亚洲)?

我想用日文和中文文本以及任何其他语言进行MySQL全文搜索工作。问题在于这些语言和其他人通常在单词之间没有空白。当您必须在文本中键入相同的句子时,搜索没有用处。 我不能只在每个角色之间放一个空格,因为英语也必须工作。我想用PHP或MySQL解决这个问题。 我可以配置MySQL来识别应该是自己的索引单元的字符吗?是否有一个PHP模块可以识别这些字符,这样我就可以在索引周围引入空格? ..
发布时间:2018-04-16 16:18:21 PHP

在C#中转换zenkaku字符到hankaku,反之亦然

正如它在标题行中所说的那样,我想在C#中将全角字符转换为hankaku字符和副字符,但不知道如何去做。所以,说“ラーメン”到“ラーメン”,反过来说。 这是可以写在一个方法,根据输入的格式自动确定转换需要去的方法? 解决方案 您可以使用字符串.StrConv()方法通过包含对Microsoft.VisualBasic.dll的引用,或者您可以调用 private const uin ..
发布时间:2018-02-03 17:56:04 C#/.NET

使用不使用GhostScript嵌入的字体栅格化PDF

我需要从PDF生成JPEG。 JPEG必须基于Trim Box创建,而PDF的版本可以是1.3版本,并且需要额外的Pantone颜色,因此绝对需要叠印预览,因此只有GhostScript(和Rip当然可以处理它们)。 Photoshop,Image Magick和SIPS(OS X的脚本化图像处理系统)无法解决这两个问题(裁切裁切和复合处理叠印)。 我创建了一个应用程序栅格化我收到的PDF, ..
发布时间:2018-01-06 22:26:36 其他开发

使用PIL绘制多语言文本

我无法使用PIL绘制多语言文本。比方说,我想画的文字 - “ひらがな - 平假名,히라가나”。但是PIL的ImageDraw.text()函数一次只能使用一种字体,所以我不能正确绘制这些文本,因为它需要英文,日文和韩文字体。 我在想什么,我应该遍历每个字符,并确定自己使用每个字符的字体。但是我不禁想到,要做到这一点,一定要有一个更简单的方法。 我的方向是否正确?如果有更好的解决方案,可 ..
发布时间:2018-01-06 22:21:29 其他开发

斜体字体不适用于iOS 7上的中文/日文/韩文

我想在UITextView中设置斜体字体样式,但斜体字体不适用于iOS 7上的中文/日文/韩文。有人可以帮忙吗? 方案 因为在iOS上没有斜体样式的中文字体,所以你需要使用仿射 下面的代码给出了一个15°倾斜到 Heiti SC Medium $ b $ pre $ ,0,0); UIFontDescriptor * desc = [UIFontDescriptor fontDescri ..
发布时间:2018-01-06 22:08:50 移动开发

转换或提取TTC字体TTF - 如何?

我已经超过8小时试图制作 STHeiti Medium.ttc.zip 字体在Windows上工作。 但是我不能让它工作。是否有人能够使它在Windows上工作? 解决方案 假设Windows不知道如何处理TTC文件我真的很奇怪),如果你使用 fontforge ,你可以用简单的方法“拆分”组合字体。 p> 步骤如下: 下载文件。 b 解压缩(例如,解开“STHeiti ..
发布时间:2018-01-06 22:03:40 其他开发

使用`find`命令查找带有CJK字符的文件的正则表达式是什么?

我正在查找的文件格式为 cmn-我.flac ,其中CJK字符是可变的。 使用 find 命令,我应该使用什么正则表达式来查找名称中包含单个CJK字符的所有文件? 提示: 以下正则表达式找到所有那些有和没有 CJK字符: find ./ -regex'。* \ .. *'#ex:cmn-我.flac 然后: find ./ -regex“cmn ..
发布时间:2017-11-09 21:32:24 开发方法

中文编码问题同时列出文件

我正在使用中文 c $ c>的 Solaris10上运行Java应用程序。现在有一些中文文件名目录下的文件。当我做 files = new File(dir).list()其中“dir”是包含该中文文件的父目录,我得到结果文件名文件[0] as ????? (某些垃圾字符)。 我的程序 file.encoding 属性已经设置为 GBK ,我也做 Charset.isSupported(“G ..
发布时间:2017-08-17 01:26:07 Java开发

中文文件如何知道每个字符使用多少个字节?

我阅读了Joel的文章“绝对最小的每个软件开发人员绝对必须了解Unicode和字符集(没有借口!)“,但仍然不明白所有的细节。一个例子将说明我的问题。看下面这个文件: 替代文本http://www.yart.com.au/stackoverflow/unicode2.png 我已经用二进制编辑器打开文件,仔细检查第一个汉字旁边的三个a的最后一个: alt text http:// ..
发布时间:2017-08-16 20:13:17 开发方法

Django:如何向应用程序添加中文支持

我正在为在Django中编写的应用程序添加一个中文语言,而且我真的很难过。我花了半天时间尝试不同的方法,没有成功。 我的应用程序支持几种语言,这是 settings.py 文件的一部分: TIME_ZONE ='欧洲/都柏林' LANGUAGE_CODE ='en' LOCALES = ( #English ('en',u'English'), #Norwegian ..

中文文本在网页上无法正常显示

我向一个主要的英文网页添加了一些中文文本,并且无法正确显示字符。我已经在元内容类型标签的编码设置为UTF-8,我复制/粘贴我从一个Word文档发送的中文。文字仍然呈现如下: ÁπÅ,'î‰Π≠ÊñáÁàà 而不是汉字: 繁体中文版 我确定这是一个简单的修正,如何使这一发生。 非常感谢任何帮助。 解决方案 只是因为元标记说编码是UTF8,并不意味着内容UTF8。 ..
发布时间:2016-11-19 17:14:40 前端开发

在UTF-8设置不能使用的源代码中的汉字

这是场景: 我只能使用 char * 我的MS Visual C ++编译器必须设置为MBCS,而不是UNICODE,因为第三个字符串的数据类型不是 wchar_t * 我有使用MBCS的第三方源代码; 我尝试在打印机上打印需要获取字符串的字符,以便能够正确打印。 我应该如何处理这行代码,使代码正确: char * str =“你好”; 将它转换为十六进制序列?如果是,如何?非 ..
发布时间:2016-11-19 16:41:40 C/C++开发

获取带有汉字PHP的源代码

好吧,我放弃了。 我一直在搞乱所有我想到的从目标网站检索数据,其中包含繁体中文编码信息(charset = GB2312)。 我一直使用simple_html_parser像往常一样,但它似乎没有返回汉字,实际上我得到的是一些奇怪的问号嵌入菱形形状内。 (“ ѯ ؼ ֣ ”像这样) 声明php文件的编码没有 通过声明我是指: header('Content-Type' ..
发布时间:2016-11-19 16:32:31 PHP

问号而不是汉字

我想在网站上放置一些中文文本,但是一旦网页放在网上,而不是中文文本,我会看到一排问号。 我在WAMP服务器上测试了同一页面,然后将其放在网上(所有页面都有一个php扩展名)和汉字显示得很好,只有当从在线主机服务器请求页面时,我看到所有的问号。 页面包含(如果有帮助): !DOCTYPE html PUBLIC“ - // W3C // DTD HTML 4.01 // EN” ..
发布时间:2016-11-19 16:20:50 PHP

多字节字符集中的换行控制字符

我有一些Perl代码将新行和换行符转换为规范化形式。 输入文本是日语,因此会有多字节字符。 仍然可以逐个字节进行这种转换基础(我认为它目前做),或者我必须检测字符集和启用Unicode支持?换句话说,使用字节作为其字符集的一部分的流行编码(Shift-JIS,EUC-JP,UTF-8,ISO-2022-JP)可能被误认为ASCII控制字符? 我只需要CR和LF工作。 更新:添加 ..
发布时间:2016-11-19 16:14:18 其他开发

Android:如何删除汉字中的空格?

我在修剪汉字的空格时有问题。我尝试记录内容,下面是它的样子: 在textview中显示它时,它显示汉字,但问题是字符串前后的空格。有人可以帮我编码/解码这个?提前感谢。 编辑1:添加了结果屏幕截图。 strong> EDIT 2:添加了内容字符集作为响应。 HttpProtocolParams.setContentCharset(params,HTTP.UTF_8); ..
发布时间:2016-11-19 16:02:06 Java开发

如何在SQLExpress文本字段中插入汉字?

如何在SQLExpress文本字段中插入汉字?我使用VS 2008的SQL Express。当我添加汉字,通过我写的一个导入应用程序或通过粘贴他们在Visual Studio中的数据视图,他们最终作为问号。 $ b $在nchar / nvarchar / ntext类型的字段的INSERT / UPDATE语句中,在文本分隔符之前添加一个“N”: $ b $ b INSERT INTO my ..