如何检查字符串的字符集? [英] How to check the charset of string?

查看:71
本文介绍了如何检查字符串的字符集?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

如何检查字符串的字符集是否为UTF8?

How do I check if the charset of a string is UTF8?

推荐答案

function is_utf8($string) {   
return preg_match('%^(?:  
[\x09\x0A\x0D\x20-\x7E] # ASCII  
| [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte  
| \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs  
| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte  
| \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates  
| \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3  
| [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15  
| \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16  
)*$%xs', $string);   

}

我已经检查过了。此功能有效。

I have checked. This function is effective.

这篇关于如何检查字符串的字符集?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆