如何提取或preg_place字符串中的中文字符? [英] How can I extract or preg_replace chinese characters in a string?

查看:30
本文介绍了如何提取或preg_place字符串中的中文字符?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我当前有一个字符串列表,如下所示

蘋果,香蕉,橙。
榴蓮, 啤梨
鳳爪,排骨,雞排
24個男,2個女,30個老人

我想要做的就是从这些字符串中分解出所有中文和字母数字字符。 如何将,/"和空格等所有特殊字符替换为-_

然后用explode()LIKE$str = explode("-",$str);$str = explode("_",$str);提取所有汉字?

我目前有这样的RegEx

 if(/^S[u0391-uFFE5 w]+S$/.test(value)).....

我将其修改为

 $str = preg_replace("/^S[x{0391}-x{FFE5} w]+s+S$/u", "-", $str);

但似乎没有起作用.

在线示例:https://www.regex101.com/r/qR8aA6/1

编辑:我的预期输出(第一个字符串):

首先应替换为

蘋果-香蕉-橙-蘋果_香蕉_橙_

然后我可以用$str = explode("-",$str);使它们最终变成:

Array
    (
     [0] => 蘋果
     [1] => 香蕉
     [2] => 橙
     )

推荐答案

您似乎想要这样的东西,

$txt = <<<EOT
蘋果,香蕉,橙。
榴蓮, 啤梨
鳳爪,排骨,雞排
24個男,2個女,30個老人
EOT;
echo preg_replace('~[^p{L}p{N}
]+~u', '-', $txt);

输出:

蘋果-香蕉-橙-
榴蓮-啤梨
鳳爪-排骨-雞排
24個男-2個女-30個老人

DEMO

说明:

  • p{L}匹配来自任何语言的任何种类的字母。
  • p{N}匹配任何脚本中的任何种类的数字字符。
  • 匹配换行符。
  • 将所有内容放入求反的字符类将执行相反的操作。

这篇关于如何提取或preg_place字符串中的中文字符?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆