从文本中删除表情符号也删除日语 [英] Removing emoji from text remove also Japanese language

查看:124
本文介绍了从文本中删除表情符号也删除日语的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我使用以下代码:

import re

def replace_emoji_space(string):
    emoji_pattern = re.compile("["
                       u"\U0001F600-\U0001F64F"  # emoticons
                       u"\U0001F300-\U0001F5FF"  # symbols & pictographs
                       u"\U0001F680-\U0001F6FF"  # transport & map symbols
                       u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                       u"\U00002702-\U000027B0"
                       u"\U000024C2-\U0001F251"
                       "]+", flags=re.UNICODE)
    return emoji_pattern.sub(r' ', string)

当字符串=='趣味でバルーンひねってます'
时,结果只是一个空字符串,为什么?

While string == '趣味でバルーンひねってます' the results is just an empty string, why ?

这是我在pycharm中得到的内容:
输入字符串pyhon

This is what I get in pycharm: string in pyhon

推荐答案

import re

def replace_emoji_space(string):
    emoji_pattern = re.compile("["
                       u"\U0001F600-\U0001F64F"  # emoticons
                       u"\U0001F300-\U0001F5FF"  # symbols & pictographs
                       u"\U0001F680-\U0001F6FF"  # transport & map symbols
                       u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                       "]+", flags=re.UNICODE)
    return emoji_pattern.sub(r' ', string)

最后2个删除了日语

这篇关于从文本中删除表情符号也删除日语的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆