如何从文本中提取表情符号,然后将其添加到新的专栏中? [英] How to extract emojis from text and then add them to a new column?

查看:0
本文介绍了如何从文本中提取表情符号,然后将其添加到新的专栏中?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想知道如何从文本中提取所有表情符号,然后将它们添加到新的栏中,同时从原始文本中删除它们--如果这有意义的话。

例如,考虑以下数据:

ID 文本
1 这是很好的💯
2 太爱你了😍❤️
3 你让我难过!😥

这是我的预期输出:

ID 文本 表情符号
1 这很好 💯
2 太爱你了 😍❤️
3 你让我难过! 😥

到目前为止,我已经尝试了this解决方案,但它对我不起作用,因为它不会从原始文本中删除表情符号。

任何有关如何执行此操作的帮助都将是非常好的。

谢谢!

推荐答案

以下内容应该可以满足您的需求:

import pandas as pd
import emoji as emj

EMOJIS = emj.UNICODE_EMOJI["en"]

df = pd.DataFrame(
    data={
        "text": [
            "This is good 💯",
            "Loving you so much 😍 ❤️",
            "You make me sad! 😥",
        ]
    }
)

def extract_emoji(df):
    df["emoji"] = ""
    for index, row in df.iterrows():
        for emoji in EMOJIS:
            if emoji in row["text"]:
                row["text"] = row["text"].replace(emoji, "")
                row["emoji"] += emoji

extract_emoji(df)
print(df.to_string())
           text                  emoji
0      This is good               💯
1      Loving you so much  ️       ❤️😍
2      You make me sad!           😥

请注意,extract_emoji会原地修改DataFrame

这篇关于如何从文本中提取表情符号,然后将其添加到新的专栏中?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆