如何从文本中提取表情符号,然后将其添加到新的专栏中? [英] How to extract emojis from text and then add them to a new column?
本文介绍了如何从文本中提取表情符号,然后将其添加到新的专栏中?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我想知道如何从文本中提取所有表情符号,然后将它们添加到新的栏中,同时从原始文本中删除它们--如果这有意义的话。
例如,考虑以下数据:
ID | 文本 |
---|---|
1 | 这是很好的💯 |
2 | 太爱你了😍❤️ |
3 | 你让我难过!😥 |
这是我的预期输出:
ID | 文本 | 表情符号 |
---|---|---|
1 | 这很好 | 💯 |
2 | 太爱你了 | 😍❤️ |
3 | 你让我难过! | 😥 |
到目前为止,我已经尝试了this解决方案,但它对我不起作用,因为它不会从原始文本中删除表情符号。
任何有关如何执行此操作的帮助都将是非常好的。
谢谢!
推荐答案
以下内容应该可以满足您的需求:
import pandas as pd
import emoji as emj
EMOJIS = emj.UNICODE_EMOJI["en"]
df = pd.DataFrame(
data={
"text": [
"This is good 💯",
"Loving you so much 😍 ❤️",
"You make me sad! 😥",
]
}
)
def extract_emoji(df):
df["emoji"] = ""
for index, row in df.iterrows():
for emoji in EMOJIS:
if emoji in row["text"]:
row["text"] = row["text"].replace(emoji, "")
row["emoji"] += emoji
extract_emoji(df)
print(df.to_string())
text emoji
0 This is good 💯
1 Loving you so much ️ ❤️😍
2 You make me sad! 😥
请注意,extract_emoji
会原地修改DataFrame
。
这篇关于如何从文本中提取表情符号,然后将其添加到新的专栏中?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文