将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列 [英] Applying SpaCy's EntityRecognizer to a column within a Pandas dataframe

查看:60
本文介绍了将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个基于文本的数据集,我希望将 SpaCy 的 EntityRecognizer 应用于特定列的每一行.

I have a text based dataset where I am looking to apply SpaCy's EntityRecognizer to each row for a specific column.

我可以通过执行以下操作来应用一般的 spaCy 管道:

I can apply the general spaCy pipeline by doing something like this:

df['new_col'] = df['col'].apply(lambda x: nlp(x))

df['new_col'] = df['col'].apply(lambda x: nlp(x))

如何仅应用实体识别器并获取其值?

How do I just apply just the entity recongnizer and get its values?

推荐答案

在 Spacy 中,文档有一个属性 .ents 巫婆在其命名实体上返回一个生成器.

In Spacy a doc have a attribute .ents witch return a generator on its named entities.

所以你可以使用:

df['new_col'] = df['col'].apply(lambda x: list(nlp(x).ents))

这篇关于将 SpaCy 的 EntityRecognizer 应用于 Pandas 数据框中的列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆