主题建模-为主题分配可读标签 [英] Topic Modelling - Assign human readable labels to topic

查看:63
本文介绍了主题建模-为主题分配可读标签的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想为主题建模的结果分配人类可读的标签. 我是否可以使用将这些关键字作为输入并返回标题以描述主题的软件库或数据集.

I want to assign human readable labels to the results of my topic modelling. Is there any software library or data set that I can use that takes these key words as an input, and returns a title to describe the topic.

示例:

输入:["Church","Priest","God","Prayer"]

输出:"Religion"

注意:我要自动创建标签-不能像其他人以前问过的那样手动制作标签.

Note: I want automatic label creation - Not manual like others have asked before.

推荐答案

请参见本文由Jey Han Lau撰写.他介绍了如何使用不同的来源和功能自动生成标签.

See this paper by Jey Han Lau. He describes how to automatically generate labels using different sources and features.

我们生成了一组候选标签 从排名最高的主题词来看,维基百科的标题 包含排名最高的主题字词的文章,以及 也是从 维基百科文章标题.我们对标签候选人进行排名 结合使用关联度量,词汇 功能和信息检索功能.

We generate a set of label candidates from the top-ranking topic terms, titles of Wikipedia articles containing the top-ranking topic terms, and also a filtered set of sub-phrases extracted from the Wikipedia article titles. We rank the label candidates using a combination of association measures, lexical features and an Information Retrieval feature.

这篇关于主题建模-为主题分配可读标签的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆