使用gensim隐含狄利克雷分布算法中聚类 [英] Clustering using Latent Dirichlet Allocation algo in gensim

查看:491
本文介绍了使用gensim隐含狄利克雷分布算法中聚类的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

是否有可能做聚类gensim使用LDA一组给定的输入?我该如何去做?

Is it possible to do clustering in gensim for a given set of inputs using LDA? How can I go about it?

推荐答案

LDA产生在语料库中的文档的低维重presentation。为了这种低-D再presentation,你可以申请一个聚类算法,例如: K-手段。由于各轴对应一个主题,一个简单的方法是赋予每个文档的话题其上的投影是最大的。

LDA produces a lower dimensional representation of the documents in a corpus. To this low-d representation you could apply a clustering algorithm, e.g. k-means. Since each axis corresponds to a topic, a simpler approach would be assigning each document to the topic onto which its projection is largest.

这篇关于使用gensim隐含狄利克雷分布算法中聚类的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆