如何使用R创建单词共现矩阵 [英] How to use R to create a word co-occurrence matrix

查看:144
本文介绍了如何使用R创建单词共现矩阵的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我是河里的新手. 我有一组有关在线视频及其标签的数据. 数据看起来像

I am a newbie in r. I have a set of data about online videos and their tags. The data looks like

film  tag1 tag2 tag3 tag4....
1      A    B    C    D
2      A    C    F    G 
3      B    D    C    X 

我想创建一个矩阵,告诉我标签的同时出现,例如:

I want to create a matrix which tells me the co-occurrence of the tags, such as:

       A    B   C    D .....
A     10    13
B     15    2
C      3    16
D     9     20

我应该怎么做?

推荐答案

如果我了解您想要的是一种方法:

If I understand what you want here is one way:

dat <- read.table(text='film  tag1 tag2 tag3 tag4
1      A    B    C    D
2      A    C    F    G 
3      B    D    C    X', header=T)

library(qdapTools)
crossprod(as.matrix(mtabulate(as.data.frame(t(dat[, -1])))))

给予:

  A B C D F G X
A 2 1 2 1 1 1 0
B 1 2 2 2 0 0 1
C 2 2 3 2 1 1 1
D 1 2 2 2 0 0 1
F 1 0 1 0 1 1 0
G 1 0 1 0 1 1 0
X 0 1 1 1 0 0 1

这篇关于如何使用R创建单词共现矩阵的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆