如何使用R创建单词共现矩阵 [英] How to use R to create a word co-occurrence matrix
本文介绍了如何使用R创建单词共现矩阵的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我是河里的新手. 我有一组有关在线视频及其标签的数据. 数据看起来像
I am a newbie in r. I have a set of data about online videos and their tags. The data looks like
film tag1 tag2 tag3 tag4....
1 A B C D
2 A C F G
3 B D C X
我想创建一个矩阵,告诉我标签的同时出现,例如:
I want to create a matrix which tells me the co-occurrence of the tags, such as:
A B C D .....
A 10 13
B 15 2
C 3 16
D 9 20
我应该怎么做?
推荐答案
如果我了解您想要的是一种方法:
If I understand what you want here is one way:
dat <- read.table(text='film tag1 tag2 tag3 tag4
1 A B C D
2 A C F G
3 B D C X', header=T)
library(qdapTools)
crossprod(as.matrix(mtabulate(as.data.frame(t(dat[, -1])))))
给予:
A B C D F G X
A 2 1 2 1 1 1 0
B 1 2 2 2 0 0 1
C 2 2 3 2 1 1 1
D 1 2 2 2 0 0 1
F 1 0 1 0 1 1 0
G 1 0 1 0 1 1 0
X 0 1 1 1 0 0 1
这篇关于如何使用R创建单词共现矩阵的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文