glove相关内容

如何比较三个预先训练好的模型之间的余弦相似性?

我有两个语料库--一个是所有女性领导人的演讲,另一个是男性领导人的演讲。我想测试一个语料库中两个词之间的余弦相似度与另一个语料库中相同两个词之间的余弦相似度显著不同的假设。这样的t检验(或等价的)合乎逻辑且可行吗? 此外,如果两个语料库的余弦相似度不同,我如何检查第三个语料库中相同的两个单词之间的余弦相似度是否比第一个语料库或第二个语料库更相似? 推荐答案 当然有可能。在给定一定 ..
发布时间:2022-07-18 15:22:27 其他开发

手套和word2vec的主要区别是什么?

word2vec和手套有什么区别? 训练单词的两种方法都是嵌入的吗?如果是,那么我们如何才能同时使用两者? 推荐答案 是,它们都是训练单词嵌入的方法。它们都提供相同的核心输出:每个单词一个向量,这些向量以有用的方式排列。也就是说,向量的相对距离/方向大致符合人类对整体词汇关联性的看法,甚至在某些显著的语义维度上也符合关联性。 word2vec通过在训练语料库上重复迭代,对神经网络 ..
发布时间:2022-04-22 22:55:59 AI人工智能

是否可以在 pytorch 的嵌入层中仅冻结某些嵌入权重?

在 NLP 任务中使用 GloVe 嵌入时,数据集中的某些词可能不存在于 GloVe 中.因此,我们为这些未知词实例化随机权重. 是否可以冻结从 GloVe 获得的权重,并仅训练新实例化的权重? 我只知道我们可以设置:model.embedding.weight.requires_grad = False 但这会使新单词无法训练.. 或者有更好的方法来提取单词的语义.. ..
发布时间:2022-01-06 19:38:21 Python

改进现有的基本手套模型

我正在使用 GloVe 作为我研究的一部分.我已经从这里下载了模型.我一直在使用 GloVe 进行句子分类.我正在分类的句子特定于特定领域,比如一些 STEM 主题.但是,由于现有的 GloVe 模型是在通用语料库上训练的,因此对于我的特定任务,它们可能不会产生最佳结果. 所以我的问题是,我将如何加载重新训练的模型并在我自己的语料库上对其进行更多的重新训练以学习我的语料库的语义?如果可能的话 ..
发布时间:2021-06-07 20:37:09 其他开发

Glove6b50d解析:无法将字符串转换为浮点:'-'

我正在尝试通过Google Colab解析来自Kaggle的Glove6b50d数据,然后运行通过word2vec流程(对巨大的URL表示歉意-这是我找到的最快的链接).但是,我遇到了一个错误,在该错误中无法正确解析“-"标记,从而导致上述错误. 我已经尝试了几种方法来解决这个问题.我也研究了load_word2vec_format方法本身,并试图忽略错误,但是似乎没有什么不同.根据这些链接 ..
发布时间:2020-08-06 03:22:41 Python

在Keras-预训练词嵌入中平均句子的词向量

我是Keras的新手. 我的目标是为推文创建用于情感分析的神经网络多分类. 我使用了Keras中的Sequential来建立我的模型. 我想在模型的第一层(特别是gloVe)中使用预训练词嵌入. 这是我目前的模特: model = Sequential() model.add(Embedding(vocab_size, 300, weights=[embedding_ ..
发布时间:2020-08-06 03:15:28 Python

如何在Tensorflow 2.0 RNN中使用预训练的嵌入矩阵作为嵌入层中的初始权重?

我想使用预训练的GloVe嵌入作为RNN编码器/解码器中嵌入层的初始权重.该代码在Tensorflow 2.0中.只需将嵌入矩阵作为权重= [embedding_matrix]参数添加到tf.keras.layers.Embedding层就不会这样做,因为编码器是一个对象,我现在不确定现在将embedding_matrix有效地传递给此对象训练时间. 我的代码紧紧遵循Tensorflow 2 ..
发布时间:2020-05-18 00:49:25 其他开发

如何在我自己的语料库上训练GloVe算法

我试图遵循此. 但是我浪费了很多时间,最终却毫无用处. 我只想在自己的语料库(〜900Mb corpus.txt文件)上训练GloVe模型. 我下载了上面链接中提供的文件,并使用cygwin对其进行了编译(在编辑demo.sh文件并将其更改为VOCAB_FILE=corpus.txt之后.我应该保持CORPUS=text8不变吗?) 输出为: cooccurrence.bin cooc ..
发布时间:2020-05-18 00:47:36 其他开发