培训期间的损失不会减少(Word2Vec，Gensim) [英] Loss does not decrease during training (Word2Vec, Gensim)

查看：229 发布时间：2020/11/13 6:18:27 python gensim word2vec loss

本文介绍了培训期间的损失不会减少(Word2Vec，Gensim)的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

每个时期增加model.get_latest_training_loss()会导致什么损失?

What can cause loss from model.get_latest_training_loss() increase on each epoch?

用于培训的代码:

class EpochSaver(CallbackAny2Vec):
    '''Callback to save model after each epoch and show training parameters '''

    def __init__(self, savedir):
        self.savedir = savedir
        self.epoch = 0

        os.makedirs(self.savedir, exist_ok=True)

    def on_epoch_end(self, model):
        savepath = os.path.join(self.savedir, "model_neg{}_epoch.gz".format(self.epoch))
        model.save(savepath)
        print(
            "Epoch saved: {}".format(self.epoch + 1),
            "Start next epoch ... ", sep="\n"
            )
        if os.path.isfile(os.path.join(self.savedir, "model_neg{}_epoch.gz".format(self.epoch - 1))):
            print("Previous model deleted ")
            os.remove(os.path.join(self.savedir, "model_neg{}_epoch.gz".format(self.epoch - 1))) 
        self.epoch += 1
        print("Model loss:", model.get_latest_training_loss())

    def train():

        ### Initialize model ###
        print("Start training Word2Vec model")

        workers = multiprocessing.cpu_count()/2

        model = Word2Vec(
            DocIter(),
            size=300, alpha=0.03, min_alpha=0.00025, iter=20,
            min_count=10, hs=0, negative=10, workers=workers,
            window=10, callbacks=[EpochSaver("./checkpoints")], 
            compute_loss=True
    )

输出:

从时期(1到20)丢失:

Losses from epochs (1 to 20):

Model loss: 745896.8125
Model loss: 1403872.0
Model loss: 2022238.875
Model loss: 2552509.0
Model loss: 3065454.0
Model loss: 3549122.0
Model loss: 4096209.75
Model loss: 4615430.0
Model loss: 5103492.5
Model loss: 5570137.5
Model loss: 5955891.0
Model loss: 6395258.0
Model loss: 6845765.0
Model loss: 7260698.5
Model loss: 7712688.0
Model loss: 8144109.5
Model loss: 8542560.0
Model loss: 8903244.0
Model loss: 9280568.0
Model loss: 9676936.0

我在做什么错了?

语言阿拉伯语. 作为DocIter的输入-带有令牌的列表.

Language arabian. As input from DocIter - list with tokens.

培训期间的损失不会减少(Word2Vec，Gensim) [英] Loss does not decrease during training (Word2Vec, Gensim)

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录关闭

培训期间的损失不会减少(Word2Vec，Gensim) [英] Loss does not decrease during training (Word2Vec, Gensim)

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

登录关闭