transformer相关内容

src_mask 和 src_key_padding_mask 的区别

我很难理解变压器.一切都在一点一点地变得清晰,但让我头疼的一件事是src_mask 和 src_key_padding_mask 在编码器层和解码器层的前向函数中作为参数传递有什么区别. https://pytorch.org/docs/master/_modules/torch/nn/modules/transformer.html#Transformer 解决方案 src_mas ..
发布时间:2022-01-06 19:46:49 其他开发

如何使用 BertForMaskedLM 或 BertModel 计算句子的困惑度?

我想用 BertForMaskedLM 或 BertModel 来计算句子的困惑度,所以我写了这样的代码: 将 numpy 导入为 np进口火炬将 torch.nn 导入为 nn从变压器进口 BertTokenizer,BertForMaskedLM# 加载预训练模型(权重)使用 torch.no_grad():模型 = BertForMaskedLM.from_pretrained('hfl/ ..

如何在没有 IOB 标签的情况下使用 Hugging Face 的转换器管道重建文本实体?

我一直在寻找将 Hugging Face 的管道用于 NER(命名实体识别).但是,它以内-外-开始 (IOB) 格式返回实体标签,但 没有 IOB 标签.所以我无法将管道的输出映射回我的原始文本.此外,输出以 BERT 标记化格式进行屏蔽(默认模型为 BERT-large). 例如: 来自转换器导入管道nlp_bert_lg = 管道('ner')print(nlp_bert_lg('H ..

如何在 MLM 和 NSP 的新域上从头开始训练 BERT?

我正在尝试使用 HuggingFace 库使用我自己的数据集从头开始训练 BERT 模型.我想以一种具有原始 BERT 模型的确切架构的方式来训练模型. 在原始论文中,它指出:“BERT 接受了两项任务的训练:预测随机掩码标记 (MLM) 和预测两个句子是否紧跟 (NSP).SCIBERT 遵循与 BERT 相同的架构,但在科学文本上进行了预训练." 我试图了解如何在上述两个任务上训练 ..

gcc ON arm/android

我刚买了一个 EEE 垫变压器.就像我拥有的​​任何硬件一样,我想在上面安装一个 C 编译器.我知道我可以交叉编译,但我想在设备本身上进行开发.我在谷歌上搜索过,似乎只能找到有关如何为 x86/64 Linux 构建 arm 工具链的页面.想法? 解决方案 构建 gcc(等)以在您的目标上运行的过程应该类似于构建交叉编译器,除了您将: 需要有一个 ARM 交叉编译器,可以在您的(例如 ..
发布时间:2021-11-17 21:51:17 移动开发

java.lang.NoSuchMethodException: .(java.lang.String) 复制自定义 Transformer 时

目前正在使用 spark 2.0.1 和 2.2.1 在我的 spark-shell 中使用自定义转换器. 在编写自定义 ml 转换器时,为了将其添加到管道中,我注意到复制方法的覆盖存在问题. 复制方法在我的例子中被 TrainValidationSplit 的 fit 方法调用. 我得到的错误: java.lang.NoSuchMethodException: Custom. ..

如何预下载变压器模型

我想在flask应用程序中执行文本生成任务,并将其托管在Web服务器上,但是在下载GPT模型时,由于下载时间和内存过多,弹性beantalk管理的EC2实例崩溃了 来自transformers.tokenization_openai导入OpenAIGPTTokenizer从Transformers.modeling_tf_openai导入TFOpenAIGPTLMHeadModel模型= TFO ..

Java 1.6:javax.xml.transform.Transformer拒绝缩进包含换行符的xml字符串

我需要能够使用Java API漂亮地打印xml字符串,并且已经在Web上和在此特定网站上找到了针对此问题的多种解决方案.但是,尽管多次尝试使它与javax.xml.transform.Transformer一起使用,但到目前为止还是失败了. 当参数中的xml字符串在xml元素之间不包含任何换行符时,我下面提供的代码仅部分起作用.这只是不会做.我需要能够漂亮地打印任何东西,假设它格式正确且有效的xm ..
发布时间:2020-11-27 19:19:06 Java开发

无法在XPath中评估表达式

我使用XPath解析URL返回的XML文档,当我使用给定输入运行代码时,它可以工作,但是当将其输入作为用户输入时,则会引发异常。 代码: class { private String generalQuery =“ / / @ *“; method(){ System.out.println(“输入URL”); url = scan.nextLine(); URL ora ..
发布时间:2020-06-11 00:16:12 Java开发

java.lang.NoSuchMethodException:复制自定义Transformer时< Class>.< init>(java.lang.String)

当前正在使用spark 2.0.1和2.2.1在我的spark-shell中玩自定义变形金刚. 在编写自定义ml转换器时,为了将其添加到管道中,我注意到复制方法的覆盖存在问题. 在我的情况下,copy方法由TrainValidationSplit的fit方法调用. 我得到的错误: java.lang.NoSuchMethodException: Custom.( ..