transformer - IT屋-程序员软件开发技术分享社区

src_mask 和 src_key_padding_mask 的区别

我很难理解变压器.一切都在一点一点地变得清晰，但让我头疼的一件事是src_mask 和 src_key_padding_mask 在编码器层和解码器层的前向函数中作为参数传递有什么区别. https://pytorch.org/docs/master/_modules/torch/nn/modules/transformer.html#Transformer 解决方案 src_mas ..

发布时间：2022-01-06 19:46:49 pytorch transformer 其他开发

如何使用 BertForMaskedLM 或 BertModel 计算句子的困惑度?

我想用 BertForMaskedLM 或 BertModel 来计算句子的困惑度，所以我写了这样的代码: 将 numpy 导入为 np进口火炬将 torch.nn 导入为 nn从变压器进口 BertTokenizer，BertForMaskedLM# 加载预训练模型(权重)使用 torch.no_grad():模型 = BertForMaskedLM.from_pretrained('hfl/ ..

发布时间：2022-01-06 19:37:20 nlp pytorch transformer huggingface-transformers bert-language-model 其他开发

如何在没有 IOB 标签的情况下使用 Hugging Face 的转换器管道重建文本实体?

我一直在寻找将 Hugging Face 的管道用于 NER(命名实体识别).但是，它以内-外-开始 (IOB) 格式返回实体标签，但没有 IOB 标签.所以我无法将管道的输出映射回我的原始文本.此外，输出以 BERT 标记化格式进行屏蔽(默认模型为 BERT-large). 例如: 来自转换器导入管道nlp_bert_lg = 管道('ner')print(nlp_bert_lg('H ..

发布时间：2022-01-02 17:55:56 nlp tokenize transformer named-entity-recognition huggingface-transformers 其他开发

如何在 MLM 和 NSP 的新域上从头开始训练 BERT?

我正在尝试使用 HuggingFace 库使用我自己的数据集从头开始训练 BERT 模型.我想以一种具有原始 BERT 模型的确切架构的方式来训练模型. 在原始论文中，它指出:“BERT 接受了两项任务的训练:预测随机掩码标记 (MLM) 和预测两个句子是否紧跟 (NSP).SCIBERT 遵循与 BERT 相同的架构，但在科学文本上进行了预训练." 我试图了解如何在上述两个任务上训练 ..

发布时间：2021-12-27 17:05:21 deep-learning nlp bert-language-model huggingface-transformers transformer 其他开发

gcc ON arm/android

我刚买了一个 EEE 垫变压器.就像我拥有的任何硬件一样，我想在上面安装一个 C 编译器.我知道我可以交叉编译，但我想在设备本身上进行开发.我在谷歌上搜索过，似乎只能找到有关如何为 x86/64 Linux 构建 arm 工具链的页面.想法? 解决方案构建 gcc(等)以在您的目标上运行的过程应该类似于构建交叉编译器，除了您将: 需要有一个 ARM 交叉编译器，可以在您的(例如 ..

发布时间：2021-11-17 21:51:17 android gcc arm android-3.0-honeycomb transformer 移动开发

数据帧列中动态长度的 Pyspark 字符串数组为单热编码

我想转换包含以下字符串的列: ["ABC","def","ghi"]["Jkl","ABC","def"][“XYZ"，“ABC"] 变成这样的编码列: [1,1,1,0,0][1,1,0,1,0][0,1,0,0,1] pyspark.ml.feature 中是否有相关类? 编辑:在编码列中，第一个条目始终对应于值“ABC"等.1 表示存在“ABC"，而 0 表示相应行中不存在 ..

发布时间：2021-11-14 22:13:00 pyspark apache-spark-sql transformer 其他开发

java.lang.NoSuchMethodException: .(java.lang.String) 复制自定义 Transformer 时

目前正在使用 spark 2.0.1 和 2.2.1 在我的 spark-shell 中使用自定义转换器. 在编写自定义 ml 转换器时，为了将其添加到管道中，我注意到复制方法的覆盖存在问题. 复制方法在我的例子中被 TrainValidationSplit 的 fit 方法调用. 我得到的错误: java.lang.NoSuchMethodException: Custom. ..

发布时间：2021-11-14 21:12:11 scala apache-spark apache-spark-mllib pipeline transformer 其他开发

在 Java 中使用 Transformer 来实现 XSLT 的多个输出?

我目前正在尝试让我的代码在 xml 文件和 xsl 中调用 - 然后根据 xml 内容执行转换并输出多个结果文件. import javax.xml.transform.*;导入 javax.xml.transform.stream.StreamResult;导入 javax.xml.transform.stream.StreamSource;导入 java.io.File;导入 java.io ..

发布时间：2021-10-04 18:44:06 java xml xslt xslt-2.0 transformer Java开发

使用 StAXResult 调用 Transformer 时省略 XML 声明

我想将多个 XML 节点从源 XML 文件复制到目标文件.源文件和目标文件都非常大，所以我将使用 StAX.通常，我尝试处理的文件如下所示: 人员列表乔博客约翰多伊..等等... 目标文件应采用以下格式: 人员列表 ..

发布时间：2021-10-02 18:43:20 xml-parsing stax transformer 其他开发

使用在 Mali GPU 上完全委托 BERT 模型

我正在尝试使用 TensorflowLite 在 Mali GPU 上部署 BERT 和 Transformer 模型.但问题是TensorflowLite不支持这些模型中的一些操作，包括{CAST, GATHER, MUL, RESHAPE, UNPACK}.有谁知道我如何在 GPU 上委派这些操作?是否有任何其他 TensorflowLite 库可以支持嵌入式 GPU，特别是 Mali GPU ..

发布时间：2021-09-05 20:22:09 tensorflow tensorflow-lite bert-language-model transformer mali 其他开发

PyTorch:用于训练和测试/验证的不同前向方法

我目前正在尝试扩展基于 FairSeq/PyTorch 的模型.在训练期间，我需要训练两个编码器:一个使用目标样本，一个使用源样本. 所以当前的forward函数是这样的: def forward(self, src_tokens=None, src_lengths=None, prev_output_tokens=None, **kwargs):编码器输出 = self.encoder( ..

发布时间：2021-06-07 19:57:47 python-3.x neural-network pytorch transformer seq2seq 其他开发

如何预下载变压器模型

我想在flask应用程序中执行文本生成任务，并将其托管在Web服务器上，但是在下载GPT模型时，由于下载时间和内存过多，弹性beantalk管理的EC2实例崩溃了来自transformers.tokenization_openai导入OpenAIGPTTokenizer从Transformers.modeling_tf_openai导入TFOpenAIGPTLMHeadModel模型= TFO ..

发布时间：2021-05-08 19:20:55 machine-learning flask amazon-elastic-beanstalk transformer huggingface-transformers AI人工智能

保存时如何读写XML文件并将注释节点视为Java中的文本节点

我正在读取从外部系统检索到的Java XML文件，然后对其进行处理，最后将其保存在本地，然后再部署回去. 外部系统给我一个包含此节点的XML文件: GDPR_Management 问题是评论节点.当我读取文件然后将其保存时，结果如 ..

发布时间：2021-05-02 20:12:43 java xml dom transformer Java开发

Java 1.6:javax.xml.transform.Transformer拒绝缩进包含换行符的xml字符串

我需要能够使用Java API漂亮地打印xml字符串，并且已经在Web上和在此特定网站上找到了针对此问题的多种解决方案.但是，尽管多次尝试使它与javax.xml.transform.Transformer一起使用，但到目前为止还是失败了. 当参数中的xml字符串在xml元素之间不包含任何换行符时，我下面提供的代码仅部分起作用.这只是不会做.我需要能够漂亮地打印任何东西，假设它格式正确且有效的xm ..

发布时间：2020-11-27 19:19:06 java xml jdk1.6 indentation transformer Java开发

使用Transformer将Java中的org.w3c.dom.Document转换为String

我正在尝试使用Transformer将XML org.w3c.dom.Document转换为字符串： DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance（）; factory.setNamespaceAware（true）; DocumentBuilder builder = null; 试试 ..

发布时间：2020-10-25 20:24:51 java xml string dom transformer Java开发

数据帧列中动态长度的Pyspark字符串数组要进行一次热编码

我想转换一个包含如下字符串的列: ["ABC","def","ghi"] ["Jkl","ABC","def"] ["Xyz","ABC"] 进入这样的编码列: [1,1,1,0,0] [1,1,0,1,0] [0,1,0,0,1] pyspark.ml.feature中是否有针对该类的课程? 编辑:在编码列中，第一个条目始终对应于值"ABC"等.1表示存在 ..

发布时间：2020-09-04 19:24:07 pyspark apache-spark-sql transformer 其他开发

如何强制javax xslt转换器使用utf-8而不是html实体编码国家字符?

我正在研究应该使用某些样式表转换输出的过滤器.代码的重要部分如下所示: PrintWriter out = response.getWriter(); ... StringReader sr = new StringReader(content); Source xmlSource = new StreamSource(sr, requestSystemId); transformer.se ..

发布时间：2020-07-13 05:07:25 java xslt utf-8 entities transformer Java开发

BERT令牌重要性衡量问题.毕业无

我正在尝试通过比较令牌嵌入grad值来衡量BERT的令牌重要性.因此，要获得毕业证书，我已经复制了BertModel的2.8.0并进行了一些更改: huggingface transformers 2.8.0 BERT https://github.com/holdingface/transformers/blob/11c3257a18c4b5e1a3c1746eefd96f18035839 ..

发布时间：2020-06-18 19:31:31 deep-learning pytorch transformer huggingface-transformers 其他开发

无法在XPath中评估表达式

我使用XPath解析URL返回的XML文档，当我使用给定输入运行代码时，它可以工作，但是当将其输入作为用户输入时，则会引发异常。代码： class { private String generalQuery =“ / / @ *“; method（）{ System.out.println（“输入URL”）; url = scan.nextLine（）; URL ora ..

发布时间：2020-06-11 00:16:12 java xml exception xpath transformer Java开发

java.lang.NoSuchMethodException:复制自定义Transformer时< Class>.< init>(java.lang.String)

当前正在使用spark 2.0.1和2.2.1在我的spark-shell中玩自定义变形金刚. 在编写自定义ml转换器时，为了将其添加到管道中，我注意到复制方法的覆盖存在问题. 在我的情况下，copy方法由TrainValidationSplit的fit方法调用. 我得到的错误: java.lang.NoSuchMethodException: Custom.( ..

发布时间：2020-05-28 00:47:54 scala apache-spark apache-spark-mllib pipeline transformer 其他开发

transformer相关内容