machine-translation相关内容
我正在尝试恢复检查点并预测不同的句子NMT Attention Model。在恢复检查点和预测时,我收到了胡言乱语的结果,并显示以下警告: Unresolved object in checkpoint (root).optimizer.iter: attributes { name: "VARIABLE_VALUE" full_name: "Adam/iter" chec
..
我已经构建了一个编码器-解码器的 Seq2Seq 模型.我想给它添加一个注意力层.我尝试添加注意层通过这个 但它没有帮助. 这是我没有注意的初始代码 # 编码器编码器输入=输入(形状=(无,))enc_emb = 嵌入(num_encoder_tokens,latent_dim,mask_zero = True)(encoder_inputs)编码器_lstm = LSTM(latent_
..
我需要计算 BLEU 分数来识别两个句子是否相似.我读过一些文章,主要是关于测量机器翻译准确性的 BLEU 分数.但我需要一个 BLEU 分数来找出相似性在同一种语言的句子之间[英语].(即)(两个句子都是英语).谢谢. 解决方案 好吧,如果你只是想计算 BLEU 分数,那很简单.将一个句子作为参考译文,将另一个作为候选译文.
..
其“自述"文件中的网址无效 (http://www.fjoch.com/mkcls.html 和 http://www.fjoch.com/GIZA++.html).有关于 giza++ 的好教程吗?或者是否有一些具有完整文档的替代方案? 解决方案 以下内容摘自我为课堂整理的教程.(注意:这假设您已在 *nix 系统上成功安装 GIZA++-v2.) 从包含已分词的平行句子的两个数据
..
我已经建立了编码器-解码器的Seq2Seq模型.我想在上面添加一个注意层.我尝试通过此方法添加关注层 但没有帮助. 这是我的初始代码,没有引起注意 # Encoder encoder_inputs = Input(shape=(None,)) enc_emb = Embedding(num_encoder_tokens, latent_dim, mask_zero = True)(e
..
我正在尝试翻译WooCommerce结帐页面上的单词. 我的网站是荷兰语,但他们的翻译效果很差,所以我想使用其他单词. 需要翻译的内容 它涉及以下行: "Totaal€469,38(inclusief€79,38 持久)" 用英语说: “总计469,38欧元(包括79,38欧元的税)" 这是一行订单总金额的总和.我想将"Belasting"一词翻译为"BTW".
..
有人知道是否有可能将一部分文本排除在Google翻译工具的处理范围之外吗? 此工具的一大优点是可以建议已经在其他上下文中翻译过的句子的翻译.但是,如果在文本中添加了任何其他脚注和/或备注,则不会将其识别为匹配项.我正在寻找一种将此类文本括在“括号"中的可能性,而该文本将被忽略. 例如,以下两个字符串应被视为相同: "This is one continuous sentence.
..
有人在Opennmt-py中翻译时知道如何获得比对权重吗?通常,唯一的输出是结果语句,我已经尝试为注意力权重找到调试标志或类似标志.到目前为止,我一直没有成功. 解决方案 您可以获取注意矩阵.请注意,它与 alignment (对齐)不同,后者是来自统计(而非神经)机器翻译的术语. github上的一个线程对此进行了讨论.这是讨论的摘录.当您从该模式获得翻译时,注意力将集中在attn
..
几个月前,我使用Python的goslate包将一堆法语文本翻译成英语.但是,当我今天早上尝试这样做时,该服务返回了一个错误: import goslate gs = goslate.Goslate() print gs.translate('hello world', 'de') Traceback (most recent call last): File "", l
..
“自述文件"中的Urls无效( http://www.fjoch.com/mkcls.html 和 http://www.fjoch.com/GIZA++.html ).有没有关于giza ++的好教程?还是有一些备有完整文档的替代品? 解决方案 以下内容摘自我正在为一个课程编写的教程. (注意:这假设您已经在* nix系统上成功安装了GIZA ++-v2.) 从两个数据文件开始,这
..
通常将自定义词典添加到机器翻译器中,以确保正确翻译了特定领域的术语.例如,当文档涉及数据中心时和文档涉及餐厅时,服务器一词应以不同的方式翻译. 对于转换器模型,这样做不是很明显,因为单词未按1:1对齐.我已经看过几篇关于这个主题的论文,但是我不确定哪一个是最好的.解决此问题的最佳做法是什么? 解决方案 恐怕您不能轻易做到这一点.您不容易将新单词添加到词汇表中,因为您不知道在训练过程中
..
我最近尝试使用Google的 seq2seq 来建立小型NMT系统.我设法使所有工作正常进行,但是我仍然想知道模型的历时和训练步骤之间的确切区别. 如果我没记错的话,一个时期包含多个训练步骤,并且一次处理完您的整个训练数据后就过去了.但是,当我查看Google自己的教程上的文档时,我不了解两者之间的区别NMT .请注意以下代码段的最后一行. export DATA_PATH= exp
..
我用SMT的短语提取算法编写了以下代码. GitHub # -*- coding: utf-8 -*- def phrase_extraction(srctext, trgtext, alignment): """ Phrase extraction algorithm. """ def extract(f_start, f_end, e_start
..
我们正在寻找一个开放源代码的机器翻译引擎,该引擎可以并入我们的本地化工作流程中.我们正在查看以下选项: 摩西(C ++) Joshua (Java) 短语(Java) 其中,Moses得到了社区的最广泛支持,并已被许多本地化公司和研究人员试用.实际上,我们的应用程序全部使用Java,因此我们倾向于使用基于Java的引擎.让您中的任何人都将Joshua或Phrasal用作工作流程的一
..
我正在关注如果您遵循字符级模型,则输入数据为3个暗淡部分:#sequences,#max_seq_len,#num_char,因为每个字符都是一次热编码的.当我按照本教程中的说明绘制模型的摘要时,我得到: Layer (type) Output Shape Param # Connected to
..
我正在使用Google翻译工具来翻译网页,并且该页面上还有一个iframe,但显然没有随该页面一起翻译. 有没有一种大家都知道的解决方法,所以我也可以翻译iframe吗? 解决方案 这是Google Translate的真正限制或政策.您无法重写iframe内容.但是您可以做的一件事是将iframe网址更改为以下翻译页面:
..
我想使用以下代码作为将用户输入翻译为英语的程序的基础。我收到错误“无法找到符号 - GoogleApi”。有人可以帮我弄清楚该做什么吗? import com.google.api.translate.Language; import com.google.api.translate.Translate; 公共类Main { public static void main(St
..
在Python中,我正在使用 NLTK的对齐模块 在并行文本之间创建单词对齐。对齐bitexts可能是一个耗时的过程,尤其是在相当多的语料库上完成时。最好在一天内进行批量对齐并稍后使用这些对齐。 从nltk导入IBMModel1作为ibm biverses = [AlignedSent对象列表] model = ibm(biverses,20) 打开(路径+“eng-taq_mo
..
什么API和数据集都可以在程序中使用到例如教自然语言在学习读/写,以帮助/听/讲第二语言?这些可能是网站或传统的API来字典,翻译服务,语言/概念影像协会,声音如口语单词或短语,电影或套烧录卡甲板。感兴趣的还有可能被震垮获取当地数据集为脱机使用的网站。 作为开始,我注意到了谷歌翻译API可以访问
..
我有我的JSON解析和显示结果的响应。是否有可能转换为其他语言如法语,印地文,德文? 当我浏览,我才知道谷歌停止了对2011年定为免费版本,并开始定价。有没有免费的版本,以响应文本转换成其他语言? code这块如下: TextView的文本; //创建一个ID。 JSONObject的jsono =新的JSONObject(数据); JSONArray jarray = jsono.
..