gate相关内容
我一直在阅读文本分类,发现了几个可以用于分类的Java工具,但我仍然想知道:文本分类和句子分类一样吗! 有没有专注于句子分类的工具? 解决方案 “文本分类"和“句子分类"之间没有形式上的区别.毕竟,句子是一种文本.但一般来说,当人们谈论文本分类时,恕我直言,他们指的是更大的文本单元,例如一篇文章、评论或演讲.将政治家的演讲归类为民主党或共和党比将推文归类要容易得多.当每个实例有大量文
..
如果我在jape规则中写的单词出现在同一个句子中,我需要对句子的一部分进行注释.例如,这句话是“孩子无法抗拒对他的日常生活的任何改变".我在“trouble.lst"文件和“alteration.lst"文件中加入了诸如抵抗之类的词.现在在这句话中,我需要将“抵抗任何更改"部分注释为“A3b".我试过使用下面的代码,但它没有考虑同一句话中的单词.我的 jape 规则也是从不同的句子中提取单词.假设
..
可以使用 Java 进行文本简化的最佳工具是什么? 这是一个文本简化的例子: John 是一家公司的 CEO,他打高尔夫球.↓约翰打高尔夫球.约翰是一家公司的首席执行官. 解决方案 我认为您的问题是将复杂句或复合句转换为简单句的任务.基于文献Sentence Types,一个简单的句子是由一个独立条款.一个复合句和复合句至少由两个从句构成.此外,从句必须有主语和动词. 因此,您的任务
..
我正在创建一个用于查找共同引用文本的 GATE 应用程序.它工作正常,我已经通过 GATE 中提供的导出选项创建了应用程序的压缩文件. 现在我正在尝试在我的 Java 代码中使用相同的内容. Gate.runInSandbox(true);Gate.setGateHome(新文件(gateHome));Gate.setPluginsHome(new File(gateHome, "plu
..
大家好,我正在尝试解析我拥有的 XML 文件的这一部分.我遇到的问题是文本包含很多自关闭标签.我无法删除这些标签,因为它们为我提供了一些索引细节.如何在没有所有“节点"标签的情况下访问文本? A TEENAGER yesterday指责他的父母残忍每天喂他吃薯片,这会增加他的体重在 l2. 解决方案 这里
..
我如何检查一个句子是否包含组合?例如考虑句子.约翰被任命为Google的新首席执行官.我需要写一条规则来检查句子是否包含.我怎么能做到这一点.我尝试了以下.我需要检查字词前面是否有“新"字. 规则:CustomRules({句子包含{Lookup.majorType =="organization"},句子包含{Lookup.majorType =="jobt
..
在学习Gate时,遇到了以下问题: Minipar看到不受欢迎的字符(例如Ö,Ü,Ä)时会引发异常. 例如,句子""中的"Batten病(也称为Spielmeyer-Vogt-Sjögren-Batten病)是一种罕见的致命常染色体隐性神经退行性疾病,始于儿童期." (来自Wiki文章) Minipar停止工作之前得到的注释是“蝙蝠病(也称为Spielmeyer-Vogt-Sj"),恰
..
我需要通过添加/删除单词来教地名词典. 我知道如何添加新的Lookup ,但是何时我尝试将其删除,但尚未删除查找. gazetter.remove("string to be found"); // returns false 请帮助! 解决方案 (默认)地名词典中有两个单独的内容: 有限状态机,用于搜索源文本. 地名词典的 线性定义,它代表字典中所有单词的列
..
我开始学习GATE.我创建了具有功能的注释,但我想将其放入新的注释集中. 有人可以告诉我如何使用JAPE吗? 谢谢 解决方案 我在 http://sourceforge.net/p/gate/mailman/message/5348688/和因此,我想如果要使我的注释属于“关键"注释集,则应将“关键"放在Jape换能器的outputASName中. 感谢您的帮助,伊恩=)
..
我正在尝试一个JAPE代码段,并试图理解空间令牌的概念. Phase: Apple Input: Token SpaceToken Lookup Options: control = appelt Rule: Country ( {Token.string == "President"} {SpaceToken} {Lookup.majorType==loc
..
我正在创建用于查找共同参考文字的GATE应用.它工作正常,我已经通过GATE中提供的导出选项创建了应用程序的压缩文件. 现在,我正在尝试在Java代码中使用相同的代码. Gate.runInSandbox(true); Gate.setGateHome(new File(gateHome)); Gate.setPluginsHome(new File(gateH
..
我对NLP很陌生,并且正在使用GATE.如果我为大型数据集(包含7K +记录)运行代码,则会收到OOM异常.下面是发生异常的代码. /** * Run ANNIE * * @param controller * @throws GateException */ public void execute(SerialAnalyserController controller)
..
我正在使用GATE工具进行文本分析,并且在安装PR时出现以下错误- SLF4J:slf4j绑定所请求的1.5.6版本与[1.6,1.7]不兼容 现在,我已经在互联网上搜索了此内容,并找到了此内容 Mixing different versions of slf4j-api.jar and SLF4J binding can cause problems. For example,
..
我想以编程方式将新的Lookup添加到已加载的DefaultGazetteer中. 如果我通过文件添加此字符串,则效果很好 任何帮助都会受到欢迎.谢谢 String test="hello@code=555.5@code_asociated_description=World@code1=@code2=@code3=@code4=@code5=@code6=@code7="; g
..
我正在尝试使用Java中的GATE SUMMA.我正在尝试运行本教程中包含的文件.我分别下载了ANNIE和SUMMA插件.我不明白的是这部分在配置中. Gate.init(); // you have to register the plugins from GATE you want to use Gate.getCreoleRegist
..
使用PersistenceManager.loadObjectFromFile从光盘加载.gapp文件时,出现了“线程“主"中的异常" java.lang.OutOfMemoryError:Java堆空间"错误. 我将堆大小增加到最大2048M,并解决了该问题. 加载大量的.gapp文件时,是否有更好的替代方法来解决此问题. 解决方案 如果您使用的是默认垃圾回收器,我认为不会.它需要最大堆
..
我正在使用 GATE * SDK *,并且想要将 default ANNIE Gazetteer 修改为包括一个基于我创建的新列表定义的简单注释. 我已将列表定义添加到 GATE-HOME \ plugins \ ANNIE \ resources \ gazetteer 我在lists.def文件中添加了一个条目,以指向我的新列表文件.例如. * open_source_software
..
我正在将 Stanford POS标记器与 小示例代码: package tweet.nlp.test; import edu.stanford.nlp.tagger.maxent.MaxentTagger; public class TweetNLPTest { public static void main(String[] args) { String t
..
我有一个Word文档.我需要使用GATE匹配特定的表部分或标题部分.我想,是否有任何步骤可让我们首先检查标题的任何字体大小或字体样式,然后匹配其余内容,直到重复下一个标题模式. 解决方案 GATE 仅对 Apache Tika 和 Apache POI 库.我不知道有任何免费的替代方案...为此,我们在我的公司中开发了自己的插件(gate.DocumentFormat),但目前无法在外部使
..
我正在用Stanford NER(不是StanfordParser或StandfordPOSTagger)和Stanford NER(不是StanfordParser或StandfordPOSTagger)搜索GATE(文本工程通用体系结构).我在此处找到了一些有关插件的信息.但是我找不到默认情况下将它与GATE(版本8)集成的情况.我也尝试找到下载插件的链接,但找不到... 有人知道如何激
..