sentence相关内容
我正在使用Spacy对使用段落编号的文本进行句子切分,例如: text = '3. English law takes a dim view of stealing stuff from the shops. Some may argue that this is a pity.' 我正在尝试强制Spacy的句子分割器不要将3.拆分成它自己的句子。 目前,以下代码返回三个单独的句子
..
如何将文档(如段落、书籍等)拆分成句子。 例如"The dog ran. The cat jumped"into["The dog ran", "The cat jumped"]with spacy? 推荐答案 最新答案如下: from __future__ import unicode_literals, print_function from spacy.lang.en
..
这是一个 NLP 问题,我想知道我应该如何进行. 问题有多难?我可以用同义词替换这个词并检查语法是否正确吗? 解决方案 用同义词替换单词可能是首先要尝试的事情,但要注意不要错过多个单词的表达和习语.此外,请确保选择具有相同词性的同义词. 他们寻找一个好的解决方案 他们查看/盯着/...寻找一个好的解决方案 他们努力工作他们的工作/任务/......很难
..
我有许多 PDF 文档,我已将它们读入带有库 tm 的语料库中.如何将语料库分解成句子? 这可以通过使用readLines 后跟sentSplit 从包qdap [*] 读取文件来完成.该功能需要一个数据框.它还需要放弃语料库并单独读取所有文件. 如何通过 tm 中的语料库传递函数 sentSplit {qdap}?或者有更好的方法吗? 注意:在库openNLP中有一个函数sen
..
我正在尝试将莫尔斯电码翻译成单词和句子,一切正常……除了一件事.我的整个输出都是小写的,我希望能够将每个句子的第一个字母大写. 这是我当前的代码: text = input()如果 is_morse(text):lst = text.split(" ")文字 = ""对于 lst 中的 e:文本 += TO_TEXT[e].lower()打印(文本) 拆分列表中的每个元素都等于一个字符
..
我是 Spacy 和 NLP 的新手.我在使用 Spacy 进行句子分割时遇到以下问题. 我试图标记为句子的文本包含编号列表(编号和实际文本之间有空格),如下所示. import spacynlp = spacy.load('en_core_web_sm')text = "这是第一句话.\n接下来是编号列表.\n1.世界你好!\n2.你好 World2!\n3.世界你好!"text_sen
..
我要反转字符串中的单词.我觉得我正朝着正确的方向前进.但我一直得到不稳定的输出,不禁认为这与我的 strncat() 函数有关.你们中的任何人是否看到任何问题,我已经决定处理它.我愿意接受其他方法的建议. int main(){int ch, ss=0, s=0;字符 x[3];char *word, string1[100], string2[100], temp[100];x[0]='y';
..
初学者的问题,但我对此有点困惑.希望这个问题的答案也能让其他 NLP 初学者受益. 以下是更多详细信息: 我知道你可以从 word2vec 生成的词向量计算句子向量.但是制作这些句子向量所涉及的实际步骤是什么?谁能提供一个直观的例子,然后进行一些计算来解释这个过程? 例如:假设我有一个包含三个词的句子:今天很热.并假设这些词的假设向量值为:(1,2,3)(4,5,6)(7,8,9
..
我正在尝试开发数据库的自然语言接口,我只是想知道是否有一个库或 API (Java) 可用于将问题(疑问句)转换为命令(命令式)句). 例如:来自“哪些员工出生于 1970 年之前?"以“让员工在 1970 年之前出生." 解决方案 这是一个相当复杂且重要的问题.但是,如果您的域有限(员工数据库查询等)并且您只希望将有限的话语集作为输入,您可以构建一个简单的基于规则的系统. 最
..
我整天都在互联网上度过,但是我无法在Win-Prolog中找到任何可以断定字符串中每个单词的内置谓词. 示例: |-读(X).|:“这是一个字符串".X ='这是一个字符串'. 是否有任何我可以使用的谓词可以帮助我,挑出字符串中的每个单词?喜欢 A =此B =是C = aD =字符串 或列表 A = [这是一个字符串] 有可能吗? 解决方案 在Win-Prol
..
我正在使用模块bert-for-tf2来将BERT模型包装为Tensorflow 2.0中的Keras层.我已经按照您的指南将BERT模型实现为Keras层. 我正在尝试从句子中提取嵌入内容;在我的情况下,句子是“你好" 我对模型预测的输出有疑问;我已经写了这个模型: model_word_embedding = tf.keras.Sequential([
..
我需要从文本文件中创建一个带有边框的表格(此文本文件每次在某人填写完表格后都会更新.一行,一个人): Herard|TRO789|Suzuki|France|Gendolfina|Fresko|food|500|2015-04-25 14:40 Bob|MGA789|Mercedes|Latvia|Polaris|Dread|parts|1000|2015-04-26 16:15 我已经
..
我的朋友有一个作业,我无法帮助他.基本上,他需要使用递归以相反的顺序打印句子中的单词.例如: 输入-这是一个句子 输出-句子a是这个 这是我写给他的普通印刷品的一个示例,我可以毫无问题地进行整个句子的反转,但是我无法理解没有线性方法仅递归反转单词的起点并使用字符串库或链接列表或任何其他方式: #include using namespace std; void
..
这是面试问题: 如何将 Dogs like cats 转换为 cats like Dogs ? 我的代码显示: cats like cats .我在哪里犯错? #include using namespace std; int main() { char sentence[] = ("dogs like cats"); cout
..
如何将类似"He and his brother playing football."的句子分成类似"He and","and his","his brother","brother playing"和"playing football"的几部分.使用Java可以做到吗? 解决方案 假定“单词"始终用单个空格分隔.使用String.split() String[] words = "
..
我有一个队名列表.假设他们是 teamnames=["Blackpool","Blackburn","Arsenal"] 在程序中,我问用户他想和哪个团队一起工作.我希望python如果与团队匹配则自动完成用户的输入并打印出来. 因此,如果用户写"Bla"并按 enter ,则Blackburn团队应自动在该空间中打印并在其余代码中使用.例如, 您的选择:Bla(用户写"Bl
..
我目前正在尝试创建一个正则表达式,以查找文本块中的所有句子,到目前为止,我已经知道了; (?=(?
..
我有这样的句子-“这是一个测试.4.55和5,000." 我想删除句子结尾处的句点,但不要删除数字之间的句点.我的输出必须是-“这是测试4.55和5,000" 我尝试了以下选项,但未获得所需的输出: wordList = "this is a test. 4.55 and 5,000." pattern3 = re.compile("[^\w\d]+") wordList = pattern
..
你好,我是regex的新手,我从python开始. 我一直坚持从英语句子中提取所有单词. 到目前为止,我有: import re shop="hello seattle what have you got" regex = r'(\w*) ' list1=re.findall(regex,shop) print list1 这给出了输出: ['hello','seattle','
..
我已经看到了一些类似的问题,但是我正在努力实现这一目标. 给出一个字符串,str =“月亮是我们的天然卫星,即它绕地球旋转!" 我想提取单词并将其存储在数组中. 预期的数组元素就是这个. the moon is our natural satellite i.e. it rotates around the earth 我尝试使用String.split('
..