sentence - IT屋-程序员软件开发技术分享社区

防止空格将段落编号拆分成句子

我正在使用Spacy对使用段落编号的文本进行句子切分，例如： text = '3. English law takes a dim view of stealing stuff from the shops. Some may argue that this is a pity.' 我正在尝试强制Spacy的句子分割器不要将3.拆分成它自己的句子。目前，以下代码返回三个单独的句子 ..

如何使用Spacy按句拆分文档

如何将文档(如段落、书籍等)拆分成句子。例如"The dog ran. The cat jumped"into["The dog ran", "The cat jumped"]with spacy？推荐答案最新答案如下： from __future__ import unicode_literals, print_function from spacy.lang.en ..

发布时间：2022-05-15 12:28:42 python spacy sentence text-segmentation Python

我想创建一个系统，我给出一个句子，系统会吐出与我给出的输入句子含义相似的句子

这是一个 NLP 问题，我想知道我应该如何进行. 问题有多难?我可以用同义词替换这个词并检查语法是否正确吗? 解决方案用同义词替换单词可能是首先要尝试的事情，但要注意不要错过多个单词的表达和习语.此外，请确保选择具有相同词性的同义词. 他们寻找一个好的解决方案他们查看/盯着/...寻找一个好的解决方案他们努力工作他们的工作/任务/......很难 ..

发布时间：2022-01-02 17:49:57 nlp grammar similarity sentence word-sense-disambiguation 其他开发

R将语料库分解成句子

我有许多 PDF 文档，我已将它们读入带有库 tm 的语料库中.如何将语料库分解成句子? 这可以通过使用readLines 后跟sentSplit 从包qdap [*] 读取文件来完成.该功能需要一个数据框.它还需要放弃语料库并单独读取所有文件. 如何通过 tm 中的语料库传递函数 sentSplit {qdap}?或者有更好的方法吗? 注意:在库openNLP中有一个函数sen ..

发布时间：2021-12-28 12:16:15 r split tm sentence qdap 其他开发

Python 3 - 从摩尔斯电码翻译时如何将每个句子的第一个字母大写

我正在尝试将莫尔斯电码翻译成单词和句子，一切正常……除了一件事.我的整个输出都是小写的，我希望能够将每个句子的第一个字母大写. 这是我当前的代码: text = input()如果 is_morse(text):lst = text.split(" ")文字 = ""对于 lst 中的 e:文本 += TO_TEXT[e].lower()打印(文本) 拆分列表中的每个元素都等于一个字符 ..

发布时间：2021-09-09 19:22:33 python string translate capitalize sentence Python

使用 Spacy 自定义句子分割

我是 Spacy 和 NLP 的新手.我在使用 Spacy 进行句子分割时遇到以下问题. 我试图标记为句子的文本包含编号列表(编号和实际文本之间有空格)，如下所示. import spacynlp = spacy.load('en_core_web_sm')text = "这是第一句话.\n接下来是编号列表.\n1.世界你好！\n2.你好 World2！\n3.世界你好！"text_sen ..

发布时间：2021-09-08 20:21:17 nlp tokenize spacy sentence 其他开发

我要反转字符串中的单词.我觉得我正朝着正确的方向前进.但我一直得到不稳定的输出，不禁认为这与我的 strncat() 函数有关.你们中的任何人是否看到任何问题，我已经决定处理它.我愿意接受其他方法的建议. int main(){int ch, ss=0, s=0;字符 x[3];char *word, string1[100], string2[100], temp[100];x[0]='y'; ..

发布时间：2021-07-09 20:54:45 c string reverse sentence strncpy 其他开发

使用平均方法从word2vec词向量计算句子向量的具体步骤是什么?

初学者的问题，但我对此有点困惑.希望这个问题的答案也能让其他 NLP 初学者受益. 以下是更多详细信息: 我知道你可以从 word2vec 生成的词向量计算句子向量.但是制作这些句子向量所涉及的实际步骤是什么?谁能提供一个直观的例子，然后进行一些计算来解释这个过程? 例如:假设我有一个包含三个词的句子:今天很热.并假设这些词的假设向量值为:(1,2,3)(4,5,6)(7,8,9 ..

发布时间：2021-06-07 20:38:27 python vector nlp word2vec sentence Python

将疑问句转换为祈使句

我正在尝试开发数据库的自然语言接口，我只是想知道是否有一个库或 API (Java) 可用于将问题(疑问句)转换为命令(命令式)句). 例如:来自“哪些员工出生于 1970 年之前?"以“让员工在 1970 年之前出生." 解决方案这是一个相当复杂且重要的问题.但是，如果您的域有限(员工数据库查询等)并且您只希望将有限的话语集作为输入，您可以构建一个简单的基于规则的系统. 最 ..

发布时间：2021-06-07 20:37:15 nlp sentence 其他开发

在Win-Prolog中读取字符串并挑选出字符串中的每个单词

我整天都在互联网上度过，但是我无法在Win-Prolog中找到任何可以断定字符串中每个单词的内置谓词. 示例: |-读(X).|:“这是一个字符串".X ='这是一个字符串'. 是否有任何我可以使用的谓词可以帮助我，挑出字符串中的每个单词?喜欢 A =此B =是C = aD =字符串或列表 A = [这是一个字符串] 有可能吗? 解决方案在Win-Prol ..

发布时间：2021-05-30 19:14:24 string list prolog sentence win-prolog 其他开发

BERT句子嵌入:如何获取句子嵌入向量

我正在使用模块bert-for-tf2来将BERT模型包装为Tensorflow 2.0中的Keras层.我已经按照您的指南将BERT模型实现为Keras层. 我正在尝试从句子中提取嵌入内容；在我的情况下，句子是“你好" 我对模型预测的输出有疑问；我已经写了这个模型: model_word_embedding = tf.keras.Sequential([ ..

发布时间：2021-02-14 21:00:59 keras nlp embedding word-embedding sentence 其他开发

使用PHP从文本文件创建表

发布时间：2020-07-06 23:23:41 php text-files tabular sentence PHP

递归地反转字符串中的单词

我的朋友有一个作业，我无法帮助他.基本上，他需要使用递归以相反的顺序打印句子中的单词.例如: 输入-这是一个句子输出-句子a是这个这是我写给他的普通印刷品的一个示例，我可以毫无问题地进行整个句子的反转，但是我无法理解没有线性方法仅递归反转单词的起点并使用字符串库或链接列表或任何其他方式: #include using namespace std; void ..

发布时间：2020-07-06 23:23:38 c++ recursion reverse words sentence C/C++开发

如何在不使用内置函数的情况下反转句子中的单词?

这是面试问题: 如何将 Dogs like cats 转换为 cats like Dogs ? 我的代码显示: cats like cats .我在哪里犯错? #include using namespace std; int main() { char sentence[] = ("dogs like cats"); cout ..

发布时间：2020-07-06 23:23:34 c++ arrays reverse sentence C/C++开发

如何将Java句子分为几个部分?

如何将类似"He and his brother playing football."的句子分成类似"He and"，"and his"，"his brother"，"brother playing"和"playing football"的几部分.使用Java可以做到吗? 解决方案假定“单词"始终用单个空格分隔.使用String.split() String[] words = " ..

发布时间：2020-07-06 23:23:31 java string sentence Java开发

Python自动完成用户输入

我有一个队名列表.假设他们是 teamnames=["Blackpool","Blackburn","Arsenal"] 在程序中，我问用户他想和哪个团队一起工作.我希望python如果与团队匹配则自动完成用户的输入并打印出来. 因此，如果用户写"Bla"并按 enter ，则Blackburn团队应自动在该空间中打印并在其余代码中使用.例如，您的选择:Bla(用户写"Bl ..

发布时间：2020-07-06 23:22:24 python string printing autocomplete sentence Python

匹配由另一个正则表达式分隔的所有内容吗?

我目前正在尝试创建一个正则表达式，以查找文本块中的所有句子，到目前为止，我已经知道了； (?=(? ..

发布时间：2020-07-06 23:22:16 python regex sentence Python

在python句子结尾处删除句点

我有这样的句子-“这是一个测试.4.55和5,000." 我想删除句子结尾处的句点，但不要删除数字之间的句点.我的输出必须是-“这是测试4.55和5,000" 我尝试了以下选项，但未获得所需的输出: wordList = "this is a test. 4.55 and 5,000." pattern3 = re.compile("[^\w\d]+") wordList = pattern ..

发布时间：2020-07-06 23:22:09 python regex sentence Python

Python正则表达式，用于查找字符串中的所有单词

你好，我是regex的新手，我从python开始. 我一直坚持从英语句子中提取所有单词. 到目前为止，我有: import re shop="hello seattle what have you got" regex = r'(\w*) ' list1=re.findall(regex,shop) print list1 这给出了输出: ['hello'，'seattle'，' ..

发布时间：2020-07-06 23:22:06 python regex words sentence Python

将句子拆分成单词，但在C#中标点符号出现问题

我已经看到了一些类似的问题，但是我正在努力实现这一目标. 给出一个字符串，str =“月亮是我们的天然卫星，即它绕地球旋转！" 我想提取单词并将其存储在数组中. 预期的数组元素就是这个. the moon is our natural satellite i.e. it rotates around the earth 我尝试使用String.split(' ..

发布时间：2020-07-06 23:22:03 c# regex split words sentence C#/.NET

sentence相关内容