qdap相关内容

R将语料库分解成句子

我有许多 PDF 文档,我已将它们读入带有库 tm 的语料库中.如何将语料库分解成句子? 这可以通过使用readLines 后跟sentSplit 从包qdap [*] 读取文件来完成.该功能需要一个数据框.它还需要放弃语料库并单独读取所有文件. 如何通过 tm 中的语料库传递函数 sentSplit {qdap}?或者有更好的方法吗? 注意:在库openNLP中有一个函数sen ..
发布时间:2021-12-28 12:16:15 其他开发

将书面数字转换为 R 中的数字

有谁知道将数字的文本表示转换为实际数字的函数,例如'20305' 变成 20305.我在数据帧行中写了数字,想将它们转换为数字. 在 qdap 包中,您可以用单词替换数字表示的数字(例如,1001 变成一千),但反过来不行: 库(qdap)replace_number("我喜欢 346457 个冰淇淋筒.")[1] “我喜欢三十四万六千四百五十七个蛋卷冰淇淋." 解决方案 这是一个可以 ..
发布时间:2021-12-22 19:44:36 其他开发

将书写的数字转换为 R 中的数字

有谁知道将数字的文本表示转换为实际数字的函数,例如'20305' 变成 20305.我在数据帧行中写了数字,想将它们转换为数字. 在包 qdap 中,您可以用单词替换数字表示的数字(例如,1001 变成一千一),但反过来不行: 库(qdap)replace_number("我喜欢 346457 个冰淇淋筒.")[1] “我喜欢三十四万六千四百五十七个蛋卷冰淇淋." 解决方案 这是一个可 ..
发布时间:2021-09-06 19:03:42 其他开发

R将语料库分解为句子

我有许多PDF文档,已经将其阅读成库tm的语料库.一个人怎么能把语料分解成句子呢? 这可以通过从软件包qdap [*]中读取readLines和sentSplit的文件来完成.该功能需要一个数据框.它还将需要放弃语料库并单独读取所有文件. 如何在tm中的语料库上传递函数sentSplit {qdap}?还是有更好的方法?. 注意:库openNLP中有一个函数sentDetect, ..
发布时间:2020-07-06 23:21:58 其他开发