首页
其他开发
如何将一个单词拆分为双元组，包括重复的词组?

如何将一个单词拆分为双元组，包括重复的词组? [英] How can I split a word into bi-grams, including repeated ones?

查看：41 发布时间：2021/9/6 19:46:12 r text-processing

本文介绍了如何将一个单词拆分为双元组，包括重复的词组?的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在尝试将单词拆分为双元词组.我正在使用 qlcMatrix 包，但它只返回不同的二元组.例如，对于单词 "detected"，它只返回 "te" 一次.这是我使用的命令

I am trying to split a word into bi-grams. I am using the qlcMatrix package, but it only returns distinct bi-grams. For example, for the word "detected", it only returns "te" once. This is the command I use

test_domain <- c("detected")
library("qlcMatrix", lib.loc="~/R/win-library/3.2")
bigram1 <- splitStrings(test_domain, sep = "", bigrams = TRUE, left.boundary = "", right.boundary = "")$bigrams

这是我得到的结果:

bigram1
# [1] "ec" "ed" "de" "te" "ct" "et"

推荐答案

另一种使用 R 基础的方法是使用 mapply 和 substr:


Another way to do it with base R is to use mapply and substr:
nc <- nchar("detected")
mapply(function(x, y){substr("detected", x, y)}, x=1:(nc-1), y=2:nc)
# [1] "de" "et" "te" "ec" "ct" "te" "ed"


                        这篇关于如何将一个单词拆分为双元组，包括重复的词组?的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            如何将字符串拆分为单词;
                        
                    
                    
                        
                            如何将一个igraph拆分为连接的子图?;
                        
                    
                    
                        
                            如何将一个元组的Python生成器拆分为2个单独的生成器?;
                        
                    
                    
                        
                            将TextChunk拆分为单词;
                        
                    
                    
                        
                            如何将句子拆分为多个空格分隔的单词?;
                        
                    
                    
                        
                            将列表拆分为n元组;
                        
                    
                    
                        
                            如何将一个列值int拆分为三列？;
                        
                    
                    
                        
                            Java:如何将一个 ArrayList 拆分为多个小 ArrayList?;
                        
                    
                    
                        
                            如何将一个临时表拆分为多个临时表？;
                        
                    
                    
                        
                            Java:如何将一个 ArrayList 拆分为多个小 ArrayList?;
                        
                    
                    
                        
                            如何将没有空格的文本拆分为单词列表;
                        
                    
                    
                        
                            将文本拆分为单个单词;
                        
                    
                    
                        
                            如何将一个 RDD 拆分为两个或多个 RDD?;
                        
                    
                    
                        
                            将元组项拆分为单独的变量;
                        
                    
                    
                        
                            将列表拆分为可能的元组列表;
                        
                    
                    
                        
                            在一个元组内重复一个元组;
                        
                    
                    
                        
                            将一个csv拆分为多个文件;
                        
                    
                    
                        
                            将一个列数据拆分为多个;
                        
                    
                    
                        
                            将一个Access前端拆分为库;
                        
                    
                    
                        
                            如何将数组拆分为n个部分?;
                        
                    
                    
                        
                            如何将文件拆分为n个部分;
                        
                    
                    
                        
                            如何将数组拆分为n个组;
                        
                    
                    
                        
                            将元组列表拆分为相同元组字段的子列表;
                        
                    
                    
                        
                            F#:如何将一个序列拆分为一系列序列;
                        
                    
                    
                        
                            将C char数组拆分为单词;


    
        
            其他开发最新文章
            
                    
                        
                            拒绝显示一个框架，因为它将'X-Frame-Options'设置为'sameorigin';
                        
                    
                    
                        
                            什么是＆QUOT; AW＆QUOT;在部分标志属性是什么意思？;
                        
                    
                    
                        
                            在运行npm install命令时获取'npm WARN弃用'警告;
                        
                    
                    
                        
                            cmake无法找到openssl;
                        
                    
                    
                        
                            从Spark的scala中的* .tar.gz压缩文件中读取HDF5文件;
                        
                    
                    
                        
                            Twitter :: Error :: Forbidden  - 无法验证您的凭据;
                        
                    
                    
                        
                            我什么时候需要一个fb：app_id或者fb：admins？;
                        
                    
                    
                        
                            将.db文件导入R;
                        
                    
                    
                        
                            npm通知创建一个lockfile作为package-lock.json。你应该提交这个文件;
                        
                    
                    
                        
                            拒绝执行内联脚本，因为它违反了以下内容安全策略指令：“script-src'self'”;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.