grep相关内容

更智能地删除不必要的空白 CSV

我有一个类似于以下内容的逗号分隔文件 (CSV) 1, 2, 3, “测试,你好"4、5、6,“好吧,你好!" 我需要能够将上述内容从 Linux 命令行理想地转换为 1,2,3,"测试,你好"4,5,6,“好吧,你好!" 现在,我知道其他一些解决方案,例如:删除所有逗号后的空格 然而,这并不知道用双引号括起来的字符串.比如页面上的解决方案: sed -e 's/\s\+,/,/g ..
发布时间:2022-01-06 14:05:53 其他开发

为什么我从 grep -oc "foo" 得到不同的答案?文件和 grep -o "foo";档案 |wc -l ?哪个是对的?

这个问题真的说明了一切......我试图找到特定的出现次数大文件中的字符串. 答案是相似的....像 50 000 左右的管道和 49 000 奇数,只有普通的 grep - oc... 谁能解释为什么我得到不同的答案,哪个是正确的? 感谢您的帮助. 解决方案 在 --only-matching (-o) 模式下 grep 有时会输出多行单匹配行. alex@yuzu:~$ ..
发布时间:2022-01-06 14:05:46 服务器开发

Grep 认为文本文件是二进制的,但它不是

我在我们的代码库中遇到了一个 .cpp 文件,它被 grep 视为二进制文件.所以我不能像文本文件那样 grep 它,这很烦人,显然不是事情应该如何.所以我想知道为什么 grep 认为文件是二进制文件并解决这个问题. 我尝试使用命令查找任何不寻常的字符 grep -Pna --color -r "[\x00-\x08]|[\x10-\x19]|[\x80-\xFF]" test.cpp ..
发布时间:2022-01-06 14:05:37 其他开发

什么时候如果构造不需要括号?

我正在为一个 shell 脚本类做一些家庭作业,有一个问题要求我编写一个脚本来测试输入的参数是否是一个有效的 shell 变量名.下面的脚本似乎工作正常. if echo "$1" |grep -v ".*[^A-Za-z_]" >/开发/空然后回声是的别的回声没有菲 我知道括号是 BASH shell 中测试函数的简写.我的问题是,当我尝试使用括号执行上述脚本时出现错误. if [ ech ..
发布时间:2022-01-06 14:05:31 服务器开发

我可以使用 grep 提取 CSV 文件的单列吗?

我正在努力解决我必须尽快解决的问题.我有一个 csv 文件,字段以 ; 分隔.我被要求使用 grep 制作一个 shell 命令,以使用正则表达式仅列出第三列.我不能使用剪切.这是一个练习. 我的文件是这样的: 1;Evan;Bell;39;Obigod Manor;Ekjipih;TN;250082;Wayne;Watkins;22;Lanme Place;Cotoiwi;NC;8657 ..
发布时间:2022-01-06 14:05:22 其他开发

grep (bash) 多行模式

在 bash (4.3.46(1)) 中,我有一些多行的所谓 fasta 记录,其中每条记录都是由在线启动的 >name 和以下几行 DNA 序列 ([AGCTNacgtn]),这里是三个记录: >chr1AGCTACTTTTAGGGNGGTNN>chr2TTGNACACCCTGGGGGAGTA>chr3TGACGTGGGTTCGGGTTTTT 如何使用 bash grep 获取第二条记录?在 ..
发布时间:2022-01-06 14:05:04 服务器开发

使用 SED 使用带有要删除的行号的索引删除某些行

我得到了一个大文件,称为 file.txt,它可能有 20000 行或更多行.其中一些行必须从原始文件中删除,并且必须创建一个包含剩余行的新文件,例如 newfile.txt.要删除的行在另一个文件中,例如 index.txt.所以我是这样的: 文件.txt: line1线2...line19999线20000 索引.txt 115679...19856 我一直在尝试使用 sed,试 ..
发布时间:2022-01-06 14:04:47 服务器开发

用于在 HTML 中查找类名的正则表达式

我想使用 grep 来找出在一堆文件中是否/在哪里使用了 html 类.正则表达式模式不仅应该找到 ,还应该找到 . 到目前为止,我可以在下面的示例中找到 class="foo",但无法使其适用于多个类名: grep -Ern "class=\"result+(\"| )" * 有什么建议吗?谢谢 ..
发布时间:2022-01-06 14:04:38 其他开发

正则表达式:匹配除反向引用之外的所有内容

我有以下示例行: a_a公元前 如何(使用 grep/egrep)匹配第一个字母不等于最后一个字母的行?我尝试了以下方法,但这似乎无法正常工作. egrep ([ab])_[^\1] 使用 egrep -v 或反向正则表达式(匹配除第一个字母等于最后一个字母之外的所有内容)对于我的用例不可能. 解决方案 使用组匹配. 在那里你用第一个字符创建一个组,然后把组 (\1) 放在最 ..
发布时间:2022-01-06 14:04:29 其他开发

shell命令查找进程ID并附加到它?

我想使用“ddd"附加到正在运行的进程,我手动执行的是: # ps -ax |grep PROCESS_NAME 然后我得到一个列表和 pid,然后我输入: # ddd PROCESS_NAME THE_PID 有没有办法直接输入一个命令? 备注:当我输入 ps -ax |grep PROCESS_NAME,grep 将匹配进程和 grep 命令行本身. 解决方案 有一个简单 ..
发布时间:2022-01-06 14:04:23 其他开发

如何从 bash/shell 脚本中的 java 属性文件中提取值并将其存储在变量中并 cd 到该变量

我有一个 config.properties 文件,其中包含类似 ouputdir=/data1/testdata/output 的路径.我能够在 shell 中提取这些并将此路径存储在一个变量中.当我尝试将目录更改为此路径时,出现类似以下错误:No such file or directory/data1/testdata/output, thoutth this path exists. ..
发布时间:2022-01-06 14:04:13 其他开发

grep: -P 在 Jenkins 中仅支持 unibyte 和 UTF-8 语言环境

我有一个 shell 脚本,它在我本地的 git bash 中正确执行.但是,当使用与 shell 环境相同的 git bash 通过 Jenkins 执行相同的操作时,它会因“grep: -P 仅支持 unibyte 和 UTF-8 语言环境"而失败. 我的本​​地环境在 Windows 上,Jenkins 也在 Windows 上. 谁能解释一下? 解决方案 这应该有效: ..
发布时间:2022-01-06 14:03:39 其他开发

从 fasta 文件打印序列

我经常需要在 fasta 文件中找到特定的序列并打印出来.对于那些不知道的人来说,fasta 是一种用于生物序列(DNA、蛋白质等)的文本文件格式.这很简单,你有一行序列名称前面有一个“>",然后直到下一个“>"的所有行都是序列本身.例如: >sequence1ACTGACTGACTGACTG>序列2ACTGACTGACTGACTGACTGACTGACTGACTG>序列3ACTGACTGACTG ..
发布时间:2022-01-06 14:03:29 其他开发

Grep 包含特定关键字的文本的整个段落

我的目标是提取包含特定关键字的文本段落.不仅仅是包含关键字的行,而是整个段落.强加于我的文本文件的规则是每个段落都以特定模式(例如 Pa0)开头,该模式仅在段落开头在整个文本中使用.每个段落以换行符结束. 例如,假设我有以下文本: Pa0这是第一段bla bla bla这是同段中的另一行 bla bla这是第三行 bla bla帕0这是第二段bla bla bla第二行 bla bla 我 ..
发布时间:2022-01-06 14:03:24 其他开发

使用 ruby​​ 或 python 在文件中查找

流行的文本编辑器具有以下“在文件中查找"功能,可在对话框中打开: 查找:__searchtext__文件过滤器:*.txt;*.htm开始于:c:/docs/2009报告:[ ] 文件名 [ ] 仅文件计数方法: [ ] 正则表达式 [ ] 纯文本 事实上,几个流行的文本编辑器都有这个. 我想做同样的事情,但使用 python 或 ruby​​ 类而不是文本编辑器.这样,在任何支持 r ..
发布时间:2022-01-06 14:03:14 Python

包含字符串的单词的 grep 或 sed

示例文件: blahblah 123.a.site.com some-junkyoyoyoyo 456.a.site.com 更多垃圾hihohiho 123.a.site.org 垃圾桶拉拉拉拉 456.a.site.org 猴子垃圾 我想在每一行的中间找出所有这些域,它们都有一个共同的部分 a.site,我可以用它来 grep,但我不知道如何在不返回整行的情况下这样做吗? 也许这里需 ..
发布时间:2022-01-06 14:02:57 其他开发