awk相关内容

使用 SED 或 AWK 从文件中删除行

我见过很多变种,对如何解决这 3 个问题感到非常困惑. 从文件中删除除第一行之外的所有行 从带有行号的文件中删除一行 从具有一系列行号的文件中删除行 解决方案 使用 sed: 删除第一行: sed '1d' 文件名 删除第 10 行: sed '10d' 文件名 删除第 5 到 10 行 sed '5,10d' 文件名 以上所有 sed 命令都会在 stdout ..
发布时间:2021-12-24 12:11:03 服务器开发

如何预处理和加载“大数据"tsv 文件转换为 python 数据框?

我目前正在尝试将以下大型制表符分隔文件导入 Python 中类似数据框的结构中——当然,我使用的是 pandas 数据框,尽管我对其他选项持开放态度. 这个文件有几 GB 大小,不是标准的 tsv 文件——它坏了,即行有不同的列数.一行可能有 25 列,另一行可能有 21 列. 以下是数据示例: Col_01: 14 .... Col_20: 25 Col_21: 23432 Col ..
发布时间:2021-12-24 12:08:24 Python

根据其他文件中的列搜索文件中的替换字符串

如果我们有第一个文件,如下所示: (a.txt)1个组装2 断言3 生物4 Bootasm5 引导主6 缓冲7 猫8 控制台9 分10回声 第二个喜欢: (b.txt)生物猫 BIO bootasm生物防御猫生物控制台生物氧化生物断言bootasm 汇编引导回声引导控制台引导主缓冲区引导生物启动主启动引导主定义猫猫猫断言猫断言 我们希望输出是这样的: 3 7 3 43 9 73 83 ..
发布时间:2021-12-24 12:07:22 其他开发

如何在 CSV 文件中的字段中添加引号?

我有一个类似的 CSV 文件 品牌、类型、颜色保时捷,运动,红色宝马,双门轿车,蓝色 我想包含引号以使其像: “品牌"、“类型"、“颜色"“保时捷"、“运动"、“红色"“宝马"、“双门轿车"、“蓝色" 最快的方法是什么?我将在 cronjob 中实现它. 解决方案 使用 sed: sed -e 's/^\|$/"/g' -e 's/,/","/g' 输入 ..
发布时间:2021-12-24 12:07:05 服务器开发

linux中根据内容拆分文件

我有大约 400 mb 的电子邮件转储.我想将其拆分为 .txt 文件,每个文件中包含一封邮件.每封电子邮件都以指定文档类型的标准 HTML 标题开头. 这意味着我将不得不根据上述标题拆分我的文件.我如何在 linux 中处理它? 解决方案 如果您有 mail.txt $ cat mail.txt邮件 A邮件B邮件 运行 csplit 以按 拆分 $ csplit mail.tx ..
发布时间:2021-12-24 12:05:46 服务器开发

在 Linux 中的文本文件中用逗号替换空格

我需要编辑一些文本文件(来自 sar 的输出)并将它们转换为 CSV 文件. 我需要使用 sed 或 awk 函数(Linux 中的简单 shell 脚本)更改每个空格(可能是输出中数字之间的选项卡). 谁能帮帮我?我使用的每个命令都没有更改文件;我试过 gsub. 解决方案 tr ' ' ',' output 用逗号替换每个空格,如果需要,您可以使用 -s ..
发布时间:2021-12-24 12:05:41 服务器开发

Linux bash脚本提取IP地址

我想在我的 Debian 7.3 上制作大脚本(类似翻译和更新的用户友好环境).我有个问题.我只想使用命令给我的一些信息.例如我的 ifconfig 看起来像: eth0 Link encap:Ethernet HWaddr 08:00:27:a3:e3:b0inet 地址:192.168.1.103 广播:192.168.1.255 掩码:255.255.255.0inet6 地址:fe80: ..
发布时间:2021-12-24 12:05:23 服务器开发

如何在UNIX中删除每行末尾的字符

我想删除文件中每一行末尾的逗号 ,.除了在 awk 中使用 substring 函数,我还能怎么做? 样本输入: SUPPLIER_PROC_ID BIGINT NOT NULL,BTCH_NBR 整数非空,RX_BTCH_SUPPLIER_SEQ_NBR 整数非空,CORRN_ID 整数非空,RX_CNT BYTEINT 非空,DATA_TYP_CD BYTEINT 非空,DATA_P ..
发布时间:2021-12-24 12:05:19 服务器开发

如何在shell中解码URL编码的字符串?

我有一个文件,其中包含已编码的用户代理列表.例如: Mozilla%2F5.0%20%28Macintosh%3B%20U%3B%20Intel%20Mac%20OS%20X%2010.6%3B%20en 我想要一个 shell 脚本,它可以读取这个文件并用解码的字符串写入一个新文件. Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.6; en 我 ..
发布时间:2021-12-24 12:04:59 其他开发

使用 awk 打印除第一个字段之外的所有内容

我有一个看起来像这样的文件: AE 阿拉伯联合酋长国AG Antigua &巴布达AN 荷属安的列斯群岛作为美属萨摩亚BA 波斯尼亚和黑塞哥维那BF布基纳法索BN 文莱达鲁萨兰国 我想颠倒顺序,首先打印除 $1 之外的所有内容,然后打印 $1: 阿拉伯联合酋长国 AE 我怎样才能做到“除了字段 1 之外的所有东西"? 解决方案 Assigning $1 有效,但会留下前导空格: a ..
发布时间:2021-12-24 12:04:34 其他开发

使用 sed 用 char 'X' 替换两个字符串之间的所有字符

在 Bash 脚本中,我试图在文件中用“X"替换两个给定字符串之间的字符.我有一堆字符串对,我希望在它们之间用“X"替换字符. 在下面的代码中,对中的 第一个 字符串在 cpi_list 数组中声明.对中的第二个字符串总是%26或&或ENDOFLINE 这就是我正在做的. #“first"或“start"字符串列表声明 -a cpi_list=('%26Name%3d' '%26Pwd% ..
发布时间:2021-12-24 12:04:18 其他开发

awk 用它的散列值替换一列

如何用 awk 或 sed 中的哈希值(如 MD5)替换列? 原始文件非常大,所以我需要这个才能真正高效. 解决方案 我复制粘贴了 larsks 的回复,但我添加了关闭行,以避免出现本文中指出的问题:gawk/awk:管道日期到 getline *有时*不起作用 awk '{tmp="echo " $2 " | openssl md5 | cut -f2 -d\" \""tmp | ..
发布时间:2021-12-24 12:03:59 其他开发

“未找到事件"unix 中的 shell 命令错误

当我尝试使用 删除连续的重复行时 awk "!x[$0]++" 文件 它的报告 x[: Event not found. 即使是同样的情况 sed -i -e "$!N;/^\(.*\)\n\1$/!P;D" file 以及报告 N:未找到事件.我也试过用单引号,它没有帮助 任何解决这些问题的想法 解决方案 您正在调用 shell 的历史替换.用单引号将感 ..
发布时间:2021-12-24 12:03:55 服务器开发

使用 bash (sed/awk) 提取 CSV 文件中的行和列?

bash 是否能够处理从 csv 文件中提取行和列?希望我不必求助于python.. 我的 5 列 csv 文件如下所示: 排名、姓名、学校、专业、年份1,John,Harvard,Computer Science,32,比尔,耶鲁,政治学,43,马克,斯坦福,生物学,14,Jane,普林斯顿,电气工程,35,Alex,MIT,管理经济学,2 我只想提取第 3、4、5 列的内容,忽略第一 ..
发布时间:2021-12-24 12:03:30 其他开发

根据模式将一个文件拆分为多个文件

我有一个二进制文件,我使用 hexdump 和几个 awk 和 sed 命令将其转换为常规文件.输出文件看起来像这样 - $cat temp3d3d01f87347545002f1d5b2be4ee4d700010100018000cc57e5820000000000000000000000000087d3f51300000000000000000000000000000000010010010 ..
发布时间:2021-12-24 12:03:02 其他开发