awk的特殊使用方法

awk是Unix环境下一种非常好的语言,适合于文本处理和报表生成,它还有许多精心设计的特性,允许进行特殊技巧程序设计。

术语铺垫

在awk的文本处理规则里,awk将文本文件视为由字段和记录组成的文本数据库。默认情况下,awk将每一行视为一个记录,也就是说记录的分隔符是 ,记录的分隔符可以通过内置变量RS更改。

在每一个记录中,又把记录分为若干个字段,即记录由字段组成,而字段的默认分隔符为空格或制表符。

一、基础用法

和我们平常使用的 Linux 命令一样, awk 也是遵循着某种格式来使用,格式如下:

# 使用格式 awk 执行的事件 文件

# 例如:

root@jaking-virtual-machine:~# awk '{print $0}' test.txt
My first language:Python
My second language:Shell
My third language:Java
My fourth language:C

其中,print 表示打印,$0 表示一整个记录,test.txt 表示一个文件。所以

awk ‘{print $0}’ test.txt

表示把 test.txt 文件里面的每行记录都打印出来。

表示整个记录,不过1, 3…..则表示整个记录中的第一个字段,第二个字段……。

root@jaking-virtual-machine:~# awk '{print $1}' test.txt
My
My
My
My
root@jaking-virtual-machine:~# awk '{print $2}' test.txt
first
second
third
fourth
root@jaking-virtual-machine:~# awk '{print $3}' test.txt
language:Python
language:Shell
language:Java
language:C

刚才我们说字段的默认分隔符是空格或者制表符这些,默认意味着我们可以自己显式着指定分隔符。下面我们用“:”来作为我们的分隔符吧。

root@jaking-virtual-machine:~#  awk -F ':' '{print $2}' test.txt
Python
Shell
Java
C

上面我们用参数 -F 指定了我们的分隔符,即如果想要指定字段的分隔符,可以用参数 -F 指定分隔符。

二、条件限制

在打印文本的时候,我们可以指定一些条件。格式如下:

awk 参数 条件 要执行的动作 文件

例如我们指定分隔符为“:”,条件为第二个字段为”Java”的记录。

# 打印第二个字段为”Java”的文本

root@jaking-virtual-machine:~# awk -F ':' '$2 == "Java" {print $2}' test.txt
Java

打印奇数行的的第二个字段:

# 打印奇数行的记录

root@jaking-virtual-machine:~# awk -F ':' 'NR % 2 == 1 {print $2}' test.txt
Python
Java

其中,NR 是一个内置的变量,表示当前正在处理的记录,即当前的记录是第几个记录。

三、条件语句

和我们平常的编程一样,awk 也提供了 if, else, while 等这些条件语句。

例如,打印第二个及其之后的记录:

root@jaking-virtual-machine:~# awk '{if(NR > 1) print $2}' test.txt
second
third
fourth

注意,上面的字段分隔符是空格了,并且 if 语句是在“{}” 里指定的。

再看一个例子:

root@jaking-virtual-machine:~# awk '{if($1  # 如果第一个字段小于“s",则打印第一个字段,否则打印第二个字段 My My My My root@jaking-virtual-machine:~# awk '{if($1 > "s") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1  My My My My root@jaking-virtual-machine:~# awk '{if($1 > "l") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "c") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "d") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1 > "p") print $1; else print $2}' test.txt first second third fourth root@jaking-virtual-machine:~# awk '{if($1  My My My My root@jaking-virtual-machine:~# awk '{if($3  language:Python language:Shell language:Java language:C root@jaking-virtual-machine:~# awk '{if($2  language:Python second third language:C root@jaking-virtual-machine:~# awk '{if($2  My second third My 

四、函数

awk 提供了一些内置函数来供我们使用,一下常用的函数如下:

tolower():字符转为小写。
toupper():字符转为大写
length():返回字符串长度。
substr():返回子字符串。
sqrt():平方根。
rand():随机数。
root@jaking-virtual-machine:~# awk '{print toupper($1)}' test.txt
MY
MY
MY
MY
root@jaking-virtual-machine:~# awk '{print tolower($1)}' test.txt
my
my
my
my
root@jaking-virtual-machine:~# awk -F ':' '{print toupper($2)}' test.txt
PYTHON
SHELL
JAVA
C
root@jaking-virtual-machine:~# awk -F ':' '{print tolower($2)}' test.txt
python
shell
java
c

五、变量

刚才我们说 NR 是一个表示当前正在处理的记录是第几个记录的内置变量,常用的内置变量如下:

NR:表示当前处理的是第几行
NF:表示当前行有多少个字段
FILENAME:当前文件名
FS:字段分隔符,默认是空格和制表符。
RS:行分隔符,用于分割每一行,默认是换行符。
OFS:输出字段的分隔符,用于打印时分隔字段,默认为空格。
ORS:输出记录的分隔符,用于打印时分隔记录,默认为换行符。

例如我们要打印每一个记录的最后一个字段,就可以使用变量 NF 了。

root@jaking-virtual-machine:~# awk '{print $NF}' test.txt
language:Python
language:Shell
language:Java
language:C

对了,刚才那个 NR 的变量也是挺好用的,例如:

root@jaking-virtual-machine:~# awk '{print NR ". "  $0}' test.txt
1. My first language:Python
2. My second language:Shell
3. My third language:Java
4. My fourth language:C

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/222909.html<

(0)
运维的头像运维
上一篇2025-04-15 17:26
下一篇 2025-04-15 17:28

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注