Linux awk 命令

awk 命令是 Linux 系统中一个强大的文本分析工具，它非常适合于处理和分析列数据，Awk 的得名来源于它的三个设计者 Alfred Aho、Peter Weinberger 和 Brian Kernighan 的姓氏首字母，下面将详细介绍 awk 命令的基本概念、常见用法和高级功能。

（图片来源网络，侵删）

基本概念

定义：awk 是一种处理文本文件的程序语言，它能扫描和处理一行或多行输入，从中找到模式匹配的行，并在这些行上执行指定的动作。

创始人：由 Alfred Aho、Peter Weinberger 和 Brian Kernighan 共同创建，取三人的姓的首字母命名。

作用：主要用于格式化文本和生成报告，特别擅长处理和分析列数据。

常见用法

打印整行：使用 awk '{print}' file 可以打印文件中的每一行。

打印特定列：若要打印第一列和第二列，可以使用 awk '{print $1, $2}' file 。

指定分隔符：当字段由逗号分隔时，可使用 awk F',' '{print $1, $2}' file 来指定逗号为分隔符。

打印行号：使用 awk '{print NR, $0}' file 可以在输出每行内容前加上行的编号。

条件筛选：若要打印出包含特定模式的行及其行号，可以使用 awk '/pattern/ {print NR, $0}' file 。

计算总和：计算第一列的总和可以使用 awk '{sum += $1} END {print sum}' file 。

找出最大值：要找到某列的最大值，可以使用 awk 'max < $1 {max = $1} END {print max}' file 表达式。

高级功能

格式化输出：awk 允许用户以灵活的方式格式化输出结果，例如调整列宽、对齐等。

预定义变量

FS：输入字段的分隔符，默认为空格。

RS：输入记录的分隔符，默认为换行符。

NF：当前记录的字段数量。

NR：已经读取的记录数。

OFS：输出字段的分隔符，默认为空格。

ORS：输出记录的分隔符，默认为换行符。

执行流程

读取：awk 逐行读取文件内容。

执行：对于每一行，依次执行所有的规则和内置操作。

输出：根据规则执行的结果进行输出或其他操作。

函数与定位

内置函数：awk 提供了一系列内置函数，如 length()、substr() 等，方便用户处理字符串和数值。

定位：通过 NR 和 FNR 可以获取到当前是文件中的第几行或者当前是处理到的第几个记录。

awk 命令以其强大的文本处理能力，在 Linux 文本数据分析中占据着重要位置，通过上述介绍，用户可以更好地理解 awk 命令的功能和使用方式，从而在实际工作中更有效地应用这一工具。

原创文章，作者：未希，如若转载，请注明出处：https://www.kdun.com/ask/676641.html

本网站发布或转载的文章及图片均来自网络，其原创性以及文中表达的观点和判断不代表本网站。如有问题，请联系客服处理。