内容简介:awk的命令是一种处理或分析文本文件的强大方法,特别是按行和列组织的数据文件。可以从命令行运行简单的awk命令。更复杂的任务应该作为awk程序(所谓的awk脚本)写入文件。
awk的命令是一种处理或分析文本文件的强大方法,特别是按行和列组织的数据文件。
可以从命令行运行简单的awk命令。更复杂的任务应该作为awk程序(所谓的awk脚本)写入文件。
awk命令的基本格式如下:
awk 'pattern {action}' input-file > output-file
这意味着:取输入文件的每一行; 如果该行包含该模式,则将该操作应用于该行并将结果行写入输出文件。 如果省略该模式,则该操作将应用于所有行。 例如:
linuxidc@Ubuntu:~/linuxidc.com$ awk '{ print $5 }' linuxidc.txt > linuxmi.txt
该语句获取每行第5列的元素,并将其作为一行写入输出文件“output.txt”中。 变量'$4'指的是第四列。 类似地,您可以使用$1,$2,$3等访问第一列,第二列和第三列。默认情况下,假定列由空格或制表符(所谓的空格)分隔。 因此,如果输入文件“linuxidc.txt”包含以下行:
1, linuxidc com, Title 599, Price $9.30
2, ninhao linuxidc, Title 761, Price $5.90
3, naike xie, Title 880, Price $9.10
4, Lady Gaga, Title 198, Price $1.30
5, Johnny Cash, Title 582, Price $6.50
6, Elvis Presley, Title 370, Price $9.30
7, John Lennon, Title 571, Price $8.90
8, Michael Jackson, Title 673, Price $7.50
9, linuxidc com, Title 585, Price $1.80
然后该命令将以下行写入输出文件“linuxmi.txt”:
linuxidc@ubuntu:~/linuxidc.com$ cat linuxmi.txt
599,
761,
880,
198,
582,
370,
571,
673,
585,
如果列分隔符不是空格或制表符(例如逗号),则可以在awk语句中指定,如下所示:
linuxidc@ubuntu:~/linuxidc.com$ awk -F, '{ print $3 }' linuxidc.txt > linuxmi.txt
如果认为列被逗号分隔,这将从每行的第3列中选择元素。 因此,在这种情况下,输出将是:
linuxidc@ubuntu:~/linuxidc.com$ cat linuxmi.txt
Title 599
Title 761
Title 880
Title 198
Title 582
Title 370
Title 571
Title 673
Title 585
大括号内的语句列表('{','}')称为块。 如果将条件表达式放在块前面,则只有条件为真时才会执行块内的语句。
awk '$7=="\$7.30" { print $3 }' linuxidc.txt
在这种情况下,条件是$7=="\$7.30",这意味着第7列的元素等于$7.30。 美元符号前面的反斜杠用于阻止系统将$7解释为变量,而是从字面上理解美元符号。
因此,这个awk语句打印出每行第3列的元素,第7列的“$7.30”。
您还可以使用正则表达式作为条件。 例如:
linuxidc@ubuntu:~/linuxidc.com$ awk '$7=="\$7.30" { print $3 }' linuxidc.txt
两个斜杠('/')之间的字符串是正则表达式。 在这种情况下,它只是字符串“30”。 这意味着如果一行包含字符串“30”,系统将在该行的第3列打印出该元素。 上例中的输出将是:
linuxidc@ubuntu:~/linuxidc.com$ awk '/30/ { print $3 }' linuxidc.txt
com,
Gaga,
Presley,
如果表元素是数字,awk可以在它们上运行计算,如下例所示:
linuxidc@ubuntu:~/linuxidc.com$ awk '{ print ($2 * $3) + $7 }' linuxidc.com.txt
除了访问当前行元素($1,$2等)的变量之外,还有变量$0表示完整行(行),变量NF表示字段数。
您还可以在此示例中定义新变量:
linuxidc@ubuntu:~/linuxidc.com$ awk '{ sum=0; for (col=1; col<=NF; col++) sum += $col; print sum; }' linuxidc.com.txt
这将计算并打印每行所有元素的总和。
awk语句经常与sed命令结合使用。
更多 Linux 命令相关信息见 Linux命令大全 专题页面 https://www.linuxidc.com/topicnews.aspx?tid=16
Linux公社的RSS地址 : https://www.linuxidc.com/rssFeed.aspx
本文永久更新链接地址: https://www.linuxidc.com/Linux/2019-02/156943.htm
以上所述就是小编给大家介绍的《如何编写awk命令和脚本》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 编写可靠 bash 脚本的一些技巧
- 编写可靠 bash 脚本的一些技巧
- 编写可靠 shell 脚本的 8 个建议
- 使用Fake和Paket编写F#脚本
- 利用 Powershell 编写简单的浏览器脚本
- 10 个实战及面试常用 Shell 脚本编写
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
数据挖掘中的新方法:支持向量机
邓乃扬、田英杰 / 科学出版社 / 2004-6-10 / 53.00元
支持向量机是数据挖掘中的一个新方法。支持向量机能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域,因此可应用于理科、工科和管理等多种学科。目前国际上支持向量机在理论研究和实际应用两方面都正处于飞速发展阶段。希望本书能促进它在我国的普及与提高。 本书对象既包括关心理论的研究工作者,也包括关心应用的实际工作者。对于有关领域的具有高等......一起来看看 《数据挖掘中的新方法:支持向量机》 这本书的介绍吧!