rainyzz's blog

linux文本处理

最近的工作中许多工作涉及到文本处理,这里主要介绍一些linux基本的文本处理命令

sort

sort命令是将文本按行进行排序,排序时,可以按照整行进行排序,也可以按照一行中的某一列进行排序。

uniq

uniq命令将文本中独特的行选择出来,uniq命令要求文本是已经排序的。

comm

common命令是求两个文件的交集、差集,该命令也要求输入文件是有序并且唯一的。
参数中-1代表去除文件1中独有的内容,-2代表去除文件2中独有的内容,-3代表去除两个文件的交集

交集:comm file1 file2 -12
文件1中独有的内容:comm file1 file2 -13
文件2中独有的内容:comm file1 file2 -13
join

join命令和MySQL中的join是类似的,只不过Linux中的join命令是按照文件中的列来进行join的,同样也要求文件排序

awk

最强大的awk