shell编程之正则表达式与文本处理器

元字符	作用
*	匹配前面子表达式0次或者多次例：good，go.d
[list]	匹配list列表中的一个字符例：go[loa]d,[a-z],[0-9]匹配任意一位数字
[^list]	匹配任意非list列表中的一个字符例：[^0-9],[^a-z]匹配任意一位非小写字母
\{n,m\}	匹配前面子表达式n到m次例：go\{2,3\}d,'[0-9]\{2,3\}'匹配两位到三位数字
\{n,\}	匹配前面子表达式不少于n次例：go\{2,\}d,'[0-9]\{2,\}'匹配两位及两位以上的数字
\{n\}	匹配前面子表达式n次例：go\{2\}d,'[0-9]\{2\}'匹配两位数字
.	匹配除\n之外的任何一个字符例：go.d , g..d
$	匹配字符串结束的位置例：word$,^$匹配空行
^	匹配字符串开始的位置例：^a，^the，^#，^[a-z]
\	转义字符，用于取消特殊符号的的含义例：\!,\n,\$等
注：egrep，awk使用{n}、{n，}、{n，m} 匹配时“{}”前面不用加“\”

1.4、扩展正则表达式

扩展正则表达式是对基础正则表达式的扩充深化

元字符	作用
+	匹配前面子表达式一次以上例：go+d,将匹配至少一个o，如god,good,goood等
？	匹配前面子表达式0次或一次例：go?d,匹配将为gd或者god
()	将括号内的字符创作为一个整体例：g(oo)+d,将匹配oo整体一次以上
\|	以或的方式匹配字符条串例：g(oo\|la)d,将匹配good或glad

二、文本处理工具

1、grep 命令

grep命令使用正则表达式来搜索文本，并且把匹配的文本打印出来

grep [选项] ..查找条件目标文件

常用选项
-E	将样式为延伸的正则表达式来使用。
-c	计算符合样式的列数。
-i	忽略字符大小写的差别。
-n	列出所有匹配的文本行，并显示行号
-o	只显示被模式匹配到的字符串
-v	显示不包含匹配文本的所有行。
--color=auto	可以将找到的关键词部分加上颜色的显示

案例：

-c 统计ly 的行数不显示内容

-i 不区分大小写查找文件中所有the的行

-v 取反查找文件中，没有the的行显示出来

将非空行写入到2.txt文件

-n 查找并显示行数

若反向选择，如查找不包含“the”字符的行，则需要通过 grep 命令的“-v”选项实现，并配合“-n”一起使用显示行号。

利用中括号“[]”来查找集合字符

查找“oo”前面不是“w”的字符串，只需要通过集合字符的反向选择“[^]”来实现该目的

可以使用“grep -n‘[^a-z]oo’ceshi.txt”命令实现，其中“a-z”表示小写字母，大写字母则通过“A-Z”表示。

查找包含数字的行可以通过“grep -n ‘[0-9]’ ceshi.txt”命令来实现

基础正则表达式包含两个定位元字符：“^”（行首）与“$”（行尾）

过滤出以字符和数字开头的行，显示行号（中括号里取反，中括号外^以.,..开头）

过滤出以.结尾的行

因为小数点（.）在正则表达式中也是一个元字符，所以在这里需要用转义字符“\”将具有特殊意义的字符转化成普通字符

当查询空白行时，执行“grep -n‘^$’ceshi.txt”命令即可

查找任意一个字符“.”与重复字符“*”

在正则表达式中小数点（.）也是一个元字符，代表任意一个字符。例如执行以下命令就可以查找“w??d”的字符串，即共有四个字符，以 w 开头 d 结尾。

若查询包含至少两个 o 以上的字符串，则执行“grep -n 'ooo*' ceshi.txt”命令即可

查询以 w 开头 d 结尾，中间包含至少一个 o 的字符串

查找连续字符范围“{}”

查询以 w 开头以 d 结尾，中间包含 2～5 个 o 的字符串

查询以 w 开头以 d 结尾，中间包含 2 个或 2 个以上 o 的字符串

例题

首先查到列出所有log文件并且重定向给grep
使用grep 查找error 的行
使用grep 来查找不包含info 的行

2、cut 列截取工具

使用说明:cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。如果不指定 File 参数，cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一

常用选项
-b	按字节截取
-c	按字符截取，常用于中文
-d	指定以什么为分隔截取，默认为制表符
-f	通常和-d一起

案例

分割打印passwd第7列

分割打印passwd第1列和第7列

查看当前登录用户的第4个字节

-b 与 -c 的区别

cut只擅长于处理单个字符为间隔的文本，-b只能分割字母，-c既可以分割字母也可以分割中文

3、sort 排序工具

sort 是一个以行为单位对文件内容进行排序的工具，也可以根据不同的数据类型来排序。例如数据和字符的排序就不一样

语法：

sort [选项] 参数

常用选项
-t	指定分隔符，默认使用[Tab]吧键或空格分隔
-k	指定排序区域，哪个区间排序
-n	按照数字进行排序，默认是以文字形式排序
-u	等同于 uniq，表示相同的数据仅显示一行，注意：如果行尾有空格去重就不成功
-r	反向排序，默认是升序，-r就是降序
-o	将排序后的结果转存至指定文件
-f	忽略大小写，会将小写的字母都转换为大写字母来进行比较
-b	忽略每行前面的空格

案例

不加任何选项默认按第一列升序，字母的话就是从a到z由上而下显示

以冒号为分隔符，以数字大小对第三列排序（升序）

以冒号为分隔符，以数字大小对第三列排序（降序）

4、uniq 去重工具

主要用于去除连续的重复行

注意：是连续的行，所以通常和sort结合使用先排序使之变成连续的行再执行去重操作，否则不连续的重复行他不能去重

语法

uniq [选项] 参数

常用选项
-c	对重复的行进行计数
-d	仅显示重复行
-u	仅显示出现一次的行

案例

统计重复行的次数，不连续的重复行他不算做重复行

结合sort 命令排序去重

结合sort使用，过滤出重复行

过滤出不重复的行

查看登陆用户

查看登陆过系统的用户

5、tr 修改工具

它可以用一个字符来替换另一个字符，或者可以完全除去一些字符，也可以用它来除去重复字符

语法

tr [选项] .. SET1 [SET2]

从标准输入中替换、缩减和/或删除字符，并将结果写到标准输出。

常用选项
-d	删除字符
-s	删除所有重复出现的字符，只保留第一个

将所有小写改成大写

当字符数量不对等时，相同字符只识别后一个，剩下未对应的全是最后替换字符

即a-s p-a(pp相同去后一个a) le-r

把替换的字符用单引号引起来，包括特殊字符

多个字符替换成一个/

删除字符a

对p字符去重，只保留第一个

查看登陆ip和使用者个数

查看客户端和监听服务端个数

三、总结

本编文章主要讲述了基础正则表达式元字符的用法以及扩展正则表达式元字符的用法，还有grep命令的使用方法和一些参数及案例，其中还有一些文本处理器的常用方法案例（cut、sort、uniq、tr）

原文链接：https://blog.csdn.net/weixin_56270746/article/details/124573656

最后修改：2023 年 10 月 26 日

如果觉得我的文章对你有用，请随意赞赏

此处评论已关闭

shell编程之正则表达式与文本处理器

Atigger • 2023 年 10 月 26 日

<div id="content_views" class="htmledit_views">目录<a href="#%E4%B8%80%E3%80%81%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F">一、正则表达式</a><a href="#1.1%E3%80%81%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E5%AE%9A%E4%B9%89">1.1、正则表达式定义</a><a href="#1.2%E3%80%81%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E7%BB%84%E6%88%90">1.2、正则表达式组成</a><a href="#1.3%E3%80%81%E5%9F%BA%E7%A1%80%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E5%85%83%E5%AD%97%E7%AC%A6">1.3、基础正则表达式元字符</a><a href="#1.4%E3%80%81%E6%89%A9%E5%B1%95%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F">1.4、扩展正则表达式</a><a href="#%E4%BA%8C%E3%80%81%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86%E5%B7%A5%E5%85%B7">二、文本处理工具</a><a href="#1%E3%80%81grep%20%E5%91%BD%E4%BB%A4">1、grep 命令</a><a href="#%E4%BE%8B%E9%A2%98">例题</a><a href="#%C2%A02%E3%80%81cut%C2%A0%20%E5%88%97%E6%88%AA%E5%8F%96%E5%B7%A5%E5%85%B7">&nbsp;2、cut&nbsp; 列截取工具</a><a href="#3%E3%80%81sort%20%E6%8E%92%E5%BA%8F%E5%B7%A5%E5%85%B7">3、sort 排序工具</a><a href="#%C2%A04%E3%80%81uniq%C2%A0%E5%8E%BB%E9%87%8D%E5%B7%A5%E5%85%B7">&nbsp;4、uniq&nbsp;去重工具</a><a href="#5%E3%80%81tr%C2%A0%C2%A0%E4%BF%AE%E6%94%B9%E5%B7%A5%E5%85%B7">5、tr&nbsp;&nbsp;修改工具</a><a href="#%C2%A06%E3%80%81%E6%80%BB%E7%BB%93">三、总结</a>引言：正则表达式，又称规则表达式。（英语：Regular Expression），在代码中常简写为 regex、regexp 或 RE），计算机科学的一个概念。正则表达式通常被用来检索，替换那些符合某个模式（规则）的文本。<h3 id="%E4%B8%80%E3%80%81%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F">一、正则表达式</h3><h4 id="1.1%E3%80%81%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E5%AE%9A%E4%B9%89">1.1、正则表达式定义</h4>正则表达式，又称正规表达式，常规表达式使用字符串来描述、匹配一系列符合某个规则的字符串正则表达式--通常用于判断语句中，用来检查某一些字符串是否满足某一格式正则表达式是由普通字符与元字符组成<h4 id="1.2%E3%80%81%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E7%BB%84%E6%88%90">1.2、正则表达式组成</h4><ul>
 <li>普通字符</li>
 <li>大小写字母、数字、标点符号及一些其他符号</li>
 <li>元字符</li>
 <li>在正则表达式中具有特殊意义的专用字符</li>
 </ul>Linux 中常用的有两种正则表达式引擎基础正则表达式：BRE扩展正则表达式: ERE<h4 id="1.3%E3%80%81%E5%9F%BA%E7%A1%80%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F%E5%85%83%E5%AD%97%E7%AC%A6">1.3、基础正则表达式元字符</h4>支持的工具: grep、egrep、sed、awk基础正则表达式是常用的正则表达式部分<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td style="text-align:center;">元字符</td>
 <td style="text-align:center;">作用</td>
 </tr>
 <tr>
 <td style="text-align:center;">*</td>
 <td>匹配前面子表达式0次或者多次例：goo*d，go.*d</td>
 </tr>
 <tr>
 <td style="text-align:center;">[list]</td>
 <td>匹配list列表中的一个字符例：go[loa]d,[a-z],[0-9]匹配任意一位数字</td>
 </tr>
 <tr>
 <td style="text-align:center;">[^list]</td>
 <td>匹配任意非list列表中的一个字符例：[^0-9],[^a-z]匹配任意一位非小写字母</td>
 </tr>
 <tr>
 <td style="text-align:center;">\{n,m\}</td>
 <td>匹配前面子表达式n到m次例：go\{2,3\}d,'[0-9]\{2,3\}'匹配两位到三位数字</td>
 </tr>
 <tr>
 <td style="text-align:center;">\{n,\}</td>
 <td>匹配前面子表达式不少于n次例：go\{2,\}d,'[0-9]\{2,\}'匹配两位及两位以上的数字</td>
 </tr>
 <tr>
 <td style="text-align:center;">\{n\}</td>
 <td>匹配前面子表达式n次例：go\{2\}d,'[0-9]\{2\}'匹配两位数字</td>
 </tr>
 <tr>
 <td style="text-align:center;">.</td>
 <td>匹配除\n之外的任何一个字符例：go.d , g..d</td>
 </tr>
 <tr>
 <td style="text-align:center;">$</td>
 <td>匹配字符串结束的位置例：word$,^$匹配空行</td>
 </tr>
 <tr>
 <td style="text-align:center;">^</td>
 <td>匹配字符串开始的位置例：^a，^the，^#，^[a-z]</td>
 </tr>
 <tr>
 <td style="text-align:center;">\</td>
 <td>转义字符，用于取消特殊符号的的含义例：\!,\n,\$等</td>
 </tr>
 <tr>
 <td colspan="2">注：egrep，awk使用{n}、{n，}、{n，m} 匹配时“{}”前面不用加“\”</td>
 </tr>
 </tbody>
 </table><h4 id="1.4%E3%80%81%E6%89%A9%E5%B1%95%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F">1.4、扩展正则表达式</h4>扩展正则表达式是对基础正则表达式的扩充深化<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td style="text-align:center;">元字符</td>
 <td style="text-align:center;">作用</td>
 </tr>
 <tr>
 <td style="text-align:center;">+</td>
 <td>匹配前面子表达式一次以上例：go+d,将匹配至少一个o，如god,good,goood等</td>
 </tr>
 <tr>
 <td style="text-align:center;">？</td>
 <td>匹配前面子表达式0次或一次例：go?d,匹配将为gd或者god</td>
 </tr>
 <tr>
 <td style="text-align:center;">()</td>
 <td>将括号内的字符创作为一个整体例：g(oo)+d,将匹配oo整体一次以上</td>
 </tr>
 <tr>
 <td style="text-align:center;">|</td>
 <td>以或的方式匹配字符条串例：g(oo|la)d,将匹配good或glad</td>
 </tr>
 </tbody>
 </table><h3 id="%E4%BA%8C%E3%80%81%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86%E5%B7%A5%E5%85%B7">二、文本处理工具</h3><h4 id="1%E3%80%81grep%20%E5%91%BD%E4%BB%A4">1、grep 命令</h4>grep命令使用正则表达式来搜索文本，并且把匹配的文本打印出来grep [选项] ..查找条件&nbsp; 目标文件<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td colspan="2" style="text-align:center;">常用选项</td>
 </tr>
 <tr>
 <td style="text-align:center;">-E</td>
 <td style="text-align:center;">将样式为延伸的正则表达式来使用。</td>
 </tr>
 <tr>
 <td style="text-align:center;">-c</td>
 <td style="text-align:center;">计算符合样式的列数。</td>
 </tr>
 <tr>
 <td style="text-align:center;">-i</td>
 <td style="text-align:center;">忽略字符大小写的差别。</td>
 </tr>
 <tr>
 <td style="text-align:center;">-n</td>
 <td style="text-align:center;">列出所有匹配的文本行，并显示行号</td>
 </tr>
 <tr>
 <td style="text-align:center;">-o</td>
 <td style="text-align:center;">只显示被模式匹配到的字符串</td>
 </tr>
 <tr>
 <td style="text-align:center;">-v</td>
 <td style="text-align:center;">显示不包含匹配文本的所有行。</td>
 </tr>
 <tr>
 <td style="text-align:center;">--color=auto</td>
 <td style="text-align:center;">可以将找到的关键词部分加上颜色的显示</td>
 </tr>
 </tbody>
 </table>案例：&nbsp;-c&nbsp; 统计ly 的行数 &nbsp;不显示内容<img alt="" height="76" src="https://img-blog.csdnimg.cn/d1a2b70ef0e54ecaad2f480d439cd2d0.png" width="845">&nbsp;-i &nbsp;不区分大小写查找文件中所有the的行<img alt="" height="465" src="https://img-blog.csdnimg.cn/3e1967f60f6445898d29715d74a04d38.png" width="1158">&nbsp;-v &nbsp; 取反 &nbsp; &nbsp;查找文件中，没有the的行显示出来<img alt="" height="459" src="https://img-blog.csdnimg.cn/fc59f91c644f424fb3ff5d9affa4afd2.png" width="1127">&nbsp;将非空行写入到2.txt文件<img alt="" height="739" src="https://img-blog.csdnimg.cn/972da7eef13841a9acc1c98d4310f2ec.png" width="1079">&nbsp;-n &nbsp;查找并显示行数&nbsp;<img alt="" height="399" src="https://img-blog.csdnimg.cn/496f41bc841447f9af2b9d77a905fc66.png" width="1155">若反向选择，如查找不包含“the”字符的行，则需要通过 grep 命令的“-v”选项实现，并配合“-n”一起使用显示行号。<img alt="" height="431" src="https://img-blog.csdnimg.cn/87059fe1e5ec461f8ced4e7e4395b681.png" width="1132">&nbsp;利用中括号“[]”来查找集合字符<img alt="" height="419" src="https://img-blog.csdnimg.cn/6eef918d9a3b498d8b1fde3b7d00f42d.png" width="1109">&nbsp;查找“oo”前面不是“w”的字符串，只需要通过集合字符的反向选择“[^]”来实现该目的<img alt="" height="430" src="https://img-blog.csdnimg.cn/56d2816a58364e478eeb1f70a4e2f963.png" width="1200">&nbsp;可以使用“grep -n‘[^a-z]oo’ceshi.txt”命令实现，其中“a-z”表示小写字母，大写字母则通过“A-Z”表示。<img alt="" height="437" src="https://img-blog.csdnimg.cn/b111c34b518b4eb9b2bc5c7e434bbd79.png" width="1200">查找包含数字的行可以通过“grep -n ‘[0-9]’ ceshi.txt”命令来实现<img alt="" height="446" src="https://img-blog.csdnimg.cn/834712a7645f41efb5f1d13a3895b992.png" width="1200">&nbsp;基础正则表达式包含两个定位元字符：“^”（行首）与“$”（行尾）<img alt="" height="407" src="https://img-blog.csdnimg.cn/9d4966e34e7c41cfbd909251b20d9f3c.png" width="1200">过滤出以字符和数字开头的行，显示行号 （中括号里取反，中括号外^以.,..开头）<img alt="" height="379" src="https://img-blog.csdnimg.cn/fe383d6741fd4619b948b352351ce069.png" width="1200">过滤出以.结尾的行因为小数点（.）在正则表达式中也是一个元字符，所以在这里需要用转义字符“\”将具有特殊意义的字符转化成普通字符<img alt="" height="500" src="https://img-blog.csdnimg.cn/50ad8494966a4e1eaf3f0e7f0100a6a3.png" width="1200">当查询空白行时，执行“grep -n‘^$’ceshi.txt”命令即可&nbsp;&nbsp;<img alt="" height="397" src="https://img-blog.csdnimg.cn/e4536dc36de848ee9524dba91dc7dcc6.png" width="1200">查找任意一个字符“.”与重复字符“*”&nbsp;在正则表达式中小数点（.）也是一个元字符，代表任意一个字符。例如执行以下命令就可以查找“w??d”的字符串，即共有四个字符，以 w 开头 d 结尾。<img alt="" height="391" src="https://img-blog.csdnimg.cn/e103743e4ea447aea10428f76518e66c.png" width="1200">若查询包含至少两个 o 以上的字符串，则执行“grep -n 'ooo*' ceshi.txt”命令即可<img alt="" height="385" src="https://img-blog.csdnimg.cn/501038e38c314a4fb086ef45825a3b3b.png" width="1200">&nbsp;查询以 w 开头 d 结尾，中间包含至少一个 o 的字符串<img alt="" height="373" src="https://img-blog.csdnimg.cn/1ed5797acb00438eb6d0e5b91c501864.png" width="1200">&nbsp;查找连续字符范围“{}”<img alt="" height="371" src="https://img-blog.csdnimg.cn/5af9dd4a80b6434e91aec390f84f41ef.png" width="1200">&nbsp;查询以 w 开头以 d 结尾，中间包含 2～5 个 o 的字符串<img alt="" height="386" src="https://img-blog.csdnimg.cn/b704fee747f5415cba4dfaa035dda3e1.png" width="1200">&nbsp;查询以 w 开头以 d 结尾，中间包含 2 个或 2 个以上 o 的字符串&nbsp;<img alt="" height="400" src="https://img-blog.csdnimg.cn/33b5a7bdb49047819e74b5e2b94bff76.png" width="1200"><h4 id="%E4%BE%8B%E9%A2%98">例题</h4>首先查到列出所有log文件并且重定向给grep 使用grep 查找error 的行 使用grep 来查找不包含info 的行<img alt="" height="250" src="https://img-blog.csdnimg.cn/ab070b3aa457464a8af9bfc80869e4e4.png" width="1200"><h4 id="%C2%A02%E3%80%81cut%C2%A0%20%E5%88%97%E6%88%AA%E5%8F%96%E5%B7%A5%E5%85%B7">&nbsp;2、cut&nbsp; 列截取工具</h4>使用说明:cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。如果不指定 File 参数，cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td colspan="2" style="text-align:center;">常用选项</td>
 </tr>
 <tr>
 <td style="text-align:center;">-b</td>
 <td style="text-align:center;">按字节截取</td>
 </tr>
 <tr>
 <td style="text-align:center;">-c</td>
 <td>按字符截取，常用于中文</td>
 </tr>
 <tr>
 <td style="text-align:center;">-d</td>
 <td style="text-align:center;">指定以什么为分隔截取，默认为制表符</td>
 </tr>
 <tr>
 <td style="text-align:center;">-f</td>
 <td style="text-align:center;">通常和-d一起</td>
 </tr>
 </tbody>
 </table>案例分割打印passwd第7列&nbsp;<img alt="" height="318" src="https://img-blog.csdnimg.cn/f0a6cbcefb5b437694ac4fd1855c4434.png" width="1072">分割打印passwd第1列和第7列&nbsp;<img alt="" height="314" src="https://img-blog.csdnimg.cn/494536ad95564893a35470161f10875c.png" width="1017">查看当前登录用户的第4个字节<img alt="" height="291" src="https://img-blog.csdnimg.cn/9fd9e8c2bd904d8f879378f13c09f676.png" width="1146">&nbsp;-b 与 -c 的区别<img alt="" height="174" src="https://img-blog.csdnimg.cn/d340022209ff4b799e3f6358ba332abe.png" width="1077">&nbsp;cut只擅长于处理单个字符为间隔的文本，-b只能分割字母，-c既可以分割字母也可以分割中文<h4 id="3%E3%80%81sort%20%E6%8E%92%E5%BA%8F%E5%B7%A5%E5%85%B7">3、sort 排序工具</h4>sort 是一个以行为单位对文件内容进行排序的工具，也可以根据不同的数据类型来排序。例如数据和字符的排序就不一样语法：sort [选项]&nbsp; 参数<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td colspan="2" style="text-align:center;">常用选项</td>
 </tr>
 <tr>
 <td style="text-align:center;">-t</td>
 <td style="text-align:center;">指定分隔符，默认使用[Tab]吧 键或空格分隔</td>
 </tr>
 <tr>
 <td style="text-align:center;">-k</td>
 <td style="text-align:center;">指定排序区域，哪个区间排序</td>
 </tr>
 <tr>
 <td style="text-align:center;">-n</td>
 <td style="text-align:center;">按照数字进行排序，默认是以文字形式排序</td>
 </tr>
 <tr>
 <td style="text-align:center;">-u</td>
 <td>等同于 uniq，表示相同的数据仅显示一行，注意：如果行尾有空格去重就不成功</td>
 </tr>
 <tr>
 <td style="text-align:center;">-r</td>
 <td>反向排序，默认是升序，-r就是降序</td>
 </tr>
 <tr>
 <td style="text-align:center;">-o</td>
 <td>将排序后的结果转存至指定文件</td>
 </tr>
 <tr>
 <td style="text-align:center;">-f</td>
 <td style="text-align:center;">忽略大小写，会将小写的字母都转换为大写字母来进行比较</td>
 </tr>
 <tr>
 <td style="text-align:center;">-b</td>
 <td style="text-align:center;">忽略每行前面的空格</td>
 </tr>
 </tbody>
 </table>案例<p id="2.1%E4%B8%8D%E5%8A%A0%E4%BB%BB%E4%BD%95%E9%80%89%E9%A1%B9%E9%BB%98%E8%AE%A4%E6%8C%89%E7%AC%AC%E4%B8%80%E5%88%97%E5%8D%87%E5%BA%8F%EF%BC%8C%E5%AD%97%E6%AF%8D%E7%9A%84%E8%AF%9D%E5%B0%B1%E6%98%AF%E4%BB%8Ea%E5%88%B0z%E7%94%B1%E4%B8%8A%E8%80%8C%E4%B8%8B%E6%98%BE%E7%A4%BA%C2%A0">不加任何选项默认按第一列升序，字母的话就是从a到z由上而下显示<img alt="" height="344" src="https://img-blog.csdnimg.cn/a020b05f16284a6189e39fb6058f3b18.png" width="840"><p id="2.2%E4%BB%A5%E5%86%92%E5%8F%B7%E4%B8%BA%E5%88%86%E9%9A%94%E7%AC%A6%EF%BC%8C%E4%BB%A5%E6%95%B0%E5%AD%97%E5%A4%A7%E5%B0%8F%E5%AF%B9%E7%AC%AC%E4%B8%89%E5%88%97%E6%8E%92%E5%BA%8F%EF%BC%88%E5%8D%87%E5%BA%8F%EF%BC%89">以冒号为分隔符，以数字大小对第三列排序（升序）<img alt="" height="367" src="https://img-blog.csdnimg.cn/bd3a73fada424b78a7a0c1a5fcdae699.png" width="1002">&nbsp;以冒号为分隔符，以数字大小对第三列排序（降序）<img alt="" height="446" src="https://img-blog.csdnimg.cn/8f64744e9a874c649e7d162a608dd0d0.png" width="1005"><img alt="" height="322" src="https://img-blog.csdnimg.cn/2b557951ea524d01a2d659b8a72732a0.png" width="943"><h4 id="%C2%A04%E3%80%81uniq%C2%A0%E5%8E%BB%E9%87%8D%E5%B7%A5%E5%85%B7">&nbsp;4、uniq&nbsp;去重工具</h4>主要用于去除连续的重复行注意：是连续的行，所以通常和sort结合使用先排序使之变成连续的行再执行去重操作，否则不连续的重复行他不能去重语法uniq [选项] 参数<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td colspan="2" style="text-align:center;">常用选项</td>
 </tr>
 <tr>
 <td style="text-align:center;">-c</td>
 <td>对重复的行进行计数</td>
 </tr>
 <tr>
 <td style="text-align:center;">-d</td>
 <td style="text-align:center;">仅显示重复行</td>
 </tr>
 <tr>
 <td style="text-align:center;">-u</td>
 <td style="text-align:center;">仅显示出现一次的行</td>
 </tr>
 </tbody>
 </table>案例<p id="3.1%E7%BB%9F%E8%AE%A1%E9%87%8D%E5%A4%8D%E8%A1%8C%E7%9A%84%E6%AC%A1%E6%95%B0%EF%BC%8C%E4%B8%8D%E8%BF%9E%E7%BB%AD%E7%9A%84%E9%87%8D%E5%A4%8D%E8%A1%8C%E4%BB%96%E4%B8%8D%E7%AE%97%E5%81%9A%E9%87%8D%E5%A4%8D%E8%A1%8C">统计重复行的次数，不连续的重复行他不算做重复行<img alt="" height="312" src="https://img-blog.csdnimg.cn/c0b2e79982474c04a59dc10ca2e94628.png" width="1027">结合sort 命令排序去重<img alt="" height="321" src="https://img-blog.csdnimg.cn/a578b980f5494370b6952de3f27115df.png" width="974">结合sort使用，过滤出重复行&nbsp;<img alt="" height="243" src="https://img-blog.csdnimg.cn/78cba945586946689e06506e71ffca7b.png" width="1081">&nbsp;过滤出不重复的行<img alt="" height="102" src="https://img-blog.csdnimg.cn/d22ac8a8dda54ca5812d18233f828e22.png" width="978">&nbsp;查看登陆用户<img alt="" height="243" src="https://img-blog.csdnimg.cn/3c3b910b81344256b65e99c00236782b.png" width="1100">&nbsp;查看登陆过系统的用户<img alt="" height="175" src="https://img-blog.csdnimg.cn/66a7945479b8487fa9e2a3909db21ff8.png" width="1056"><h4 id="5%E3%80%81tr%C2%A0%C2%A0%E4%BF%AE%E6%94%B9%E5%B7%A5%E5%85%B7">5、tr&nbsp;&nbsp;修改工具</h4>它可以用一个字符来替换另一个字符，或者可以完全除去一些字符，也可以用它来除去重复字符语法tr [选项] ..&nbsp;SET1 [SET2]从标准输入中替换、缩减和/或删除字符，并将结果写到标准输出。<table border="1" cellpadding="1" cellspacing="1" style="width:500px;">
 <tbody>
 <tr>
 <td colspan="2" style="text-align:center;">常用选项</td>
 </tr>
 <tr>
 <td style="text-align:center;">-d</td>
 <td style="text-align:center;">删除字符</td>
 </tr>
 <tr>
 <td style="text-align:center;">-s</td>
 <td style="text-align:center;">删除所有重复出现的字符，只保留第一个</td>
 </tr>
 </tbody>
 </table>将所有小写改成大写&nbsp;<img alt="" height="434" src="https://img-blog.csdnimg.cn/9a10f45dfa68401faeb9d7d460713c31.png" width="1200">当字符数量不对等时，相同字符只识别后一个，剩下未对应的全是最后替换字符&nbsp;即a-s&nbsp; p-a(pp相同去后一个a)&nbsp; le-r&nbsp;&nbsp;<img alt="" height="246" src="https://img-blog.csdnimg.cn/0eb60608fafa4aed935ff0e8dc031076.png" width="1111">把替换的字符用单引号引起来，包括特殊字符&nbsp;<img alt="" height="256" src="https://img-blog.csdnimg.cn/365aad1f9e2f4793ad644db8a1f868cf.png" width="1200">&nbsp;多个字符替换成一个/<img alt="" height="248" src="https://img-blog.csdnimg.cn/5cc9d9ac74f24227a16b032c8e444b1a.png" width="1200">&nbsp;删除字符a<img alt="" height="256" src="https://img-blog.csdnimg.cn/12a7a86c42434cae9ebc143feb13eb90.png" width="1200"><img alt="" height="260" src="https://img-blog.csdnimg.cn/76434c0e9804480da5fc734114cfd7f5.png" width="1200">对p字符去重，只保留第一个&nbsp;<img alt="" height="206" src="https://img-blog.csdnimg.cn/fdf46685480a44278c1b0302f17490c6.png" width="1198">&nbsp;查看登陆ip和使用者个数<img alt="" height="184" src="https://img-blog.csdnimg.cn/184de980152745b6bf3325076f975c7f.png" width="1200">查看客户端和监听服务端个数<img alt="" height="139" src="https://img-blog.csdnimg.cn/8a610f57226c43bbb1e66e8d71b90095.png" width="1200"><h3 id="%C2%A06%E3%80%81%E6%80%BB%E7%BB%93">三、总结</h3>本编文章主要讲述了基础正则表达式元字符的用法以及扩展正则表达式元字符的用法，还有grep命令的使用方法和一些参数及案例，其中还有一些文本处理器的常用方法案例（cut、sort、uniq、tr）</div>原文链接：https://blog.csdn.net/weixin_56270746/article/details/124573656

元字符	作用
*	匹配前面子表达式0次或者多次例：good，go.d
[list]	匹配list列表中的一个字符例：go[loa]d,[a-z],[0-9]匹配任意一位数字
[^list]	匹配任意非list列表中的一个字符例：[^0-9],[^a-z]匹配任意一位非小写字母
\{n,m\}	匹配前面子表达式n到m次例：go\{2,3\}d,'[0-9]\{2,3\}'匹配两位到三位数字
\{n,\}	匹配前面子表达式不少于n次例：go\{2,\}d,'[0-9]\{2,\}'匹配两位及两位以上的数字
\{n\}	匹配前面子表达式n次例：go\{2\}d,'[0-9]\{2\}'匹配两位数字
.	匹配除\n之外的任何一个字符例：go.d , g..d
$	匹配字符串结束的位置例：word$,^$匹配空行
^	匹配字符串开始的位置例：^a，^the，^#，^[a-z]
\	转义字符，用于取消特殊符号的的含义例：\!,\n,\$等
注：egrep，awk使用{n}、{n，}、{n，m} 匹配时“{}”前面不用加“\”

shell编程之正则表达式与文本处理器

一、正则表达式

1.1、正则表达式定义

1.2、正则表达式组成

1.3、基础正则表达式元字符

1.4、扩展正则表达式

二、文本处理工具

1、grep 命令

例题

2、cut 列截取工具

3、sort 排序工具

4、uniq 去重工具

5、tr 修改工具

三、总结

[原创]mangabz漫画网爬取

把哪吒监控装进口袋：一款更适合手机使用的 Android 客户端

Vue3的侦听器

Vue3的toRaw()与markRaw()

Vue3的Teleport组件

Linux：Xshell相关配置及前期准备

实现搜索插入位置：按顺序插入

BFS：Floodfill算法

Vue3自定义一个Hook函数

iptables之SNAT与DNAT

shell编程之正则表达式与文本处理器