【Linux命令面试高频】- 对文本进行分组并统计每个值出现的次数
发布日期:2021-06-29 15:36:38
浏览次数:2
分类:技术文章
本文共 964 字,大约阅读时间需要 3 分钟。
3.对文本进行分组并统计每个值出现的次数?
(1) grep+wc统计某个字符出现的次数
grep -o '404' nginx.conf | wc -l输出4grep -o '404\|8081' nginx.conf | wc -l输出5
(2) 统计文件中某个字符出现的次数
从某行取出分割的串
cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'
cat读取当前文件;awk -F 进行分割字符,并打印第二列的字符;在这里 ‘(txt=|&client)’是分隔符,它是一个正则表达式。
sdate=2017-09-20 23:59:32&com.ford.fordmobile_id=x
之后排序
cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'|sort
之后统计数量与去重
cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c
uniq -c 中的-c 代表在每列旁边显示该行重复出现的次数
之后再按重复次数排序
cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c | sort -nr
sort -n 按照数值的大小排序;-r按照相反顺序
最后将结果输出到文件中
cat check_info.log.2017-09-20 | awk -F '(txt=|&client)' '{print $2}'| sort | uniq -c | sort -nr > testfile
面试真题:
对第二列进行group,得到每个值出现次数。
123|weixin|314
45|zfb|321
12|weixin|14
先将这些写到一个test.log文件当中。
cat test.log | awk -F '|' 'print $2' | sort | uniq -c | sort -nr > res.log
转载地址:https://codingchaozhang.blog.csdn.net/article/details/116723160 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
逛到本站,mark一下
[***.202.152.39]2024年04月05日 14时07分00秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
torch Missing key(s) in state_dict
2019-04-29
PA,MIOU,FWIOU
2019-04-29
数组-769. 最多能完成排序的块
2019-04-29
超过256的像素值的保存
2019-04-29
middle-判断二分图-深度优先和广度优先
2019-04-29
二进制补码和原码的记录
2019-04-29
无重叠区间+用最少数量的箭引爆气球
2019-04-29
买卖股票的最佳时机
2019-04-29
非递减数列
2019-04-29
AUC粗浅理解笔记记录
2019-04-29
分治法:241. 为运算表达式设计优先级
2019-04-29
广度优先遍历:二进制矩阵中的最短路径
2019-04-29
广度优先遍历:set集合的速度远远比list快:完全平方数
2019-04-29
广度+深度:岛屿的最大面积/岛屿数量
2019-04-29
torch 模型运行时间与forward没对应的可能原因
2019-04-29
130. 被围绕的区域
2019-04-29
欧式距离、余弦相似度和余弦距离
2019-04-29
transform 等效转换(参考源码)
2019-04-29
Docker学习(二):Docker基本操作(控制容器)
2019-04-29
Unity之C#学习笔记(0):环境配置与上手 HelloWorld
2019-04-29