【Linux】Linux 环境下splite以及一些正则使用
由于在windows下,遍历目录,想查找满足条件的文件;
dir /s > ..\fileresult.txt
结果得到的文件过大,999多MB的txt;
split -b 10k date.file
当然,spilite还可以为分割后的文件指定文件名的前缀:
[root@localhost split]# split -b 10k date.file -d -a 3 split_file
[root@localhost split]# ls
date.file split_file000 split_file001 split_file002 split_file003 split_file004 split_file005 split_file006 split_file007 split_file008 split_file009
第三步,在linux下,转换编码格式,并查找文件中的某些关键字;
#!/bin/bash FL=`ls /home/lifeccp/test/x*`
echo "file list: " ${FL} for i in *.${FL}
do
if [ $i ]; then
#if [ -e $i ]; then
iconv -f gbk -t utf8 $i >$i.txt.utf8
dos2unix $i.txt.utf8
cat $i.txt.utf8 | grep "个文件" | grep -v "1 个文件" >> ./utf8f/RS.txt
echo $i
#echo ********* >> ./utf8f/RS.txt
#echo $i >> ./utf8f/RS.txt
#echo ********* >> ./utf8f/RS.txt
echo ********************* $i ************************ >> ./utf8f/RS.txt
else
echo "file does not exist."
exit -
fi done
附:一些常用的正则表达式
验证数字的正则表达式集
验证数字:^[0-9]*$
验证n位的数字:^\d{n}$
验证至少n位数字:^\d{n,}$
验证m-n位的数字:^\d{m,n}$
验证零和非零开头的数字:^(0|[1-9][0-9]*)$
验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
验证非零的正整数:^\+?[1-9][0-9]*$
验证非零的负整数:^\-[1-9][0-9]*$
验证非负整数(正整数 + 0) ^\d+$
验证非正整数(负整数 + 0) ^((-\d+)|(0+))$
验证长度为3的字符:^.{3}$
验证由26个英文字母组成的字符串:^[A-Za-z]+$
验证由26个大写英文字母组成的字符串:^[A-Z]+$
验证由26个小写英文字母组成的字符串:^[a-z]+$
验证由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
验证由数字、26个英文字母或者下划线组成的字符串:^\w+$
验证用户密码:^[a-zA-Z]\w{5,17}$ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。
验证是否含有 ^%&',;=?$\" 等字符:[^%&',;=?$\x22]+
验证汉字:^[\u4e00-\u9fa5],{0,}$
验证Email地址:^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
验证InternetURL:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$
验证电话号码:^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$:--正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。
验证身份证号(15位或18位数字):^\d{15}|\d{}18$
验证一年的12个月:^(0?[1-9]|1[0-2])$ 正确格式为:“01”-“09”和“1”“12”
验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。
整数:^-?\d+$
非负浮点数(正浮点数 + 0):^\d+(\.\d+)?$
正浮点数 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
非正浮点数(负浮点数 + 0) ^((-\d+(\.\d+)?)|(0+(\.0+)?))$
负浮点数 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
浮点数 ^(-?\d+)(\.\d+)?$
最新文章
- jQuery-1.9.1源码分析系列(八) 属性操作
- [BI项目记]-搭建代码管理环境之创建团队项目
- TestNG之注解的生命周期
- HDU 4622 求解区间字符串中的不同子串的个数
- Solaris系统管理(二)资源管理与网络配置
- spring框架七大模块
- nodejs搭配phantomjs highcharts后台生成图表
- Mvc 分页栏扩展方法
- 将.lib库文件转换成.a库文件的工具
- OpenCV---图片生成视频
- nagios 安装和配置(含有nrpe结束)所有 (两)
- thinkphp5URL和路由
- 在eclipse的配置文件里指定jdk路径
- 2018-4-5-cadence skill
- [Oracle][DATAGUARD]关于REDO_TRANSPORT_USER参数
- SQL JOIN 中 on 与 where 的区别
- FloatingWindow 悬浮窗开源项目总结
- php小程序登录时解密getUserInfo获取openId和unionId等敏感信息
- 推导式_字典_enumerate
- 自学Linux Shell18.1-sed编辑器基础特性
热门文章
- Winform中GridView分组排序实现功能
- WPF 中那些可跨线程访问的 DispatcherObject(WPF Free Threaded Dispatcher Object)
- Fast exit from dram self-refresh
- CUDA二维纹理内存+OpenCV图像滤波
- Android 事件分发机制具体解释
- 简明Python3教程 9.函数
- wpf Storyboard 不存在可解析名称“ ”的适用名称领域 No applicable name scope exists to resolve the name
- &;lt;PC&;gt;HP网络共享并创建一个热点问题
- abp框架(aspnetboilerplate)扩展系统表
- ntp时间同步,各种配置方法