由于在windows下,遍历目录,想查找满足条件的文件;

dir /s > ..\fileresult.txt

结果得到的文件过大,999多MB的txt;

split -b 10k date.file

当然,spilite还可以为分割后的文件指定文件名的前缀:

[root@localhost split]# split -b 10k date.file -d -a 3 split_file

[root@localhost split]# ls

date.file split_file000 split_file001 split_file002 split_file003 split_file004 split_file005 split_file006 split_file007 split_file008 split_file009

第三步,在linux下,转换编码格式,并查找文件中的某些关键字;

#!/bin/bash

FL=`ls /home/lifeccp/test/x*`
echo "file list: " ${FL} for i in *.${FL}
do
if [ $i ]; then
#if [ -e $i ]; then
iconv -f gbk -t utf8 $i >$i.txt.utf8
dos2unix $i.txt.utf8
cat $i.txt.utf8 | grep "个文件" | grep -v "1 个文件" >> ./utf8f/RS.txt
echo $i
#echo ********* >> ./utf8f/RS.txt
#echo $i >> ./utf8f/RS.txt
#echo ********* >> ./utf8f/RS.txt
echo ********************* $i ************************ >> ./utf8f/RS.txt
else
echo "file does not exist."
exit -
fi done

附:一些常用的正则表达式

验证数字的正则表达式集 
验证数字:^[0-9]*$ 
验证n位的数字:^\d{n}$ 
验证至少n位数字:^\d{n,}$ 
验证m-n位的数字:^\d{m,n}$ 
验证零和非零开头的数字:^(0|[1-9][0-9]*)$ 
验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$ 
验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$ 
验证非零的正整数:^\+?[1-9][0-9]*$ 
验证非零的负整数:^\-[1-9][0-9]*$ 
验证非负整数(正整数 + 0) ^\d+$ 
验证非正整数(负整数 + 0) ^((-\d+)|(0+))$ 
验证长度为3的字符:^.{3}$ 
验证由26个英文字母组成的字符串:^[A-Za-z]+$ 
验证由26个大写英文字母组成的字符串:^[A-Z]+$ 
验证由26个小写英文字母组成的字符串:^[a-z]+$ 
验证由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$ 
验证由数字、26个英文字母或者下划线组成的字符串:^\w+$ 
验证用户密码:^[a-zA-Z]\w{5,17}$ 正确格式为:以字母开头,长度在6-18之间,只能包含字符、数字和下划线。 
验证是否含有 ^%&',;=?$\" 等字符:[^%&',;=?$\x22]+ 
验证汉字:^[\u4e00-\u9fa5],{0,}$ 
验证Email地址:^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$ 
验证InternetURL:^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$ 
验证电话号码:^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$:--正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。 
验证身份证号(15位或18位数字):^\d{15}|\d{}18$ 
验证一年的12个月:^(0?[1-9]|1[0-2])$ 正确格式为:“01”-“09”和“1”“12” 
验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。 
整数:^-?\d+$ 
非负浮点数(正浮点数 + 0):^\d+(\.\d+)?$ 
正浮点数 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ 
非正浮点数(负浮点数 + 0) ^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 
负浮点数 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ 
浮点数 ^(-?\d+)(\.\d+)?$

最新文章

  1. jQuery-1.9.1源码分析系列(八) 属性操作
  2. [BI项目记]-搭建代码管理环境之创建团队项目
  3. TestNG之注解的生命周期
  4. HDU 4622 求解区间字符串中的不同子串的个数
  5. Solaris系统管理(二)资源管理与网络配置
  6. spring框架七大模块
  7. nodejs搭配phantomjs highcharts后台生成图表
  8. Mvc 分页栏扩展方法
  9. 将.lib库文件转换成.a库文件的工具
  10. OpenCV---图片生成视频
  11. nagios 安装和配置(含有nrpe结束)所有 (两)
  12. thinkphp5URL和路由
  13. 在eclipse的配置文件里指定jdk路径
  14. 2018-4-5-cadence skill
  15. [Oracle][DATAGUARD]关于REDO_TRANSPORT_USER参数
  16. SQL JOIN 中 on 与 where 的区别
  17. FloatingWindow 悬浮窗开源项目总结
  18. php小程序登录时解密getUserInfo获取openId和unionId等敏感信息
  19. 推导式_字典_enumerate
  20. 自学Linux Shell18.1-sed编辑器基础特性

热门文章

  1. Winform中GridView分组排序实现功能
  2. WPF 中那些可跨线程访问的 DispatcherObject(WPF Free Threaded Dispatcher Object)
  3. Fast exit from dram self-refresh
  4. CUDA二维纹理内存+OpenCV图像滤波
  5. Android 事件分发机制具体解释
  6. 简明Python3教程 9.函数
  7. wpf Storyboard 不存在可解析名称“ ”的适用名称领域 No applicable name scope exists to resolve the name
  8. <PC>HP网络共享并创建一个热点问题
  9. abp框架(aspnetboilerplate)扩展系统表
  10. ntp时间同步,各种配置方法