有个文件要处理,因为很大,所以想把它切成若干份,每份N行,以便并行处理。split命令可以将一个大文件分割成很多个小文件,有时需要将文件分割成更小的片段,为提高可读性,生成日志等

命令格式

  • -b:值为每一输出档案的大小,单位为 byte。
  • -C:每一输出档中,单行的最大 byte 数。
  • -d:使用数字作为后缀。
  • -l:值为每一输出档的列数大小。

测试

环境:Centos 6.5  测试文件:test.txt(大小493257字节,行数4545行)

①按行数分割

# split -l  test.txt new_test.txt  //文件一共4545行,按每个文件1000行分割,那么生成5个文件
# ls
new_test.txtaa new_test.txtab new_test.txtac new_test.txtad new_test.txtae test.txt //分别以a、b、c、d、e结尾

加上-d,使用数字后缀;加上--verbose,显示分割进度(可有可无)

# split -l  -d test.txt new_test.txt --verbose
creating file `new_test.txt00'
creating file `new_test.txt01'
creating file `new_test.txt02'
creating file `new_test.txt03'
creating file `new_test.txt04'
# ls
new_test.txt00 new_test.txt01 new_test.txt02 new_test.txt03 new_test.txt04 test.txt //结尾分别00、01、02、03、04

② 按字节大小分割

# split -b 100k -d test.txt new_test.txt  //文件一共400多K,每个100K,所以分割五份

cat命令合并以上分割文件

# cat new_test.txt* > merge_file.txt

执行完毕,查看文件大小,与源文件大小一致。

最新文章

  1. bitmap解码
  2. 分析Mysql 5.6的Dockerfile
  3. inno 实现水波特效
  4. [游戏模版14] Win32 键盘控制
  5. string中常用的函数
  6. 使用openssl工具生成证书
  7. ***.M51文件详细注释
  8. perl 升级到5.20版本
  9. INF 右安装驱动程序和卸载
  10. iOS开发自定义流水布局
  11. Unity C# GetSaveFileName()的应用
  12. 【数学建模】MatLab 数据读写方法汇总
  13. 【原】以setTimeout来聊聊Event Loop
  14. spring的4种事务特性,5种隔离级别,7种传播行为
  15. UVALive - 7139(差分+模拟)
  16. topcoder srm 490 div1
  17. hbase非结构化数据库与结构化数据库比较
  18. django学习之——创建项目
  19. 1-1Controller之Request
  20. 系统监控工具-glances

热门文章

  1. linux下面安装coreseek与mmseg
  2. css中:hover空格
  3. TOP100summit:【分享实录-封宇】58到家多端消息整合之路
  4. 基于Docker部署nodejs应用
  5. python 关于GUI的思考(转)
  6. CodeForces - 156B Suspects 逻辑 线性 想法 题
  7. pandas3
  8. PULL解析学习
  9. webpack笔记一
  10. 【HTML5】HTML5的自学路线