【ThermoRawFileParser】质谱raw格式转换mgf
2024-08-29 02:16:59
众所周知,Proteowizard MSconvert用于质谱原始数据的格式转换,但主要平台是windows,要想在Linux上运行需要打Docker或Wine,对于普通用户来说还是很困难的,想想质谱的数据动辄上百Gb要进行转换相当麻烦。
比利时根特大学Dr. Lennart Martens领衔的CompOmics group(这个团队在蛋白质组领域很牛)也开发了专门针对Thermo的raw格式转化的开源软件,使用简单,最主要的是对Linux用户友好。可转换的格式包括 mzML(默认),MGF,Parquet。
下载安装
下载链接:
https://github.com/compomics/ThermoRawFileParser/releases
选择一个版本解压就可用了(最好新建一个文件夹存放,否则解压的是在当前目录中)。
但是,Linux使用还需要通过跨平台软件Mono来调用。关于Mono的安装,可能有些普通用户会碰到问题,主要是依赖libgdiplus库,只要这个解决了,源码安装三部曲就行了,这里不加以赘述。
参数
可以通过mono ThermoRawFileParser.exe
查看参数:
usage is ThermoRawFileParser.exe [subcommand] [options]
optional subcommands are xic|query (use [subcommand] -h for more info]):
-h, --help Prints out the options.
--version Prints out the library version.
-i, --input=VALUE The raw file input (Required). Specify this or an
input directory -d.
-d, --input_directory=VALUE
The directory containing the raw files (Required).
Specify this or an input raw file -i.
-o, --output=VALUE The output directory. Specify this or an output
file -b. Specifying neither writes to the input
directory.
-b, --output_file=VALUE The output file. Specify this or an output
directory -o. Specifying neither writes to the
input directory.
-f, --format=VALUE The spectra output format: 0 for MGF, 1 for mzML,
2 for indexed mzML, 3 for Parquet. Defaults to
mzML if no format is specified.
-m, --metadata=VALUE The metadata output format: 0 for JSON, 1 for TXT.
-c, --metadata_output_file=VALUE
The metadata output file. By default the metadata
file is written to the output directory.
-g, --gzip GZip the output file.
-p, --noPeakPicking Don't use the peak picking provided by the native
Thermo library. By default peak picking is
enabled.
-z, --noZlibCompression Don't use zlib compression for the m/z ratios and
intensities. By default zlib compression is
enabled.
-l, --logging=VALUE Optional logging level: 0 for silent, 1 for
verbose.
-e, --ignoreInstrumentErrors
Ignore missing properties by the instrument.
-u, --s3_url[=VALUE] Optional property to write directly the data into
S3 Storage.
-k, --s3_accesskeyid[=VALUE]
Optional key for the S3 bucket to write the file
output.
-t, --s3_secretaccesskey[=VALUE]
Optional key for the S3 bucket to write the file
output.
-n, --s3_bucketName[=VALUE]
S3 bucket name
案例
主要能用到的就1-4个参数,例如:
mono ThermoRawFileParser.exe -i=/home/user/data_input/raw_file.raw -o=/home/user/data_input/output/ -f=0 -g -m=0
至少可用一个参数:
mono ThermoRawFileParser.exe -i=/home/user/data_input/raw_file.raw
mono ThermoRawFileParser.exe -d=/home/user/data_input/
更多用法参考:https://github.com/compomics/ThermoRawFileParser#usage
转换的过程:
转换的结果: 以下结果包含带压缩(-g参数)和不带压缩的。
最新文章
- C# WinForm 慎用 override CreateParams 来重载窗体的一些特性
- HDU 5015 233 Matrix --矩阵快速幂
- JAVA单例
- Eclipse安装nodeclipse插件
- 烂泥:LVM学习之逻辑卷及卷组缩小空间
- oracle SQLserver 函数
- MFC枚举USB设备碰到的一个疑难,还没解决
- Javascript-数据类型、类型转换
- PKI系统深入的介绍
- Struts1.2,struts2.0原理分析
- Proxy代理模式(结构型)
- 18.7 修改IP地址
- 【JAVA】String[]配列の相関
- python json模块出现Invalid control character这个异常的原因
- os2
- nginx-1.13.12 源码配置清单
- C++进程间通信之剪贴板
- Nginx控制客户端请求的速率
- opencv配置(转)
- 滑动窗口解决Substring Search Problem
热门文章
- Coursera Deep Learning笔记 逻辑回归典型的训练过程
- 5.27日Scrum Metting
- windows下wchar_t的问题
- 关于STM32 (Cortex-M3) 中NVIC的分析
- 如何清理history
- 《基于SIRS模型的行人过街违章传播研究》
- TensorFlow从入门到入坑(1)
- Burp Suite Pro 2021.10 Full (macOS, Linux) -- 查找、发现和利用漏洞
- C++ Qt 项目实战(一)之文本编辑器
- js分支语句