如何提高工具开发和数据分析的效率?| jupyter | Rstudio server
2024-08-26 14:52:08
这部分是超级干货,也能直接体现一个开发分析者的能力。
主要分为两部分:
1. 面对新问题时,如何高效的分析和开发?
2. 面对相似的问题时,如何最快时间的利用之前的开发经验?
因为现在我主要用shell和R来处理测序数据,所以本文仅局限于shell和R代码的开发和管理。
因为最终结果必然以图表呈现,所以本文的另一大部分就是绘图代码的开发和保存。
效率的定义:
现在给你一批GWAS的原始数据(或RNA-seq、scRNA-seq),你多久能给我出结果、出图?给你第二批,你又要多久?
你是否知道如何结果的最佳呈现形式?
核心:
- GitHub的利用
- R包的开发和管理
- jupyter和Rstudio server是神器
- 高效的归纳总结系统
- Rmarkdown和jupyter notebook到底选哪一个?各有利弊
如何让别人的开发为我所用?站在巨人的肩膀上
- 多看是必须的
- 总结,这个研究到底解决了什么问题?填补了哪个gap?
- 归纳,这些分析和绘图代码能不能归到一个R包里,汇总为一个manual,随时调用
数据分析:
- 数据特性的总结和QC
- 尝试多种工具
- 评价、比较不同工具的结果
- 挑选合适的工具,解读结果
- 根据实际问题开发创新
单批数据的分析是容易的,但是数据的整合才是最重要的。
两大类整合
- 不同发育阶段的整合
- case和control的整合
待续~
最新文章
- java常用工具
- Oracle:试图访问正在使用的事务临时表
- linux下使用tar命令
- Android HttpClient post MultipartEntity - Android 上传文件
- OSI模型
- Oracle中的自增-序列-SEQUENCE
- HDU-4414 Finding crosses 水题
- CoutDownLatch 多线程同步辅助类
- R语言做文本挖掘 Part5情感分析
- video+ audio
- [LeetCode] Longest Mountain in Array 数组中最长的山
- Asp.Net 之 DropDownList的使用
- AngularJS通过$location获取及改变当前页面的URL
- Mina的ssl加密
- Unity UGUI——Text组件(Character)
- 如何监控GPU使用情况并杀死指定其中进程
- python 使用pyinstaller,pywin32打包.py成.exe应用程序
- JAVA垃圾回收机
- 10-Mysql数据库----数据的增删改
- 通过监测DLL调用探测Mimikatz
热门文章
- typescript_类
- 【转】MCU厂商简介
- 新添加的磁盘大于2T 的分区方法
- 使用Arduino开发板制作交流电压表
- Linux 逻辑卷扩容
- 请解释下在单线程模型中Message、Handler、MessageQueue、Looper之间的关系
- SpringBoot -基础学习笔记 - 01
- SpringBoot 注册Servlet三大组件【Servlet、Filter、Listener】-原生代码+@Bean+效果展示
- 《The One!团队》第八次团队作业:Alpha冲刺
- 【Python】编程小白的第一本python(最基本的魔法函数)