内容简介:在2018年开始的时候,自己给整一年立了一个Flag:2018年的第一个FLAG现在2019年初来整理下2018年做了些什么
在2018年开始的时候,自己给整一年立了一个Flag:2018年的第一个FLAG
现在2019年初来整理下2018年做了些什么
生信相关知识比较杂,从简单的来说,其中一点是可以认为是生信分析方法,这一年的空余时间主要看了些甲基化芯片分析方法、蛋白质谱的一些开源软件、转录组(一些非常规分析方法)以及全外显子分析(肿瘤)等,感觉大部分时间都在划水,只是简单的看些文献以及文档等
统计方面还是比较匮乏,只是了解了些基础概念性问题,统计书籍还是以睡前娱乐为主:生物统计学、深入浅出统计学、白话统计以及赤裸裸的统计学(除了第一本外,其他均可认为是科普读物。。。)。 StatQuest课程 没认真看过,主要是靠生信菜鸟团公众号的StatQuest生物统计学专题(感谢小编们的分享)
年初的时候把学习 Python 放在第三位,其实那时打算在年中前就可以学习,结果拖着拖着就到年底才开始动手,而且还是需求驱动(想用Python的docx包来写个自动化出报告的小工具),现在Python还处于用于写小脚本的程度,基本上能代替之前 Perl 做的所有工作,但是有时如果讲究快捷的话,还是会用Perl来写脚本(比如10分钟内的脚本,或者用一遍后就丢的那种);至于数据分析的方面,未使用Python,还是以R为主;至于用Python开发一个 工具 这个更是没完成。。。
年中的时候在整理GSEA使用方法的时候,将GSEA基本用法写成了一个R包-写了一个siGSEA包,基本了解了R包的基础组成部分以及写个简单的R包的思路,学习书籍-R包开发(中文版哈),然后后续再没深入了。。。成了2018年第一个R包也是当年的最后一个
我一直想把我写的shiny程序放到自己的网站上,但是由于自己的网站是基于虚拟云的(省钱),所以一直无法配置shiny的基本环境;所以今年写了好多个shiny app,但是都是以脚本形式保存;由于今年工作上的需求,用shiny写了基于内网搭建的生信小工具,几乎把shiny官网的上的文档 http://shiny.rstudio.com/articles/ 翻了几遍,简单说下自己的感觉:
Shiny的开场白:不需要你了解HTML/CSS,只需要会R,即可以玩转shiny。。。这句话确实没错!但是,如果你想做一个界面美观的,交互流畅的网页工具(或者说一个交互网页工具),那么HTML/CSS基础知识是必学的,而且熟练的话,你可以在shiny的CSS代码上更改(因为shiny默认的样式真的不好看,个人觉得)。如果想设计一点交互性更好的网页,那么Javascript也是必不可少的工具(或者说是IT前端的基础知识都要看上一遍。。。),还可以多看看别人的shiny包代码以及文档,可以学习下。如果是仅仅做个交互工具,不讲究效用以及美观的话,那么简单学下shiny使用方法即可,其将一些常用的HTML/CSS代码以及JS代码都写成了R函数,调用即可
生信相关的算法这个就略过吧
总结下2018年做了啥:
- 学了点常规的生信分析方法,了解了些NGS肿瘤分析(WGS/WES/Rnaseq)的一些方法
- 用R学习了一些统计学方法,写了个R包和一些shiny程序,用R的markdown来编写网页版报告
- 初步接触了下Python以及一些包的用法
- 博文68篇,平均每月5-6篇,低于2017年的平均每月9-10篇
- 阅读了编程(R/Python/Shell)/统计学/算法/科普等相关书籍,看的最多的是编程R语言相关的,看的最少的是算法。。。
2019年想做些什么:
- 首先把Python提上进程,这个是基础,因为一些计划都需要用到Python,一般需要持续的学习,另外把2018年的一些漏缺补上
- 希望自己能搭一个简单的生信网页工具(或者说简易版的生信云平台),想学习一个前端框架,然后后端用Python;如果不行的话,就尝试用Galaxy等开源框架来搭建
- 继续了解些NGS在肿瘤分析中的方法,保持阅读肿瘤相关方向的文献阅读
- 系统学习下机器学习在临床方面的分析方法,进一步了解一些常见的机器学习方法
- 想从基础上补下编程能力,打算看下C++,尝试着用于加快一些R代码
- 如果有机会想系统的了解下生信在临检方面的应用
- 想写一个比较有意思的生信开源工具
- 如有新想法,待补充
最后最近一直在想一个问题,学生信的人到底能做什么;从专业上来讲,生物信息学是一个交叉学科,是生物学和计算机学交叉的产物,主要用于应对现在生物学上(主要是NGS)一些大数据的分析;从应用来说,其分布在一些科研院校、科研服务类公司、基因临床检测公司以及一些药企等;从就业的角度来看,有些人侧重于计算机知识的积累,从事于一些生信开发工作,有些人侧重于生物学相关数据的分析工作,还有些是一些公司生信产品的设计等等;从我的角度来看,大致其实可以分为软件开发和数据分析两种,个人觉得生信产品设计之类的都是前面两者的一种延伸,类似于IT行业的产品经理等等
如果是喜欢生信数据分析、数据挖掘,那么一般会紧靠生物相关公司,大概率会从事一些科研服务类工作,或者一些药企等;如果是喜欢生信开发,一般对于计算机背景要求较高,也就是要有IT基础,有独立开发软件的能力,会在一些有自主发开能力的基因临床检测公司或者就直接转向IT行业了。。。
所以学生信的到底能做什么,取决于你的基本技能有哪些,更加在于你想做些什么
最后推荐一些2018年看过觉得不错的书籍以及一些工具书(翻翻就行)
- R语言经典实例
- R包开发
- 白话统计
- Python基础教程(第三版)
- 机器学习(周志华)
- 算法图解
- 基因传
本文出自于 http://www.bioinfo-scrounger.com 转载请注明出处
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 执行计划小总结
- 九月份总结与十月份计划
- 生态系统支持计划:2020第一季度总结
- 2018 年「掘金翻译计划」年度总结:我们共同的成长故事
- Firebird 计划委员会更新了 Firebird 4.0 的发布计划
- 百万美金激励计划出炉,Cocos-BCX 开放泛节点生态计划与 COCOS Bounty
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
LINUX与UNIX Shell编程指南
David Tansley / 徐炎、张春萌 / 机械工业出版社 / 2000-6 / 38.00元
本书共分五部分,详细介绍了shell编程技巧,各种UNIX命令及语法,还涉及了UNIX下的文字处理以及少量的系统管理问题。本书内容全面、文字简洁流畅,适合Shell编程人员学习、参考。一起来看看 《LINUX与UNIX Shell编程指南》 这本书的介绍吧!