内容简介:在过去几年里,研究发现LGC基于物种特异性模型和人类模型性能研究
在过去几年里,研究发现 long non-coding RNAs (lncRNAs)
在疾病和生物调控过程中扮演着重要角色。但在大量非模式物种中lncRNA的鉴定仍是一项富有挑战性的工作。该工作需要确定的序列信息,注释信息以及构建物种特有的训练集,但具有lncRNA研究所需的足够完整的序列与注释的物种只占很少数。 LGC是由北京基因组所基于 python 2 ( Python极简教程(一) )开发的一款快速lncRNA预测工具,该 工具 通过 ORF
(开放阅读框)长度和 G
C含量间的关系进行相关运算来鉴定lncRNA。LGC最大特点是能够基于 跨物种策略 进行lncRNA发掘。因此LGC可以支持 有参数据 和 无参数据 ( 无参转录组分析工具评估和流程展示 )进行 lncRNA
鉴定。在区分从植物到哺乳动物的不同物种的lncRNA和蛋白编码RNA方面,LGC鉴定的准确率高达 90% 。
LGC基于物种特异性模型和人类模型性能研究
LGC与现有常见lncRNA鉴定工具准确性敏感性特异性评估
LGC提供了在线服务器版和Linix/Unix本地版 ( 如果您也开发了软件,希望同时做个线上版,欢迎联系我们开发,专业服务,质优价廉,也投个核酸研究 )
Webserver
(http://bigd.big.ac.cn/lgc/calculator)
漂亮简洁的应用页面,只需要 fasta
(无参有参数据都可用)序列就可以进行 lncRNA
鉴定(可以直接粘贴自己感兴趣的序列或上传fasta文件(文件小于100MB)进行批量鉴定)。另外对人类,果蝇,小鼠,斑马鱼四个物种可以通过上传BED(小于3MB)或GTF(小于3MB)格式文件进行lncRNA挖掘。 生信分析过程中这些常见文件的格式以及查看方式你都知道吗?
本地运行
当然,网页版在速度与通量上仍有一定的局限性(对原始fasta数据库的拆分,再逐批上传鉴定真的好麻烦)。如果分析的数据比较多,可以在 linux
服务器搭建本地版本进行全库的LncRNA检索。 (不熟悉Linux,来看看 免费 Linux 系统和生信宝典原创学习教程 )
在构建本地版的LGC时,LGC官网推荐的安装流程是先安装 python2
和 biopython
,但我个人习惯使用 anaconda2
以及其下的 bioconda
( 解决生物软件安装烦恼 ),可以大大简化安装过程和更好的解决依赖性问题(conda install 想补什么补什么, Linux - Conda软件安装方法 )。
命令如下
wget http://bigd.big.ac.cn/biocode/tools/4/releases/1.0/file/download?filename=lgc-1.0.tar.gz tar zxf lgc-1.0.tar.gz chmod 755 lgc-1.0.py #确保conda,lgc-1.0.py在环境变量里 lgc-1.0.py input.fasta output.txt # Or python lgc-1.0.py input.fasta output.txt
结果文件各列的意义
Sequence Name | 序列名称 |
ORF Length | 开放阅读框长度 |
GC Content | GC含量 |
Conding Potential Score | 编码潜在评分:编码转录物的潜在评分,如果大于0,则为蛋白质编码RNA;如果小于0,则为ncRNA。“0”表示mRNA与lncRNA概率相同 |
Coding Label | 编码类别 |
pc | 编码序列的概率 |
pnc | 非编码序列的概率 |
fc | 编码序列的终止密码子概率 |
fnc | 非编码序列的终止密码子概率 |
这样,我们就可以通过设置合理的筛选条件,来筛得感兴趣的lncRNA进行后续的研究,比如:
- DESeq2差异基因分析和批次效应移除
- WGCNA分析,简单全面的最新教程
- 基因共表达聚类分析和可视化
- GO、GSEA富集分析一网打进
- GSEA富集分析 - 界面操作
- 无需写代码的高颜值富集分析神器
- 去东方,最好用的在线 GO 富集分析工具
参考资料:
- Wang G, Yin H, Li B, et al. Characterization and identification of long non-coding RNAs based on feature relationship[J]. bioRxiv, 2018: 327882.
- 生信宝典: Nature Method:Bioconda解决生物软件安装的烦恼
- 生信宝典: Linux学习-环境变量和可执行属性
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 联想回应“反对预装国产系统”消息:谣言,一直支持国产
- 倪光南:国产不等于落后,国产自主可替代计划切实可行
- 这一年,国产技术不断突破
- 国产化速度加快 安防企业踏上“芯”征程
- 俄致力打造国产神经网络处理器
- 国产开源 GUI 引擎 AWTK 1.1 发布
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
妙趣横生的算法(C++语言实现)
胡浩 / 清华大学出版社 / 2014-10-1 / 59.80元
《妙趣横生的算法(C++语言实现)》内容丰富,生动有趣,寓教于乐,旨在帮助读者学习数据结构和算法的相关知识,从而开阔眼界,培养编程兴趣,提高编程能力,增强求职的竞争力。如果您想提高自己对算法和数据结构的理解能力,在程序设计之路上走得更远,那么请翻开《妙趣横生的算法(C++语言实现)》,仔细研读吧,它将助您一臂之力。 《妙趣横生的算法(C++语言实现)》以通俗易懂的语言深入浅出地介绍了常用的数......一起来看看 《妙趣横生的算法(C++语言实现)》 这本书的介绍吧!