内容简介:进入根据介绍可选择文件类型为:CMAP,COORD (混合组装过程),XMAP,SMAP (结构变异数据) 和下机数据BNX;
1. PacBio原始下机bam格式数据上传
自PacBio Sequel平台开始,PacBio原始下机数据均为bam格式,该如何上传NCBI呢?
NCBI的 SRA_metadata_acc.xlsx 文件提供PacBio格式为PacBio RS平台的HDF5格式,而第一个bam格式则认为是比对结果文件,需要在assembly列提供比对基因组信息;
这该如何是好?万能的NCBI工作人员给我们支招了:point_down:
For unaligned bam files please enter ‘unaligned’ in the ‘assembly’ column.
2. BioNano数据上传
进入 Supplementary Files ,选择BioNano原始Map数据或混合组装 (hybrid assembly) 过程数据上传;
根据介绍可选择文件类型为:CMAP,COORD (混合组装过程),XMAP,SMAP (结构变异数据) 和下机数据BNX;
3. 基因组数据上传
Denovo组装基因组上传时通常需上传测序相关原始数据,首先参考 测序数据上传NCBI总结 提交专门上传基因组测序原始数据的BioProject和BioSample;
准备基因组 fa(未注释基因组)/sqn(已注释基因组)格式文件,进入
Genome
上传;
准备数据清单
- 基因组fa/sqn文件
- BioProject 号
- BioSample 号
- WGS 或 non-wgs genome
- AGP 文件,可通过 AGP validation on-line 进行文件格式确认或者 下载软件 在命令行确认 ( fatoagp 可根据fa文件生成AGP文件; fasta2apg.pl 根据fa文件生成AGP文件且输出分隔的contig.fa和scaffold.fa)
- 其他可选注释信息
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
模式识别
(希)Sergios Theodoridis、(希)Konstantinos Koutroumbas / 电子工业出版社 / 2010-2 / 75.00元
本书全面阐述了模式识别的基础理论、最新方法以及各种应用。模式识别是信息科学和人工智能的重要组成部分,主要应用领域有图像分析、光学字符识别、信道均衡、语言识别和音频分类等。本书在完美地结合当前的理论与实践的基础上,讨论了贝叶斯分类、贝叶斯网络、线性和非线性分类器设计、上下文相关分类、特征生成、特征选取技术、学习理论的基本概念以及聚类概念与算法。与前一版相比,增加了大数据集和高维数据相关的最新算法,这......一起来看看 《模式识别》 这本书的介绍吧!