PacBio-BioNano-Genome数据上传NCBI经历

栏目: 编程语言 · 发布时间: 6年前

内容简介:进入根据介绍可选择文件类型为:CMAP,COORD (混合组装过程),XMAP,SMAP (结构变异数据) 和下机数据BNX;

PacBio-BioNano-Genome数据上传NCBI经历

1. PacBio原始下机bam格式数据上传

自PacBio Sequel平台开始,PacBio原始下机数据均为bam格式,该如何上传NCBI呢?

PacBio-BioNano-Genome数据上传NCBI经历

NCBI的 SRA_metadata_acc.xlsx 文件提供PacBio格式为PacBio RS平台的HDF5格式,而第一个bam格式则认为是比对结果文件,需要在assembly列提供比对基因组信息;

PacBio-BioNano-Genome数据上传NCBI经历

这该如何是好?万能的NCBI工作人员给我们支招了:point_down:

For unaligned bam files please enter ‘unaligned’ in the ‘assembly’ column.

2. BioNano数据上传

进入 Supplementary Files ,选择BioNano原始Map数据或混合组装 (hybrid assembly) 过程数据上传;

根据介绍可选择文件类型为:CMAP,COORD (混合组装过程),XMAP,SMAP (结构变异数据) 和下机数据BNX;

3. 基因组数据上传

Denovo组装基因组上传时通常需上传测序相关原始数据,首先参考 测序数据上传NCBI总结 提交专门上传基因组测序原始数据的BioProject和BioSample;

准备基因组 fa(未注释基因组)/sqn(已注释基因组)

格式文件,进入

Genome

上传;

准备数据清单

  • 基因组fa/sqn文件
  • BioProject 号
  • BioSample 号
  • WGS 或 non-wgs genome
    PacBio-BioNano-Genome数据上传NCBI经历
  • AGP 文件,可通过 AGP validation on-line 进行文件格式确认或者 下载软件 在命令行确认 ( fatoagp 可根据fa文件生成AGP文件; fasta2apg.pl 根据fa文件生成AGP文件且输出分隔的contig.fa和scaffold.fa)
  • 其他可选注释信息

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Linux/UNIX系统编程手册

Linux/UNIX系统编程手册

Michael Kerrisk / 孙剑 许从年 董健、孙余强 郭光伟 陈舸 / 人民邮电出版社 / 2014-1 / 158

《linux/unix系统编程手册(上、下册)》是介绍linux与unix编程接口的权威著作。linux编程资深专家michael kerrisk在书中详细描述了linux/unix系统编程所涉及的系统调用和库函数,并辅之以全面而清晰的代码示例。《linux/unix系统编程手册(上、下册)》涵盖了逾500个系统调用及库函数,并给出逾200个程序示例,另含88张表格和115幅示意图。 《li......一起来看看 《Linux/UNIX系统编程手册》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具