自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (6)
  • 收藏
  • 关注

原创 如何自己写一个CNV分析软件?

目前,CNV的检测原理主要可以分为五类:第一,基于成对read的PEM方法;第二,基于split read的PE方法;第三,基于read深度的RD方法;第四,基于组装的AS方法;第五,前四种方法的组和;其中,尤以基于RD方法的软件最多,今天主要给大家分享一下基于RD方法开发CNV软件的思路。https://bmcbioinformatics.biomedcentral.com/track/pdf/10.1186/1471-2105-14-S11-S1.pdf无论是WES还是WGS数据,CNV的分析.

2021-05-24 17:56:27 1932

原创 WES数据如何判断性别?

在分析全外数据的时候,无论是在样本鉴定还是CNV分析的过程中,都需要对样本进行性别判断,那么我们如何对WES数据进行性别判断那?一、性别判断思路对于WES数据,个人认为性别判断主要有三个思路:1、根据Y/X染色体的reads比,这个最好理解,男性的Y/X染色体的reads比会显著大于女性的;2、根据X染色体上SNP的杂合比例,由于女性有两条X染色体,所以女性X染色体SNP的杂合位点的比例会显著大于男性;3、根据SRY基因,男性的SRY基因上有reads覆盖,而女性没有。当然,以上的三种方法使用的

2021-05-14 16:45:36 1930

原创 CNV数据可视化1

我们经常可以看到各种各样的CNV可视化图,有所有染色体的,有单条染色体的,有区域的,有的是根据log2ratio作图,有的根据拷贝数作图,今天给大家介绍几个我绘制的CNV可视化图形。第一个是纵向的所有染色体的可视化图,点图是根据log2ratio绘制,红线是根据segment后的片段数据绘制。数据的输入格式如下:chromosome start log21 12080 0.0878731 12595 -0.9191491

2021-05-11 11:40:20 4257 3

原创 使用WisecondorX分析CNV

WisecondorX是一个开源的可以分析低深度全基因组CNV的软件,不仅可以分析NIPT样本,也可以分析gDNA、PGT、FFPE等样本[1]。该软件的下载路径如下:https://github.com/CenterForMedicalGeneticsGhent/WisecondorX该软件的安装方法有两种,第一种是用pip安装,这种安装方法不能安装所需依赖的R包;另外一种方式是使用conda安装,这种安装方法可以将所需的依赖包都安装完整。###pip安装pip install -U git+h.

2021-05-10 13:26:05 1553 1

原创 使用ClinCNV分析CNV

ClinCNV是一个可以同时检测germline和somatic CNV的临床分析软件,如果您的样本量比较大(大于40个),可以试试这个软件,不仅可以分析WES数据,也可以分析WGS数据,不仅可以分析高深度(30X)的数据,也可以分析低深度(1X)的数据,不仅可以分析单个样本,也可以分析家系样本。一、软件安装首先可以通过git拷贝软件所需要的分析脚本:git clone https://github.com/imgag/ClinCNV.git由于这个软件是R编写的,分析过程中会用...

2021-05-09 15:43:47 1219 2

Linux基础命令豪华版

在学习Linux的过程中,经常会听到Shell这个词。可能大家在使用Windows的时候有这种感觉,我要听歌 ,我打开一个播放器,那么音箱就可以出声音,要打印一片文档,我们只要在程序中点击一下打印按钮,打印 就会自动的把文档打印出来。但是我们并没有自己手动的控制音箱和打印机等硬件设备,是因为系统已经为我 们作好了。其实我们可以把Windows叫做Shell,我们不用知道打印机的原理,也不需要自己控制它,我们只需 要轻轻的点击一下鼠标,系统为我们来控制这些硬件设备。

2018-07-24

三代基因组组装软件

MECAT is an ultra-fast Mapping, Error Correction and de novo Assembly Tools for single molecula sequencing (SMRT) reads. MECAT employs novel alignment and error correction algorithms that are much more efficient than the state of art of aligners and error correction tools. MECAT can be used for effectively de novo assemblying large genomes. For example, on a 32-thread computer with 2.0 GHz CPU , MECAT takes 9.5 days to assemble a human genome based on 54x SMRT data, which is 40 times faster than the current PBcR-Mhap pipeline. We also use MECAT to assemble a diploid human genome based on 102x SMRT data only in 25 days. The latter assembly leads a great improvement of quality to the previous genome assembled from the 54x haploid SMRT data. MECAT performance were compared with PBcR-Mhap pipeline, FALCON and Canu(v1.3) in five real datasets. The quality of assembled contigs produced by MECAT is the same or better than that of the PBcR-Mhap pipeline and FALCON. Here are some comparisons on the 32-thread computer with 2.0 GHz CPU and 512 GB RAM memory:

2018-07-03

生物信息数据库应用

生物信息库是国家基因库的一个分支,是一个开放性、公益性平台。生物信息库围绕“大数据”为中心,依托国家基因库样本库丰富的生物样本资源及深圳华大基因研究院高通量测序平台、高性能计算平台和信息分析能力,收集海量的基因组、转录组、蛋白组、代谢组及临床表型等数据信息,并致力于搭建生物大数据共享和应用平台。

2018-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除