自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 R 绘图时插入图片

插入图片如何将数据的统计结果以图片的形式插入到绘制的图片中?先使用annotation_custom 方法,后续再添加其它方法的说明;f=read.table("C:\\Users\\XXX\\Desktop\\all.rRNA.txt",head=T)library(png)library(grid)library(ggplot2)summary(f) ## 保存图片mg <- readPNG("C:\\Users\\XXX\\Desktop\\a.png")g <- ras

2020-07-27 17:24:06 1685

原创 生信工程师必备技能

1.生物学背景知识生物信息就是利用统计知识和处理软件对生物标记数据进行分析,研究其具体的意义肯定要了解生物学背景的。2.生信分析类软件使用大多数人都是使用别人开发好的生信软件处理数据,软件怎么使用就是最基础的能力了;另外就是生物信息分析的软件开发,这个要求对于大多数人来说就很困难了。3.统计学基础知识在分析具体数据的时候,我们需要选择合适的分析方法对数据进行统计分析,概率论和数理统计知识是必不可少的。4.linux操作常用的命令比如ls,mkdir等等一天就可以掌握,高级一点的命令比如awk,

2020-07-23 16:15:24 1016

原创 Linux docker container 安装

1.docker容器安装有root权限,发现安装出现报错 磁盘已满,查看原因sudo df -h /var/lib/docker/dev/mapper/centos-root 6.7G 6.7G 56M 100% /网上搜了一下,发现是container 默认安装到Docker Root Dir: /var/lib/docker , 按照网上说明的修改docker root路径还是无法成功安装,索性直接将这个路径链接到其它盘阵sudo mv /var/lib/docker /var/lib

2020-07-16 17:28:19 501

原创 R 散点图,添加标签

R 散点图绘制数据情况``a=read.table(“C:\Users\XXX\Desktop\input.txt”,head=T)all=cor.test(alog2FoldChange.US.10059104.D.US.10059068.D.,alog2FoldChange.US.10059104.D.US.10059068.D.,alog2FoldChange.US.10059104.D.US.10059068.D.,alog2FoldChange.US.10059104.H.US.1005

2020-06-23 15:00:05 2621

原创 metascape

metascape 功能注释工具1.网址https://metascape.org/gp/index.html#/main/step1metascape是一个在线的功能注释网址,使用简单,说明详细,一般转录组测序分析中,挑选出的差异基因可以使用这个网址进行功能注释。2.输入推荐使用文档或EXCEL文件,内容包含基因的信息,可以是gene ID 或者 symbol。3.选择物种选择本次研究的基因对应的物种。4.执行在默认的设置下可以点击Express Analysis一键执行,个性化设置

2020-06-17 17:38:51 4180 3

原创 VEP 注释

VEP 注释Ensembl Variant Effect Predictor (VEP)VEP determines the effect of your variants (SNPs, insertions, deletions, CNVs or structural variants) on genes, transcripts, and protein sequence, as well as regulatory regions.1.下载安装http://asia.ensembl.org/i

2020-05-27 14:29:14 3870

原创 R 柱状图

R 柱状图绘制添加数据标签: geom_text()颜色模板: scale_fill_brewer(palette=“Pastel1”)输入:> library(ggplot2)> a=read.table("C:\\Users\\XXX\\Desktop\\GeneExpressionSummary.xls",head=T)> ggplot(a, aes(x=Sample, y=GeneNumber, fill=Batch)) + geom_bar(stat="ident

2020-05-25 11:38:28 404

原创 R ggplot2 添加曲线

R 添加均值曲线数据情况计算均值a.mean=aggregate(Value ~ Group, data = a, FUN = “mean”)绘图a=read.table("C:\\Users\\XXX\\Desktop\\result.finnal.xls.plot",head=T)p<-ggplot(a, aes(x=Group, y=Value)) +geom_point(size=2,shape=21,color="gray40")+theme_classic()+ scale_

2020-05-22 11:32:46 3078

原创 SRA数据下载

SRA 数据下载1.链接https://www.ncbi.nlm.nih.gov/sra/2.输入文章中accession no. SRA编号,选择每一页100 个list,然后点击 Send results to Run selector3.选择所需要下载的样品对应的SRR编号4.点击 data access,可以通过aws 或 wget直接下载wget https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos1/sra-pub-run-5/SRR

2020-05-21 11:29:48 663

原创 TCGA 数据下载

TCGATCGA 数据库是目前最大的癌症基因信息数据库,TCGA的全面不仅仅体现在众多癌型上,还体现在多组学数据,包括基因表达数据、miRNA表达数据、拷贝数变异、DNA甲基化、SNP。数据下载肿瘤研究经常需要下载相关数据,目前可以通过官网(http://www.cbioportal.org/)直接下载,或者xenabrowser 下载。xena下载比较简单,选择需要研究的癌症种类,直接下载所需的文件就可以了。https://xenabrowser.net/datapages/?hub=https

2020-05-20 17:06:29 1212 1

原创 R boxplot

R boxplot 绘图数据: a=read.table("C:\\Users\\XXX\\Desktop\\a.txt",head=T)ggplot(a, aes(x=factor(Slides), y=Yield, fill=factor(Slides))) + geom_boxplot() +theme_bw() + xlab("Slides Number")+ylab("Yield(ng)") + ggtitle("DNA yield")+scale_y_continuous(limits

2020-05-20 10:51:38 190

原创 R barplot error bar

R barplot 误差线绘图参考:http://www.cookbook-r.com/Graphs/Plotting_means_and_error_bars_(ggplot2)/数据情况tg=read.table("C:\\Users\\XXX\\Desktop\\quality.txt",head=T)library(Rmisc) library(ggplot2)# Error bars represent standard error of the meantgc <- su

2020-05-15 17:44:13 822

原创 R 绘图练习-折线图

R 折线图绘制数据筛选函数 subset绘图包 ggplot2a=read.table("C:\\Users\\XXX\\Desktop\\data.xls",head=T)b=subset(a,batch=="Batch4" |batch=="Batch5"|batch=="Batch6") ggplot(c, aes(x=datasize, y=GeneNumber,color=SampleID)) + geom_line() + geom_point()+theme_bw()+ scale_

2020-05-14 16:51:00 206

原创 大数定理

大数定理当抽样样本足够大,抽样分布趋近总体分布,均值接近总体期望。中心极限定理期望和方差一定的情况下,无论抽样分布如何,抽样的均值服从正态分布

2020-05-12 16:52:17 138

原创 非参数检验

非参数检验1. 秩和检验目的:检验两组或多组数据均值是否相等,与t检验不同的是不要求正态分布,只要求样本独立。方法:把所有数据放到一起,从小到大排列,每个数据的位置标号就是秩。两总体秩和检验;多总体秩和检验(要求,每个总体的样本含量大于5,总样本含量大于15);H0:各总体均值无明显差异;注意事项:一般来说,成组数据的t检验和方差分析比秩和检验更准确,这是由于秩和检验只利用了排序的位置信息,没有利用差值的大小,但是秩和检验可以用于更广泛,比如总体非正态、定性数据等。2. 符号检验方法:相当于

2020-05-11 17:50:40 2954

原创 生存分析

R安装install.packages(“surviaval”)install.packages(“survival”)library(KMsurv)library(survival)测试library(“survival”)library(“survminer”)data(“lung”)fit <- survfit(Surv(time, status) ~ sex, data = lung)surv_diff <- survdiff(Surv(time, status)

2020-05-11 17:47:39 277

原创 数字特征

描述性统计变量-数字特征描述性统计是借助图表或者总结性的数值来描述数据的统计手段。中心位置:描述数据的平均情况均值 mean中位数 median众位数 mode # 出现次数最多的发散程度,数据以中心位置为标准有多发散极差,PTP,max-min方差,variance,var(data),标准差,std(data)变异系数CV,cv=std(data)/mean(data)偏差程度z-score,定义z-分数(Z-Score)为测量值距均值相差的标准差数目,(data[0]

2020-05-11 17:33:27 397

原创 python 饼图绘制

python pieimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata=pd.read_csv( 'C:\\Users\\zhuxiaolong2\\Desktop\\pfizer0506\\fastQC.Batch14.45_6MAY2020.xls', engine='python', sep='\t' )data.rename( columns={"rR

2020-05-11 16:19:48 306

原创 排序

冒泡排序def bubble_sort(items): for i in range(len(items)-1): flag=False for j in range(len(items)-1-i): if(items[j]<items[j+1]): temp=items[j+1] items[j+1]=items[j] items[j]=t

2020-05-11 11:44:12 97

原创 python 简单绘图1

matplotlib 绘图例子import numpy as npimport matplotlib.pyplot as pltimport turtle as t plt.figure(figsize=(7, 6.5)) plt.plot([1,2,3,4])plt.ylabel('some numbers')plt.show()plt.savefig('C:\\Users\\XXX\\Desktop\\test2png.jpg', dpi=500)

2020-05-09 15:04:13 161

原创 python 文件读取

Python 学习之输入输出常用Excel,txt文件读取// A code blockimport pandasdata1=pandas.read_table( 'C:\\Users\\Desktop\\1.txt', engine='python', sep=',', encoding='utf-8' )data1data2=pandas.read_csv( 'C:\\Users\\Desktop\\pfizer0506\\fastQC.Ba

2020-05-09 14:20:07 89

原创 Conda 安装

1.Python3安装https://www.python.org/downloads/release/python-382/wget https://www.python.org/ftp/python/3.8.2/Python-3.8.2.tgz./configure --prefix=/usr/Python-3.8.2/Make && make installexport PATH="$PATH:/usr/Python-3.8.2"#PYTHONPATH是Pyth

2020-05-09 11:26:43 179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除