自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(168)
  • 资源 (6)
  • 问答 (1)
  • 收藏
  • 关注

原创 用limma包进行多组差异表达分析

写在前面:最近在使用limma包进行差异表达分析,参考了网上许多教程都觉得说的云里雾里,很不清楚。经过我自己一段时间非常痛苦的钻研,弄明白了,解决了我的实际需求。于是决定将我的分析经验写下来,分享给需要的人。首先加载前期预处理好的表达矩阵。(我的原始表达矩阵文件已附在文后,大家有需要可以下载实践)setwd("E://Rworkplace")data<-read.table...

2020-03-15 00:20:16 32671 28

原创 R语言 |一些常用的数据整理的技巧(二)

参考:https://blog.csdn.net/kunxitoothache/article/details/109897918。假设上述文件的名称为test.pbs。主要要注意的是“peak”NR的应用;

2024-04-22 16:50:46 266

原创 R语言 | 一些常用的数据整理的技巧(一)

【代码】R语言 | 一些常用的数据整理的技巧(一)

2024-04-22 16:42:57 75

原创 GitHub登不上:修改hosts文件来解决(GitHub520,window)

4.搜索框输入cmd。打开cmd,输入ipconfig /flushdns。GitHub网站一直登不上去,后来参考上述网站的链接解决。3.将上述内容,复制到hosts文档的最后。2.打开window的下述目录下的文档。5.重新打开GitHub网站,顺利打开。1.复制下面的内容。

2024-03-04 15:15:30 1274 4

原创 Microsoft 365自定义安装软件

如图,在安装类型的步骤的时候,可以勾选自己想要的软件(而非一股脑儿的安装一大堆自己不需要的)。

2024-02-23 22:25:12 172

原创 Office2013 | Office Professional Plus 2013

使用指南。

2024-02-21 15:36:32 203

原创 磁盘清理 | 已经卸载的软件还出现在应用和功能里怎么办?

最近磁盘满了,需要删除一些平时不常用的软件,但是发现一个问题。就是已经删除的软件,仍然会出现在“应用与功能”中。作为一个强迫症,我想要有一个比较清爽的电脑,解决掉这些残留。注:我目前卸载软件都是通过以下步骤卸载的。即控制面板 ==> 程序 ==> 卸载程序来处理的。安装完成之后,解压到合适的位置。这样就可以把残留的内容全部删掉,就不再会在 [应用与功能] 这边显示了。然后,接下来,点击特定的你想要彻底删除的软件,选择“强制删除”。安装Geek Uninstaller,删除卸载残留。

2023-10-21 16:25:38 5247 3

原创 cannot coerce class ‘“igraph“’ to a data.frame

参考链接:https://lists.nongnu.org/archive/html/igraph-help/2018-02/msg00019.html。

2023-01-12 12:31:05 1570 1

原创 bash: line 5: bgzip: command not found

无。

2022-10-21 11:42:04 1105

原创 tar: Exiting with failure status due to previous errors

tar: Exiting with failure status due to previous errors

2022-10-21 10:11:33 518

原创 R语言画图 | ggplot2标注图中的感兴趣的点

解答:使用ggrepel package。

2022-09-02 20:45:25 755

原创 R语言画图 |geom_violin()

参考链接http//www.sthda.com/english/search/search.php#results。(2)通过使用RcolorBrewerpackag解决了set1颜色集中颜色不够的问题。(1)通过设置factor的level顺序,人为规定画图的顺序。

2022-07-17 18:30:12 614

原创 R语言绘图 | geom_bar()使用示例

在做项目的过程中,一般会有一些重复使用的代码,这个时候,就会想把他包装成函数。每次套用的时候,只需要改变输入就可获得相应的结果。

2022-07-17 15:23:36 1416

原创 代码文件备份 | 6-30 组学数据差异分析

课程作业代码备份。

2022-06-30 19:38:13 239

原创 Perl语言的“解引用”法则

perl语言的解引用。

2022-06-09 19:03:03 188 1

原创 WGCNA与基因模块时空表达分析

分析目标:(1)梳理WGCNA的基本流程。(2)功能注释(3)对相应的基因模块进行时空表达特征评估一、WGCNA分析(基因共表达分析)我们有4000+个感兴趣的基因,希望通过这一步得到的结果是:按照基因之间的表达特征的相似性,将其分为若干基因模块(module)。本次实验使用的数据集(1)GSE25219-GPL5175数据集:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE25219(2)GSE25219-GPL5175样本注.

2022-05-05 16:49:10 2191

原创 R基础学习 | 处理数据的技巧整理

这里总结一下,今天老师上课的内容。我觉得跟着老师,我能学到好多东西。我要消化。我突然觉得自己很卑微,因为有那么多东西需要学习的。但是复习的侧重点在:什么是自己知道的?什么是自己不知道的?缺什么补什么?R基础知识整理(查漏补缺)S1:identicalidentical(a,i) #既检验数值又检验数据类型i==m== 仅仅是数值的比较;identical 则同时包括数值和属性的比较;S2: stringasFactor=FALSEdf3 <- data.frame(a=.

2022-03-25 21:37:16 2002

原创 单细胞基础分析 | 基因细胞类型特异性富集分析

本文目标是:通过分析单细胞的数据,根据已有的细胞分型,去看我们感兴趣的基因集在这些细胞类型中的富集情况。单细胞数据和bulk数据会有些不同,可能一些具体的技巧需要注意一下。1。切换到R4环境,加载RDS数据。conda activate r4R #进入到Rdata<-readRDS("merge_obj.rds") # 加载原始数据library(Seurat)#加载Seurat包levels(data) #查看数据集的level [1] "L5 IT" "L4 IT".

2022-03-21 17:25:21 1410 1

原创 生物信息学分析 | 物种间的同源基因的批量注释

项目需求:现在以及大鼠的基因若干,想要转换成人类对应的同源基因的名及ID,怎么对应?解决策略:(几行代码就可以快速解决,感谢R)#安装好R包install.packages("homologene")library(homologene)homologene::taxData#Rattus norvegicus:10116 #Homo sapiens:9606###############################################################.

2022-03-18 13:58:13 753

原创 生物信息学 | 富集分析

主要目标:理解这个代码的主要的思路。想分析一下老师的这个富集分析的主要的思路是什么?一行一行的理解这个代码。# Get cell type mean of each genecellTypeMean <- t(apply(dat, 1, function(v) { tapply(v, droplevels(factor(cellSubtypes, levels=subtypeOrder)), mean)}))}(1) droplevels()是什么意思> x <- c.

2022-03-17 19:01:50 1028

原创 affymatrix探针转换 | GPL5175探针对应的基因转换

一般情况下,有一些比较成熟的对应平台的注释数据集的R包。但是这个注释平台,我在Bioconductor上找了一圈都没有找到。只能通过最原始也最可靠的方法,从GEO数据集上去下载这部分的注释文件。以下展示全过程。我要检查的数据平台是:GPL5157。数据集的注释集链接为:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL5175这个注释数据集比较难弄的地方在于,它的基因集注释的不太好。没有比较直接的可供提取的genesample的信息;在ge.

2022-03-17 18:26:17 4647 4

原创 R语言报错 | Error in scan(file = file), line 5503 did not have 12 elements

一般是读取txt文件的时候遇到上述问题,原因是读取table的时候,不同的行有空格,导致列数不同,无法对齐。Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :line 5503 did not have 12 elements解决方法一般有三步:(1)跳过注释行。probe_test<-read.table("GPL5175-probe-annonation.txt",commen

2022-03-17 11:25:19 15214 7

原创 出错记录:Error: package or namespace load failed for ‘DESeq2’:没有这个DLL ‘BiocParallel’:是不是没有为此架构安装?

出错记录:Error: package or namespace load failed for ‘DESeq2’ in library.dynam(lib, package, package.lib): 没有这个DLL ‘BiocParallel’:是不是没有为此架构安装?解决策略:强制重装缺失的那个R包。BiocManager::install("BiocParallel",force = TRUE)...

2022-03-15 16:19:46 3647

原创 单细胞基础分析 | 对细胞按照基因marker进行分型(ACC脑区)

因项目的需求,需要对数据进行简单的分类,然后找差异表达基因。虽然我自知自己在这个过程中的很多方面并不理解透彻,很糊涂的去做。但是我愿意去尝试完成。现在开始跟着Seurat上面的教程一点点的来做。参考链接:https://satijalab.org/seurat/articles/pbmc3k_tutorial.html1、加载分析必须的包library(Seurat)library(dplyr)library(patchwork)2、加载10XGenomics 数据data<-.

2022-03-12 16:16:41 8446

原创 代码文件备份 | 3-10:对arraymatrix数据进行初步筛选与分组差异表达分析

data<-read.table("GSE25219-GPL5175_series_matrix.txt",comment.char = "!",header = T)row.names(data)<-data[,1]data<-data[,-1]label<-read.table("label.txt")region<-read.table("region.txt")year<-read.table("year.txt")meta.data<-rbi

2022-03-11 00:01:10 323

原创 R语言 | R语言分析琐碎

首先,文件夹下应该存在三个文件,分别命名为:barcodes.tsv.gzmatrix.mtx.gzfeatures.tsv.gz然后使用Seurat包中的,Read10X方法读取。library(Seurat)data<-CreateSeuratObject(Read10X("./"),"ACC")如上,即读取成功!如何跳过注释行(如#),读取.txt文件。使用参数:comment.chardata<-read.table("GSE25219-GPL5175_ser.

2022-03-10 23:53:48 1387 1

原创 R语言绘图 | 安装包报错:‘configure‘ exists but is not executable、whether the C++ compiler supports the long lo

Error in library.dynam(lib, package, package.lib) : shared object ‘stringi.so’ not foundCalls: <Anonymous> ... loadNamespace -> namespaceImport -> loadNamespace -> library.dynamExecution haltedERROR: lazy loading failed for package ‘res

2022-03-05 21:29:10 1129

原创 R语言画图 | 如何看已知基因list的细胞类型特异性表达?

自己学东西,觉得举步维艰。网上的资源太多了,反而让人很容易陷入一种焦躁和慌乱中。不知道从哪里理出头绪来。是碎片化的,不成体系的。自己需要对信息进行过滤,整合成自己的方法。目标:加载作者的处理过的有细胞类型标签的数据,对数据进行差异表达分析,找到特定的组织中差异表达的基因。注明以下使用到的数据来源:http://development.psychencode.org/files/processed_data/scRNA-seq/Sestan.fetalHuman.Psychencode.Rdata.

2022-03-03 22:31:31 1075

原创 no applicable method for ‘depth‘ applied to an object of class “NULL“

报错信息:pheatmap(data)Error in UseMethod("depth") : no applicable method for 'depth' applied to an object of class "NULL"解决方法:再试一遍。

2022-03-02 18:56:43 6737 7

原创 R语言学习 | 想要用分隔符“|”分割字符,却出错?问题在哪里?

"|"符号在正则表达式中可以表示为“或”的含义,因此当字符串中出现该字符,而我们还想要用该字符进行分隔时,需要注意使用转义字符,且为两个斜杠。\\gene<-str_split_fixed(gene_name,"\\|",n=2)gene [,1] [,2] [1,] "ENSG00000000003" "TSPAN6" [2,] "ENS.

2022-03-02 16:36:31 1651

原创 R语言学习 | 如何提取指定行名的行?

想要实现的目标如题。善用属于符号:%in%,以及不要忘记XX$V1。我想要提取数据框cpm2中行名在vector interest中的行,使用如下指令解决。interest<-read.table("result_coding_gene_id_2.txt")data<-cpm2[which(rownames(cpm2)%in%interest$V1),]interestV11 ENSG000000004602 ENSG000000010843 ENSG0000000.

2022-03-02 16:26:57 16929

原创 R语言绘图 | 堆叠图的绘制

目标:绘制每一种亚类的堆叠图,使呈现效果更好。是时候要挑战一下自己的舒适区了。传统的barplot实在是不行了。1。首先综述一下目前用到了实现这一功能,用的是哪些package。library(ggplot2) #似乎ggplot2就能实现这一效果。2。其次创建输入数据矩阵。data<-data.frame(Sample<-c(rep('control1',3),rep('control2',3),rep('control3',3),rep('treat1',3),rep('.

2021-12-10 21:50:34 4331

原创 如何比较两个文件的内容,去除一个文件中,在两个文件中有overlap的部分?

后来尝试下来,使用daff包可行。data1<-read.table("L2-3-IT.txt") #待比较A文件data2<-read.table("L2.txt") #待比较B文件install.packages("daff")library(daff)d<-diff_data(data1,data2)render_diff(d)将结果保存为xlsx格式,放到excel中进行简单筛选即可。...

2021-12-07 09:11:47 656

原创 比对 | 对于比对结果一些细节的理解?

1。为什么明明全部是151M,mapping quality却为0?以序列“A00928:207:HYLCHDSXY:2:1466:11415:24330”为例,进行分析。(base) [xxzhang@mu02 V1C]$ grep "A00928:207:HYLCHDSXY:2:1466:11415:24330" result_T45.samA00928:207:HYLCHDSXY:2:1466:11415:24330 99 chr16 29568232 0

2021-11-24 21:49:25 695

原创 近期写文章的规划

每次遇到一个具体的问题,都不好意思开口说自己是这个专业的。只知道一点,但是了解的并不是很多。觉得是自己很大的一个不足。(1)一方面是本科期间这方面涉猎的并不是特别多。GWAS和WGCNA都没有很广泛的涉及。(2)另一方面,自己当初学的并不是特别的精深,只知其然,不知其所以然。(3)增强自己数理化计算机的本领。自己所在的这个实验室,有各方面的专业的人才,很适合我自己的发展。老师也是多边形的战士,所以要充分利用好身边的这部分资源。下面要有一个写作的计划。1。关于单细胞多组学方面的文章。2。WGC.

2021-11-01 21:10:01 154 1

原创 经验总结 | R语言批量读取目录下的文件然后按照行名对其进行整合成为data.frame

参考链接:https://www.jianshu.com/p/3f1f27fdd35b发现这哥们写得和我目前的需求是一致的,于是按照它的思路看一下。我的目录文件:path <- "F://张秀秀//过程性文件//10//26//count"fileNames <- dir(path) filePath <- sapply(fileNames, function(x){paste(path,x,sep='/')}) data <- lapply(filePath, f

2021-10-31 23:14:50 2482 1

原创 win10任务栏以及开始菜单点击无反应的故障修复

1。通过某种方式,进入电脑的安全模式。进入安全模式需谨慎,因为需要填写账户下的密码,此密码是window账户的密码,并非一般登录的密码,一定要记得。2。进入安全模式之后,再通过某种方式进入命令行方式。在命令行方式下输入指令:bcdedit /deletevalue {default} safeboot重新进入普通模式,即可。最后记住一句话:若是用户在win10系统下遇到故障不知道怎么解决,可以通过进入安全模式解决。不要信网上的,重启资源管理器等,没啥用。也不要被网上的一些严重到要重装系

2021-10-29 17:24:53 2001

原创 如何批量删除指定目录下的空文件夹:find&rm

find -type d -empty | xargs rm -rf

2021-10-25 14:55:28 597

原创 Python读取文件的方式及基本区别

这个之前想过要整理,但是一直没有集中的时间。1。使用read()读取整个文件barcode_name = "barcode_test.txt"fb = open(barcode_name)txtname = fb.read()print(isinstance(txtname,str))print(txtname) TrueAAACAAGCAAACCAGCAAACAAGCAAACCAGCAAACAAGCAAACGCGTAAACAAGCAAGGCCTGAAACAAGCACAACAT.

2021-10-10 11:08:06 1103

原创 实验记录 | 如何拆分scATAC-seq数据成为单个细胞?(1、解决barcode问题)

在师兄的帮助下,我得到了师兄筛选过的细胞的barcode的数据,那么接下来我想根据这些barcode,将来源于同一个barcode的细胞的reads提取出来,这个还是一个蛮有技术含量的事情的,因为上次我有使用过perl的脚本进行提取,最后的实验结果很糟糕,故而这件事情一直搁置到现在,没有继续去做(我的脚本的编写能力还是有待于加强,可能是刚刚喝了奶茶,和老妈弟弟聊了好多闲话,很开心,觉得在某种程度上休息够了,对于工作也是一种非常快乐和积极的状态了)。0。前期失败尝试回顾...

2021-10-07 16:00:21 972

annotation.txt

热图那篇文章用到的数据文件

2021-08-07

result_data.csv

热图那篇文章用到的数据文件

2021-08-07

邮件合并操作生成的模板.docx

这个文件是博客,邮件合并操作所得到的结果文件之一(1/2)。

2021-04-14

人事信息.xlsx

邮件合并操作博文中用到的xlsx文件。

2021-01-30

GSE98793.txt

本次实验使用的筛选差异表达基因原始数据文件 原始数据在GEO数据库中的ID号为GSE98793

2020-03-15

gene_list.txt

样本分类信息 你们可以按照自己的数据的性质 ,对样本分类信息进行个性化的调整。

2020-03-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除