自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Yujia's Blog

分享我在生物信息学和计算机/统计/数学方面的知识

  • 博客(85)
  • 收藏
  • 关注

原创 【ECG实践篇(1)】MIT-BIH数据库数据解析的方法以及使用rdann获取人工标注注释的方法

目前国际上有三个公认的标准心电数据库:美国心脏学会的AHA数据库,欧洲AT-T数据库以及美国麻省理工学院提供的MIT-BIH数据库。其中MIT-BIH数据库应用的比较广泛,所以,我们做后续训练也就是使用这个数据库的数据。作为ECG实践篇的开端,我们第一步就是要获取MIT-BIH数据库的心电数据和数据对应的注释,数据解析代码会在文末放送【需要注意的是】 本文主要讲的是怎么解析从MIT-BIH数据...

2019-01-05 16:53:04 17305 22

原创 【ECG理论篇】(3)AI实现心律失常判别:心电信号的波形识别与特征提取

心电图中的各个波形都包含了非常多的信息,例如RR间期可以反映心动周期的时限;相邻心动周期的 RR 间期的比值可以反映室性早搏;R 波和 S 波幅值的比值和 R 波和 S 波之间的时限可以反映房性早搏等异常情况,等等所以识别这些波形以及提取相应特征对我们后续做心律失常的分类很重要。我们在用算法做心律失常判别分类之前,有两个关键点:第一步: 识别检测ECG信号中的波群(目前主要是先定位QRS波...

2018-11-26 10:39:19 20966 16

原创 【ECG理论篇】(2)AI实现心律失常判别:心电数据预处理

我们做心律失常判别的第一步就是拿到数据后,对心电数据进行预处理,数据预处理的核心重点就是去除噪声。那么,我们首先就要了解一下心电数据中的噪声来源心电信号数据中的噪声来源心电信号数据中的噪声主要可以分为三类:工频干扰,基线漂移,肌电干扰工频干扰:工频干扰主要是由电力系统引起的,频率大概为50HZ。基本上所有的生物电信号中都含有工频干扰的信号,工频干扰会影响我们对数据的分析判断,所以要在数据...

2018-11-26 10:34:11 4993 7

原创 【ECG理论篇】(1)AI实现心律失常判别:心电基础知识及利用算法判别心律失常的分析流程

最近开始做一个新的项目,使用深度学习来优化传统的心律失常预测算法因为自己也是初涉这个方向,所以学习开始的第一步就是了解背景知识。首先要了解的背景知识1.什么是心电图,心电的特点2.心电图中各个波群的含义3.常见的心电检测算法,以及信号处理相关4.其它等等…我先列出目录,持续更新...

2018-11-24 09:51:34 7420 11

原创 2023_0102_生活记录

23年新年快乐!博主我23年的第一篇blog,先不填技术坑,而是写写最近的思考吧🌼。这个小博客的粉丝不知不觉已经快到600人了,我还蛮惊讶的,看来我也有成为网红博主的潜质噢(开玩笑 🤣)。当然还是学业为先,希望新的一年学有所成!

2023-01-02 01:50:11 536 1

原创 宏转录组测序数据菌株层面的分析软件总结

tools for metagenomics data based Strain level analysis

2022-12-24 18:24:27 466

原创 执行Hexo d报错Spawn failed, 以及OpenSSL SSL_read: Connection was reset, errno 10054

今天在重新整理自己用hexo搭建的Homepage,但是当我使用hexo d 命令将我的文件传到github上的时候报了以下错误$ hexo dINFO Deploying: gitINFO Clearing .deploy_git folder...INFO Copying files from public folder...INFO Copying files from extend dirs...warning: LF will be replaced by CRLF in 2

2021-03-18 22:46:12 3566 4

原创 2021_0207_生活记录

现在是北京时间02:27为啥我现在还没睡觉呢,因为我在赶DDL ????DDL果然是第一生产力, 今天做完这个,我的2021的第一个愿望是,新的一年开始不要再赶DDL了!赶DDL的时候脑子比较迷糊,就来写写我的小博客今天生活记录的核心主题和生信无关(生活记录当然是生活啦,不谈学习)最近一直在思考一个问题,当我们前期努力达到一个目标的时候,可能会出现暂时的迷茫期, 因为不知道该做啥了(该阶段需要完成的东西都已经完成好了); 这段时间我也在想该如何面对和处理这样的迷茫感,目前的解决方案是定一个更高的目

2021-02-07 02:27:43 366 3

原创 2020_1123_生活记录

今天想写点别的内容, 虽然今年生信的博文没写多少,但是我的生活感悟还挺多,下面会比较杂乱的记录一下此时的想法 ????最近的事情很多, 每一项事情都在考验我的时间管理能力,11月底就有3个DeadLine要赶进度,尽管很忙,还是加油吧啊,废寝忘食的学习????我觉得很多时候,无论是处理事情,还是处理和人之间的关系,我们更多的是在整理自己的情绪去面对这些外界的刺激,当我们管理好自己的情绪,很多问题也就迎刃而解了今天是晴天, 我的心情很好, 最近一直在循环听一首歌, < Traveling ligh

2020-11-23 12:15:02 294 4

原创 【代谢组学入门1】学习资源收集

大家好,最近博主将持续更新在代谢组学数据处理方面的学习笔记,作为代谢组学的入门选手,欢迎各位同学一起交流 ????根据前段时间的调研,我感觉中文的代谢组学数据分析的教程和学习资料比较少,因此这里展示的收集资料大多数是英文的????中文教材脂质组学(韩贤林)代谢组学:方法与应用(许国旺)我买的是这两本教材,感觉看着还可以(请买最新版),对入门选手较为友好了解什么是质谱和色谱因为代谢组学所用到的质谱/色谱这些仪器 实际是涉及分析化学领域了,因此建议先看看慕课上关于质谱和色谱的原理介绍,我看的是

2020-07-16 22:45:27 2142

原创 shiny datatable child row:shiny表格二级子行的展开与折叠

文章目录简介代码示例child row按钮的样式具有样式的childTable代码如下:简介Rshiny中的datatable可用于我们展示表格数据,但是总会遇到表格内容太多,需要折叠的情况,类似于下面图片所示:绿色按钮点开之后,可以展示每一行折叠的详细信息。表格每行内容的二级子行信息,就叫做 Child Row代码示例我参考了一位 外国博主的代码 , 来 shiny 中实现这样具有子信息的表格childTable 是封装好的函数childTable <- function(x,

2020-06-06 13:51:11 1597

原创 2020_0527_近期思考

最近几个月很少在博客上更新了,因为博主我正在屡拒屡投的投稿过程中磨练 ????如果有些小伙伴的留言没有回复请见谅,因为确实事情较多,所以博客看的很少了接下来聊聊我近期的情况吧,第一个是和科研相关的感悟:做生信,特别是交叉学科,越早期的时候,要尽可能多的尝试不同的方向因为现在有非常多的Seq技术,未来仍然会有很多新技术出现,在发展早期尝试多个技术方向,有了这些积累,当未来需要解决一个问题的时候,自己可以很明白这个问题需要用到什么技术,以及这个问题是否现有技术可以被解决,从而使方案更具有可实施性。对于

2020-05-27 11:09:52 337

原创 使用R包qpdf用一行代码将多个pdf合并为一个pdf

今天本来准备用福昕pdf把多份pdf合并成一份pdf, 但是竟然只有会员才能享有这个功能,而且一个月的会员就要79元RMB, 作为一个还在上学的学生,我没有这么多零花钱买会员,唉,只能自己动手丰衣足食了,仔细在网上找了找,发现R里面有一个R包可以用来合并Pdf, 完美!library(qpdf) setwd("C:/Users/Administrator/Desktop/") ## 设置工作...

2020-04-22 14:09:20 2290

原创 Error in loadNamespace(name) : there is no package called ‘yaml’

yaml包安装出错, 无论是我从cran上下载zip从本地安装,还是install.packages(“yaml”) 安装, 要么显示Warning in install.packages : package ‘yaml’ is not available (for R version 3.5.3)要么显示 无法安装搜了搜网上,终于有一个work的方法1)首先输入 .libPaths...

2020-03-14 20:35:36 6737

原创 mirdeep2使用笔记

简介mirDeep2可用于新microRNA的预测,以及microRNA的定量这个软件由多个perl脚本模块组成mapper.plmiRDeep2.plquantifier.pl下载安装## 首先下载和解压缩wget https://github.com/rajewsky-lab/mirdeep2/archive/v0.1.3.tar.gztar -xvzf v0.1.3.t...

2020-02-14 21:34:32 5894

原创 perl软件使用报错总结

使用perl写的软件时,总会出现模块没有安装的报错或者调用的报错,本文就总结一下相关的情况, 之后遇见的相关报错也会持续更新加进来1.软件自带自己写的module, 并在主程序中调用了自己写的module例如我在使用mireap这个软件的时候,它的目录结构是 bin文件夹下是mireap.pl主程序,lib文件夹里存放了它自己写的三个模块: FFW1.pm , FFW2.pm , Struct...

2020-01-06 10:36:47 1707

原创 关于读研和生信学科的思考

不知不觉已经过去一年了,从雁栖湖回来也4个月了,说说自己现在对读研的思考吧。第一点,对生物学和生物信息学有了新的认识一年前刚刚大学毕业的我写了一篇博文 Best生信学家应该掌握的数学,当时我提到不懂算法原理只是使用计算工具来解决生物问题的研究者本质还是生物学家,那个时候的我很追求计算技术上的创新 。现在我的认识是,无论是实验还是计算工具, 只要能用 最简单的方法 解决重要的科学问题,他就是一...

2019-12-04 12:42:40 829 2

原创 Gephi绘制网络图初步探索

文章目录1. Gephi 基本功能简介1.1 数据输入格式1.2 Gephi界面初探1.3 数据导入2. 设置节点的属性2.1 设置节点颜色2.2 设置节点大小2.3 设置布局2.4 关于边的属性3. 图的设置4. 预览(preview)5. 导出6. 参考链接1. Gephi 基本功能简介近期因为要绘制特效基因网络图,所以开始学习Gephi, Gephi是一款功能很强大的网络绘制软件,对于...

2019-10-14 11:39:22 11718 6

原创 【学习总结】人群队列数据分析

上周学习了刘老师人群队列数据实战的课程,自己受益匪浅,课程主要讲的是大人群队列数据分析的一些背景知识和底层原理,并且使用R语言进行代码实现。本篇笔记主要是对人群队列数据分析的基础知识和流程进行一个大体的总结回顾,具体的每个单独模块的细节内容和代码,我也都做了笔记,并且整理好了放在个人的Github上,目录如下【学习笔记整理目录】1-基础遗传学/统计学知识复习2-关联分析3-M...

2019-06-24 21:37:38 3080 12

原创 【生信进阶练习1000days】day22-复习day1~day14的知识点

制作了一个思维导图,来复习day1-day14所学习的Bioconductor workshop 2018的知识点但是图太大,整个博客放不下,所以xmind我存储在自己的github上的,感兴趣的同学可以自己下载学习https://github.com/Candlelight-XYJ/Bioinformatics-1000days/blob/master/review_day1_to_day...

2019-06-19 10:45:58 394

原创 【生信进阶练习1000days】day16~day22-RNA-seq data analysis with limma edgeR and Glimma

文章目录学习来源1. 数据准备学习目标1.1 安装RNAseq123包和所需的包,并下载样本数据1.2 读入文件1.3 构建样本的分组信息1.4 基因注释2. 数据预处理2.1 转换count数据为CPM值2.2 过滤表达量太低的基因使用limma,edgeR,Glimma 进行完整的数据分析流程指南 可参见:http://master.bioconductor.org/packages/re...

2019-06-19 10:28:48 1596

原创 【生信进阶练习1000days】day15-SRAdbV2包

文章目录学习来源1.Sequence Read Archive(SRA)1.1 Scroller提供两种方法来存取数据2. Query syntax3. Using the raw API without R/Bioconductor学习来源https://bioconductor.github.io/BiocWorkshops/public-data-resources-and-bioco...

2019-06-19 10:24:06 554

原创 【生信进阶练习1000days】day14-GenomicDataCommons(GDC)

学习章节https://bioconductor.github.io/BiocWorkshops/public-data-resources-and-bioconductor.html#genomicdatacommons文章目录学习章节1. GenomicDataCommons2. Quick start2.1 安装包&检查数据库连接状态2.2 查找数据2.3 下载数据2.4 Met...

2019-06-10 09:35:40 1291

原创 【生信进阶练习1000days】day13-GEOquery

学习章节https://bioconductor.github.io/BiocWorkshops/public-data-resources-and-bioconductor.html文章目录学习章节学习目标需要预先准备的R包1. GEOquery1.1 Overview of GEO1.2 GEOquery的使用案例:MDS plot of cancer data1.3 Accessin...

2019-06-10 09:33:13 928

原创 【生信进阶练习1000days】day11&day12-GEO data mining

GEO数据挖掘文章目录GEO数据挖掘0. 安装并加载包1. 下载GSE数据和探针注释1.1 下载GSE数据1.2 下载探针注释数据1.3 将表达矩阵中的探针id 转换为 基因symbol1.4 表达矩阵检验2. 差异基因表达分析2.1 设计分组信息2.2 差异分析2.3 绘制火山图2.4 绘制热图待续0. 安装并加载包if (!requireNamespace("BiocManager", ...

2019-06-10 09:29:38 976

原创 【生信进阶练习1000days】day10-vcf format

文章目录学习材料1. VCF(Variant Calling Format)学习材料https://docs.gdc.cancer.gov/Data/File_Formats/VCF_Format/1. VCF(Variant Calling Format)VCF文件是常见的文本格式,它包含三个主要内容:meta-information lines(元信息)a head line...

2019-06-10 09:27:42 370

原创 【生信进阶练习1000days】day9-BSgenome和AnnotationHub

文章目录1. BSgenome packages2. AnnotationHub2.1 查询AnnotationHub2.2 AnnotationHub Data providers, Data classes, Species, Data sources2.3 AnnotationHub query2.4 AnnotationHub exercises2.5 AnnotationHub使用的报错...

2019-05-31 09:26:58 971

原创 【生信进阶练习1000days】day8-OrganismDb.dplyr包

文章目录学习章节1. OrganismDb.dplyr 包1.0 基础用法1.1 获取TxDb对象中的启动子1.2 Extract a table from the underlying database1.3 执行一个复杂查询 Make a complex query between tables in the underlying database1.4 Organism.dplyr 练习学...

2019-05-30 09:08:20 284

原创 【生信进阶练习1000days】day7-RSQLite的使用

学习来源:https://cran.r-project.org/web/packages/RSQLite/vignettes/RSQLite.html文章目录1. 创建一个新的SQLite数据库2. Loading data (加载数据)3. Queries (查询)4. Batched queries5. Multiple parameterised queries6. Satements参...

2019-05-29 10:35:27 740

原创 【生信进阶练习1000days】day6-OrganismDb packages

文章目录OrganismDb packagesOrganismDb packagesOrganisamDb packages是汇总了相应物种的OrgDb, TxDb和 GO.db的元数据包,它允许各个包之间的交叉查询。我们可以使用之前提到的函数 select(), mapIds,transcripts等等 对包中注释内容进行提取library(Homo.sapiens)Homo.sapi...

2019-05-29 10:24:54 239

原创 【生信进阶练习1000days】day5-TxDb等注释包的使用

文章目录1. 各种常用注释包简介1.1 TXDb1.2 EnsDb packages1.3 不常规使用示例2. GRanges,Ranges2.1 GRanges2.2 GRangesList2.3 其它用于注释包中选取信息的函数3. TxDb包相关小练习1. 各种常用注释包简介1.1 TXDbTxDb包,包含位置信息。包里的注释内容,可以通过包名来判断。包名的格式是:TxDb.Speci...

2019-05-27 09:59:38 4089

原创 【生信进阶练习1000days】day4-Annotation包中mapIds函数的使用

文章目录1. The mapIds function1.1 multiVals的使用1.2 小练习1. The mapIds function**mapIds()函数与select()**函数功能相似,但它可以对数据中出现的重复元素进行清理mapIds与select函数在参数上的不同之处在于:columns 参数,只能选择一个columnkeytype 参数必须指定mapIds 包含...

2019-05-27 09:57:40 5153 1

原创 【生信进阶练习1000days】day3-Bioconductor annotation resources

学习章节https://bioconductor.github.io/BiocWorkshops/introduction-to-bioconductor-annotation-resources.html文章目录学习章节1. Introduction to Bioconductor annotation resources1.1 本次练习所使用到的R包1.2 学习目的2. Annotatio...

2019-05-23 09:11:32 617

原创 【生信进阶练习1000days】day2-学习summarized experimental data与Down stream analysis

学习章节https://bioconductor.github.io/BiocWorkshops/r-and-bioconductor-for-everyone-an-introduction.html#working-with-summarized-experimental-data文章目录学习章节1. Working with summarized experimental data1.1...

2019-05-22 14:25:25 1350

原创 【生信进阶练习1000days】day1-Bioconductor的一些补充小用法与Working with Genomic Ranges

学习章节https://bioconductor.github.io/BiocWorkshops/r-and-bioconductor-for-everyone-an-introduction.html#introduction-to-bioconductor文章目录学习章节1. Bioconductor的一些补充小用法2. Working with Genomic Ranges2.1 imp...

2019-05-22 08:48:30 1531

原创 Linux下建立MySQL数据库,并安装RMySQL包,报错及解决

文章目录1. Linux上安装MySQL2. 安装MySQL过程中的报错解决方案`报错1:`[ERROR] Fatal error: Please read "Security" section of the manual to find out how to run mysqld as root!3. Windows端使用Navicat访问远程Linux上的MySQL4. MySQL配置,供远程...

2019-05-10 14:22:14 891

原创 服务器上搭shinyApp:shiny-server配置及报错解决

文章目录1. 下载安装shiny-server2. shiny-server的服务器配置3. shiny-server的常规管理操作4. 报错收集报错1 可以登陆了,但是出现闪退: Shiny app - “Disconnected from the server. Reload.”报错2 Error in loadNamespace(name) : there is no package cal...

2019-05-10 14:10:22 7365 2

原创 【文献阅读笔记】(2):使用IMPUTES2和minimac软件完成群体特异性的基因型填充(Imputation)

Population-specific genotype imputations using minimac or IMPUTE2摘要1. 介绍-Introduction1.1 基本知识1.2 GoNL参考数据集简介1.3 进行基因型填充(Imputaion)的工具1.4 对待填充的目标数据集进行质量控制摘要文章来源于Nature Protocol本篇文章提供了一份guideline来...

2019-04-20 18:48:54 4736

原创 【文献阅读笔记】(1):一篇手把手教你做GWAS的Guideline文献解读

A tutorial on conducting genome‐wide association studies : Quality control and statistical analysisIntroduction准备软件1.数据格式准备2. PLINK的基础使用命令3. 遗传数据的质控3.1 使用HapMap数据进行数据模拟3.2 数据质量控制步骤概览4. 群体结构分层5. 关联分析5....

2019-04-20 18:36:47 8948 2

原创 Bioconductor学习_基因组坐标体系-Granges和IRanges

什么是GrangesGranges是R语言中的数据结构,它主要用来存储基因组中的坐标区间。对于R语言的用户来说,这是一种非常快捷的方式来处理基因组的数据。我们知道基因组中有非常多的间隔区间,例如基因区域,snp区域,启动子区域 等等。很多区域之间都会有相互的重叠,例如启动子可能会和SNP区域有重叠,转录因子结合位点会覆盖启动子区域 等等。GenomicRanges和IRanges两个包,可...

2019-03-10 15:49:51 4284

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除