自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Neptuneyut的博客

生物信息、机器学习、人工智能神马的都不会

  • 博客(106)
  • 资源 (8)
  • 收藏
  • 关注

原创 随手“一片”SCI,Qiime2扩增子处理流程确定不了解一下?

文章目录conda安装qiime2导入数据制作Manifest和Metadata表Import数据查看原始数据质量DADA2去噪、去嵌合体和生成OTU构建进化树绘制稀释曲线计算物种多样性物种组成分析基于sklearn方法基于blast和vsarch方法qiime2其他常用操作导出制表符分割的特征表折叠物种分类单元按样本筛选特征表参考作者:余涛email:[email protected]中国科学院...

2020-03-09 15:51:22 5950

原创 傻白甜的Python参数包argparse

文章目录简介使用简单示例位置参数和可选参数add_argument()方法参数简介对于一个完整的程序而言,传入参数是其必不可少的一部分,然而通过Python的基础语法来传入和解析参数实在是比较麻烦的事儿,能不能通过一种简单方法搞定参数呢?浑身肌肉的Python早已为你造好了轮子,这就是Python内置的用于解析参数的包argparse。argparse的便捷在于直接基于调用对象的方法添加和解析...

2020-01-04 00:01:00 481

原创 查询宇宙生命的家谱--TaxonKit工具详解

文章目录遇到的问题taxonkit 概述taxonkit安装安装下载依赖数据taonkit使用1)列出给定taxonomy id的子分类树2)从taxid获取完整谱系3)重新构造谱系的格式4)通过物种拉丁名查询taxid:name2taxid回到问题一个也不能少参考作者:余涛email:[email protected]中国科学院大学遇到的问题在做宏基因组分析时,通过基因注释得到一个包含10...

2019-06-18 15:07:12 3948

原创 Salmon-超快速、准确的基因丰度计算

文章目录获取转录组并建立索引获取转录组并建立索引为了量化转录本水平的丰度,Salmon需要目标转录组。 该转录组以多FASTA序列文件(可以是压缩的)的形式提供给Salmon,每个序列均是转录本。 在此示例中,我们将分析拟南芥的一些数据,因此我们将下载拟南芥转录组并为其编制索引。下载参考转录组curl ftp://ftp.ensemblgenomes.org/pub/plants/release-28/fasta/arabidopsis_thaliana/cdna/Arabidopsis_tha

2023-11-17 21:24:28 1489 1

原创 KofamScan-KEGG官方推荐的使用系同源和隐马尔可夫模型进行KO注释

KofamScan 是一款基于 KEGG 直系同源和隐马尔可夫模型(HMM)的基因功能注释工具,可通过同源搜索和预先计算的自适应分数阈值,将 KEGG 同源物(KOs)分配给蛋白质序列的隐马尔可夫模型(KOfam)数据库。在线版本可在 https://www.genome.jp/tools/kofamkoala/ 上获取。KofamKOALA 比现有的 KO 分配工具更快,其准确性可与性能最好的工具相媲美。

2023-11-17 21:14:28 754

原创 fastANI-基因组平均核酸一致性(ANI)计算

(gtdbtk) [yutao@myosin Eisenbacteria]$ head fa.idGCA_001780165.1_genomic.faGCA_003235575.1_genomic.faGCA_005893165.1_genomic.faGCA_005893185.1_genomic.faGCA_005893225.1_genomic.faGCA_005893265.1_genomic.faGCA_005893275.1_genomic.faGCA_005893295.1_g

2023-11-12 20:35:16 1166

原创 CompareM-平均氨基酸一致性(AAI)计算

文章目录Comparem参考ComparemCompareM执行的最常见任务是计算一组基因组之间的氨基酸配对(AAI)值。这可以使用aai_wf命令来执行.<input_file>参数表示要比较的基因组集合,可以是i)一个文本文件,其中每一行表示一个基因组的位置,或者ii)一个包含所有要比较的基因组的目录。基因组的核苷酸序列必须是FASTA格式。<output_dir>表示所有输出文件的理想目录。这个命令的典型用法是:。(base)$ mamba install -c bio

2023-11-12 20:16:07 795

原创 GTDB-Tk基因组物种注释

文章目录安装数据库参考安装conda install -c bioconda gtdbtkGTDB-Tk v1.3.0 requires ~25G of external data which needs to be downloadedand unarchived. This can be done automatically, or manually: 1. Run the command download-db.sh to automatically download to:

2023-11-10 20:29:19 1123

原创 dRep-基因组质控、去冗余及物种界定

文章目录概述使用结果参考概述在许多情况下,确定微生物之间的关系是研究问题的中心。 居住在建筑物表面的微生物是否与居住在其租户中的微生物相同? 医院病房中的微生物是否与新生婴儿中的微生物相同? 生活再木制表面的大肠杆菌与生活在塑料的大肠杆菌一样吗?常常通过平均核酸相似性(Average Nucleotide Identity, ANI)来衡量。 基本思想是比对两个基因组并计算比对中错配的数量。 例如,ANI为99%的基因组每100个碱基之间有1个错配,而ANI为95%的基因组每100个碱基之间有5个错配,

2023-11-10 20:28:22 1406 3

原创 prokka-原核及病毒基因组高效便捷注释

文章目录简介安装使用参考简介Prokka: rapid prokaryotic genome annotation全基因组注释是在一组基因组DNA序列中识别感兴趣的特征,并用有用的信息标记它们的过程。Prokka是一款软件工具,可以快速注释细菌、古生菌和病毒基因组,并生成符合标准的输出文件。安装conda install -c conda-forge -c bioconda -c defaults prokkaTestType prokka and it should output its

2023-11-09 20:59:26 967

原创 EukCC2评估真核生物MGAs质量

EukCC2是一个基于python编写的用于评估真核生物MAGs完整度和污染度的软件。可以评估binning后的单个bin或者bins目录。其原理是基于动态变化的单拷贝标记基因集(SCMGs),包括基础真核生物、真菌、原生动物及植物的SCMGs。SCMGs的原理在于基于特异物种谱系通用的单个拷贝的基因,所以可以比较预测的基因数量来评估完整性,而额外的SCMGs则是污染序列。

2023-11-09 20:58:36 820

原创 fastspar微生物相关性推断

fastspar简介fastspar是基于Sparcc通过C编写的,速度更快,内存消耗更少。sparcc是基于OUT的原始count数,通过log转换和标准化去除传统相对丰度的天然负相关(因为所有OTU之和为1,某些OTU丰度高另外一些自然就少,导致最后出现正相关少负相关多的假象)。FastSpar是SparCC算法的C++实现,比原来的Python2版本快几千倍,并且使用的内存少得多。FastSpar的实现提供了线程支持和一个P值估计器,该估计器考虑了重复数据排列的可能性(进一步的细节见本文)。F

2023-11-08 19:54:22 1111

原创 Busco-真核生物为主基因组质量评估

Busco评估基因组质量的核心原理在于通过计算基因组的通用单拷贝标记基因的比例来估计基因组的完整性。其中两个重要概念,高通用标记基因(High university)以及低重复比例(Low duplicability)。高通用标记基因定义为在**大于90%的物种中存在的直系同源基因(高通用性),低重复比例则意味着超过90%**的物种中是单拷贝基因(唯一性),核心思想就是保证尽可能地使用所有物种谱系中都存在的唯一基因。

2023-11-08 19:49:41 1288

原创 Antismash-BigScape次级代谢基因簇鉴定

antiSMASH - the antibiotics and Secondary Metabolite Analysis SHell,是用来鉴定微生物基因组次级代谢物合成基因簇的软件。临床上使用的大部分抗生素和药物均来自植物或微生物的天然产物。结合基因组挖掘的经典分离与分析法使得基于基因组的天然产物途径鉴定和描述更为方便。一般情况下,参与次级代谢途径中生物合成酶基因在基因组上成簇排列,基于指定类型的HMM,antiSMASH数据库能准确鉴定所有已知的次级代谢簇。

2022-10-05 22:25:10 9081 5

原创 单菌二三代数据组装神器Unicycler-Ragtag连接contig-pyGenomeViz基因组共线分析

Unicycler是组装细菌基因组的软件套装。它既可以使用SPAdes组装纯Illumina短读长的二代数据,也可以使用miniasm+Racon管道组装三代长读长数据(PacBio或Nanopore)。进一步,可以同时给它二代和三代数据,它将进行短读长优先的混合组装,以获得最好的组装结果。如何组装出完整的细菌基因组来自分离细菌的Illumina读段(最好是成对的,但不成对的也可以)。一组来自细菌的长读段(PacBio或Nanopore)。来自同一细菌的Illumina读段和长读段(最佳情况)

2022-10-05 20:24:53 3730 3

原创 orthofinder直系同源蛋白分析及结果处理

文章目录安装使用简介摘要背景介绍安装(gtdbtk) [yutao@myosin Genome_integration]$ mamba create -n orthofinder -c bioconda orthofinder使用简介OrthoFinder: phylogenetic orthology inference for comparative genomicsGenome Biology, 2019摘要在此,我们提出了OrthoFinder方法的一个重大进展。它扩展了O

2022-06-22 21:23:17 4145

原创 系统发育树操作神器-TreeTools-持续更新

文章目录TreeTools能做什么安装常用功能对系统发育树指定根查看是否是root tree按照叶子名称指定root按照Node名称root将root tree保存取消root按照tip label或者node删除某些树枝转换成newick文本格式TreeTools全部函数系统发育树是生物学最常涉及到的内容,有多种软件(MEGA、iQtree、raxML等)以及多种算法(贝叶斯、最大似然法、邻接法等)生成多种格式(newick、nexus、phylip)的系统发育树。我们常常通过iTOL、ggtree进行

2022-05-02 21:42:12 3858

原创 Django-前端和后端交互-云笔记项目

文章目录项目要求1.创建项目和应用2.修改setting.py3.在```user```app中创建注册和登录网页4.在```user```app中创建数据表并迁移数据5.视图函数6.启动服务,查看效果7.常见错误invalid literal for int() with base 10: b'09 14:53:49.437358'参考项目要求创建一个网页,要求注册用户,整体架构为1.创建一个note项目2.在项目中创建一个user应用,负责管理用户的注册、登录等活动3.user应用中包括完整

2022-04-09 23:54:24 834 1

原创 Django-11-最最最常用的数据库查询

文章目录数据库增删查改简介辅助调试shell1.创建数据行2.查询数据库all()values('colname1', 'colname2'...)values_list('colname1', 'colname2'...)order_by('-colname1', 'colname2'...)filter(colname1 = value1, colname2 = value2...)exclude(colname1 = value1, colname2 = value2...)get(colname1

2022-04-05 21:22:31 1650

原创 Django-10-从模板创建数据表以及sqlite3自带数据库示例

文章目录概述初始化sqlite3概述要真正有意义的展示出数据,不能仅仅从静态页面获取信息,而是需要跟后端的数据库进行交互,例如从url拿到一个检索关键词,通过post/get请求从后端数据库检索到相应的信息后,再通过前端渲染展示出来。当然这仅仅是一个非常简单而常见的要求,总的来说数据库的增删查改都是以后需要用到的。Django自带数据库sqlite3,可以直接使用,以此为例来展示上述过程,其他的数据库例如MySQL可以据此修改相应设置即可。初始化sqlite3Django在创建项目的时候自动创建一

2022-04-05 15:32:06 4123 2

原创 蛋白工厂(rRNA)和物流系统(tRNA)的识别鉴定-Barrnap,Infernal和tRNA-scan-SE

简介tRNA和rRNA是生命分子中最基本的两种构件,负责蛋白的生成。在原核生物中,上述两种基因与其他单拷贝基因不同,往往具备多个拷贝基因。rRNA在细菌中一般1-15个,在古菌中一般1-4 个拷贝rrnDB;tRNA至少18/20个,且与rRNA的数量呈现正相关tRNA拷贝数与rRNA拷贝数呈现正相关关系rrnDB16S rRNA在基因组中的拷贝数情况,多数在1-8个拷贝InfernalInfernal(“INFERence of RNA ALignment”)是用于搜索DNA序列数据库中的

2021-10-30 21:13:21 1910

原创 课题设计避坑指南

文章目录实验设计样本分组的不均一性样本采集方法与前人不同生信分析16S 扩增子分辨率有限实验设计样本分组的不均一性A large number of subjects was included in the study. However, sample size for each group is uneven, which could potentially biases the results (62 healthy subjects and 33 dandruff subjects). 1. 研

2021-09-09 16:59:06 155

原创 文献综述写作指导

文章目录深海冷泉的重要性存在问题深海冷泉的重要性深海冷泉(Cold seep):通常指富含甲烷等碳氢化合物的流体从海底沉积物界面下渗漏或喷涌的区域低温:约2~4℃高压:海底1000m以下,>10Mpa无光或弱光化能营养生态系统:甲烷为碳源和能量来源冷泉是深海生命绿洲:古菌、细菌、贝类以及鱼蟹等深海可燃冰全球气候变暖存在问题冷泉微生物如何利用碳源及如何偶联硫代谢提供能量冷泉微生物如何利用氮源,存在哪些完整的氨基酸合成/降解途径冷泉微生物是否存在光合系统,是否存在光系统电子

2021-08-16 15:28:59 423

翻译 Python六大并行神器

文章目录为什么Python比较慢RayDaskDispyPandaral-lel并行系统(Ipyparallel)Joblib参考为什么Python比较慢Python在便利性和对程序员的友好性方面很有优势,但它并不是最快的编程语言。它的速度限制很大程度取决于编译器,cPython,是单线程的。也就是说,cPython在同一时间不会使用超过一个硬件线程。最终的结果是一核有难,多核围观。虽然你可以使用Python中的threading模块来加快速度,但该模块只给你提供了并发性,而不是并行性。它有利于运行

2021-08-11 10:31:40 1956

原创 Django-9-反向解析

文章目录URL在Django出现的位置URL书写规范URL反向解析参考在介绍URL反向解析之前,首先回顾总结一下django中出现url的位置。URL在Django出现的位置模板层面:1.超链接中,例如<a href="/home">home</a>,点击后跳转到home页面2.表单中,例如,点击后将数据提交到home页面视图函数:通过HttpResponseRedirect(‘url’),实现页面跳转,例如302跳转URL书写规范在Django书写URL必须要遵

2021-07-09 21:26:30 156

原创 Django-8-模板层过滤器和继承

文章目录过滤器继承参考过滤器模板层对变量的操作实际还有很多,过滤器就是其中一种。学过Linux系统的一定知道管道操作符,其可以将上一步输出直接作为下一步输入进行处理,这里的过滤器就是类似管道符,其写法也是以管道符|为标志,允许我们对模板层获得的变量进行改变,例如大小写转换、增减大小等等语法{{ 变量|过滤器1|过滤器2:'值' |...}}这里的过滤器可以分为两类,一类是不带参数的,例如lower,upper,safe;一类是带参数的add:'10',冒号分隔,后面跟上值过滤器示

2021-07-07 21:49:10 183 1

原创 Django-7-模板层变量和标签

文章目录模板层变量模板标签参考模板层变量视图层能向模板传递哪些数据,其实python中所有数据类型都可以,str、int、list、tupple、dict、function以及class,在模板中的调用方法如下首先在视图函数中定义不同的数据类型def test_html(request): from django.shortcuts import render def fun(): return "This is a function" class c

2021-07-07 15:41:49 110

原创 Django-6-Django模板层及静态文件

文章目录Django设计模式模板层如何在视图中加载模板如何在模板中使用视图传递参数参考Django设计模式相比于Java的springboot MVC模式,Django是基于MTV模式,使用更为简单便捷。视图层是核心,控制着整个业务逻辑模板层模板可以根据视图函数传递的字典动态显示html页面如何配置模板?创建模板文件夹:<项目名>/templates在settings.py的TEMPLATES配置:TEMPLATES = [ { 'BA

2021-07-06 21:01:40 165 1

原创 Django-5-GET和POST请求

GET和POST请求逻辑在Django中GET和POST请求都由视图函数接收处理,因此在实际开发中,需要区分二者,进行不同的业务逻辑处理,常见处理流程如:def process(request): if request.method == "GET": # GET相关业务逻辑 pass elif request.method == "POST": # 处理用户提交数据和表单信息 pass else:

2021-07-06 16:05:31 271

原创 Django-4-请求及响应

概述-什么是请求及响应浏览器(或者客户端)在访问网址的时候实际上是不断的与网页服务器后台进行数据通信,显而易见的是必然包含两个过程:第一,浏览器向服务器发送数据,此即请求第二,服务器接收请求后做相应处理后再返回给浏览器内容,此为响应这些通信必须要有统一的规则,建立在一定的协议上,即http/https,为了数据安全https协议对传输数据进行了加密请求请求内容包含三部分:1.起始行,请求方法(GET,POST等),路由地址,网络协议2.头部(headers):键值对形式,包含host,

2021-07-06 11:44:51 213 1

原创 Django-3-网址和网页内容的”红娘“-路由配置

路由配置-path示例:配置127.0.0.1:8000为主页在配置路由的时候,需要首先从django导入pathfrom django.urls import path配置主页路由:urlpatterns = [path('', views.home),#资源地址设置成空,注意不能包含空格,末尾包含逗号,因为这是数组]自然的,如果要求增加其他网址,例如http://127.0.0.1/page/1,http://127.0.0.1/page/2,也不在话下,只需要在urls.py中写好

2021-07-05 22:03:55 579 2

原创 Django-2-庖丁解牛-URL和视图函数

文章目录URL概述URL概述URL(Uniform Resource Locator)统一资源定位符用以表示互联网上资源的地址URL的一般语法格式:protocol://hostname[:port]/path[?query][#fragment]互联网协议(http/https/file),主机名,端口号,资源地址,查询字符串,网页锚点路由地址是由零或多个“/”符号隔开的字符串查询以“?”为标志,可有多个参数,用“&”号隔开,每个参数的名和值用"="隔开fragment信息片

2021-07-05 11:08:17 286

原创 Django-1-庖丁解牛-Django项目结构及setting.py文件

文章目录创建项目创建项目

2021-06-30 17:34:19 136 1

原创 Bowtie2详细文档

文章目录Index比对选择n条reads快速比对Indexbowtie2-build --threads 20 reference.fa reference_bt2_index比对选择n条reads快速比对bowtie2 -x Bowtie2_Index/HTR8_bw2 -1 ~/Ocean_metagenome/Trim_galore/HTR8_1_val_1.fq.gz -2 ~/Ocean_metagenome/Trim_galore/HTR8_2_val_2.fq.gz --very-

2021-03-22 21:08:28 7896

原创 MASH--超快速估计基因组距离

MashMash, Fast genome and metagenome distance estimation using MinHashInstallUsageTutorials简单基因组距离评估下载 E. coli 基因组:genome1.fnagenome2.fna运行:mash dist genome1.fna genome2.fna结果:制表符分割的文件,代表着Reference-ID, Query-ID, Mash-distance, P-value, and Ma

2021-03-15 16:58:57 4345 5

原创 Excel中”诡异“的文本转换以及解决方法-word标题前的小黑块

文章目录说问题解决方法是智能化还是自作聪明?参考说问题Excel应该是Windows用户日常办公最常用的软件,但是不知道你有没有遇到过这种”诡异“情况,当你直接在单元格中输入或者从文本中复制粘贴诸如sep1的单词到单元格时,它倔强的给你变成1-Sep,无论你输入多少次。其实,这是Excel的自动处理日期格式在作祟,凡是与日期格式相关的文本都会自动被Excel变成它预先定义好的格式。这些与日期格式相关的文本类型如下:2017-06-19 # 年月日1-2 #月-日2/3 #月/日SEPT2 #月份

2021-03-05 18:22:05 550

原创 Mermaid语法2-流程图方向、节点以及连接

文章目录Graph流程图方向节点节点形状节点之间的连接参考Graphgraph:绘制流程图TD声明流程图的方向,声明了图是自上而下的(TD或TB)graph TD Start --> Stop %%注释,由A到B,自上而下排 %% graph ,声明绘制流程图,TD:top to down %% 第二行起建议缩进 %% 首行不可注释 %% --> 两个-,两边建议空格#mermaid-svg-xGz2PDy03blXvl1N .label{fo

2021-02-23 23:08:09 5066 3

原创 Mermaid语法1-概述

文章目录Mermaid能做什么?快速预览Mermaid可以绘制的图FlowchartGantt diagramPie chartSequence diagramClass diagramGit graph - exclamation experimentalEntity Relationship Diagram - exclamation experimentalUser Journey Diagram参考Mermaid能做什么?想要接触Mermaid的人多半是从Markdown走过来的,Markdow

2021-02-23 22:30:18 836

原创 chrome 浏览器github图片无法显示问题

文章目录问题及原因解决windowsMax OS参考问题及原因chrome 浏览器无法显示GitHub相关页面头像、图片,原因在于DNS配置出现问题,无法解析图片的正确地址。那么如何配置DNS,这就要提到hosts文件了,hosts文件中记录着IP地址和Host name(主机名)的关系,主要作用包括:加快域名解析、方便局域网用户、屏蔽网站、顺利连接系统等等。有些破解软件需要屏蔽掉他们的联网验证,其原理就是修改hosts文件,此外,还可以通过修改hosts来屏蔽掉一些视频网站的广告。为什么需要host

2021-02-07 21:07:41 1101 1

原创 Prodigal-原核生物基因预测

文章目录参考prodigal -i my.metagenome.fna -o my.genes -a my.proteins.faa -p metanohup time prodigal -a HTR8.faa -d HTR8.fna -f gff -o HTR8.gff -p meta -i ../HTR8_Megahit.fa &>HTR8.log &-a: 输出选中文件的蛋白翻译结果.-c: 不允许注释的基因超出基因组序列的边缘.-d: 将基因序列输出到该文件

2021-02-06 21:56:51 13017

multiqc_report.html

multiqc_report.html

2021-09-11

文献综述写作范例.doc

一篇发表在Nature Review上的关于Tara Ocean项目的英文文献综述

2021-08-18

Cytoscape 3.7.2 windows系统

Cytoscap是免费的用于绘制网络的软件,官网为https://cytoscape.org/,但是国内用户下载速度堪忧,并且很可能容易中断,这里分享到CSDN供大家下载。 Cytoscape is an open source software platform for visualizing molecular interaction networks and biological pathways and integrating these networks with annotations, gene expression profiles and other state data.

2020-11-07

Cytoscape 3.8 macos系统

Cytoscap是免费的用于绘制网络的软件,官网为https://cytoscape.org/,但是国内用户下载速度堪忧,并且很可能容易中断,这里分享到CSDN供大家下载。 Cytoscape is an open source software platform for visualizing molecular interaction networks and biological pathways and integrating these networks with annotations, gene expression profiles and other state data.

2020-11-07

中国科学院微生物研究所-胡松年团队-《微生物大数据分析与实践》课程-泛基因组下

中国科学院微生物研究所-胡松年团队-《微生物大数据分析与实践》课程-泛基因组下 本课程致力于微生物基因组、转录组、泛基因组、耐药基因组和宏基因组、宏转录组

2020-10-28

微生物大数据分析与实践--微生物组学常用分析软件

中国科学院微生物研究所所级课程《微生物大数据分析与实践》 主讲老师:胡松年 研究员 , 贺子龙 副研究员

2020-09-23

employees.sql

MySQL官方示例数据库,包含完整的employees数据库模型 一步导入,方便练习 数据库增删查改

2020-05-29

Biopython-v1.76.pdf

最新版Biopython,版本1.76,更多功能模块,更加便捷的使用方法,例如不需要文件句柄的一步读入/写出,通用的DNA、RNA等字母表等等

2020-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除