little^raccoon-CSDN博客

原创为不同的conda环境中配置特定的PERL5LIB

为了避免PERL5LIB存在冲突。

2024-04-16 20:38:38 162

原创基于基因组序列开展蛋白编码基因的预测 augustus

本示例中的基因组文件存放在/data/wild_tomato.fa，因此需要挂载/data目录，容器目录命名为docker_data。输出文件为augustus.out，输出err文件为augustus.err。augustus.out文件去掉 #注释的内容，实质上是gff文件。运行后会输出许多已经构建好模型的物种，其中植物有9种。，挂载宿主机的一个目录，使用方法为。，本示例选择tomato。

2023-07-21 18:48:00 414

原创从植物sRNA-seq数据中de novo预测miRNA的工具--miRDeep-P2

使用miRDeep-P2从sRNA-seq数据中de novo预测miRNA

2022-04-21 10:35:27 827

原创 Navicat链接mysql时报错 Lost connection to MySQL server at ‘reading initial communication packet’, system

问题描述Navicat链接mysql时报错Lost connection to MySQL server at ‘reading initial communication packet’, system error: 0解决方案：方案一：因为我前不久还登陆过，在这段时间中有人改动的概率很小，所以第一想法就是restart。同时Navicat也需要关闭重启，结果就不报错了。/etc/init.d/mysqld restart方案二：我在网上还查到可以通过修改 /etc/my.cnf 文

2022-04-15 21:32:16 5358 2

原创杂交育种

文章目录杂交亲本的选配杂交亲本的选配双亲都具有较多的优点，没有突出的缺点，在主要性状上优缺点互补。一般杂种后代的表现与双亲平均值有密切关系，双亲平均值越高，后代平均表现也教好。双亲之一不能有缺点太严重的性状，特别是在重要性状上亲本之一最好是能适应当地条件，综合性状较好的推广品种亲本间的遗传差异，选用生态类型差异较大，亲缘关系较远的亲本材料相互杂交遗传差异较大的亲本杂交，易于选出性状超越亲本和适应性比较强的新品种若过于追求双亲的亲缘关系很远，遗传差异大的，定会造成杂交后代性状的分

2021-04-13 16:26:35 430

原创使用python批量下载ensembl数据库指定类型的文件

通过python的ftplib批量下载ensembl中指定类型的文件，并且同一个物种的文件保存在一个文件夹中#/usr/bin/pythonimport ftplibimport osimport time###设置下载路径，下载文件类型HOST='ftp.ensemblgenomes.org'DIRN='/pub/release-50/plants/fasta/'feature_lst=['cdna','cds','pep'] #如下载基因组文件，则加上‘dna’。后面if 'fa..

2021-03-24 20:46:54 771

转载 Linux系统对find找到的文件或文件夹进行操作

部分转载自陈连福的生信博客当我运行得到结果文件后，需要删除当前目录下许多的中间文件夹：find ./ -maxdepth 1 -type d -regex "./\w.*" -exec rm -rf {} +各参数意义如下：,./ 是被搜索的文件夹-maxdepth 1 表示仅搜索第一层目录-type d 表示仅搜索文件夹类型数据，该参数要放-maxdepth参数后面，否则程序会有警告信息。-regex “./\w.*” 使用正则表达式方式搜索数据，该正则表达式不会搜索当前目录下名称.

2021-02-23 13:04:49 339

原创 Phytozome通过端口批量下载文件

Phytozome官网提供了四种数据下载方式，前三种为网页操作模式，在此不多介绍，在此主要介绍第四种官方manualDownload with CartDownload with web UIDownload with Globus serviceDownload with APIDownload with API1. 登陆账号curl 'https://signon.jgi.doe.gov/signon/create' --data-urlencode 'login=USER_NA.

2021-02-22 17:49:49 1146

原创 perl模块相关的命令

perldoc perllocal #查看已安装的模块

2021-01-25 17:50:42 103

原创方便快捷简单的测序数据下载 — SRA Explorer

最近发现一个简单方便的下载测序数据的地方SRA Explorer用法很简单，试一下就会了，有几个小技巧：如果不翻墙，搜索速度会很慢搜索多个SRR库，可以用多种分隔符（逗号空格都行），点击搜索后会自动在关键词中间加 “AND”，但其实我们需要的是"OR"，复制下来替换一下，再去搜索就可以了...

2020-12-12 16:31:43 798

原创拟南芥基因注释

Athaliana_447_Araport11.annotation_info.txt文件下载链接 https://phytozome.jgi.doe.gov/pz/portal.html#!bulk?org=Org_Athaliana_er#!/usr/bin/perlmy $infile=shift;my $gene_num=shift;my $outfile=$infile.".annotation.txt";$gene_num-=1;my %anno_hash;$usage="

2020-12-01 16:24:52 1827

原创 perl实现根据序列ID从提取fasta文件序列

usage: perl thisScript.pl query.fa gene.lst outfile--------------------------------------------------------------------query.fa 基因组或其他需要从中提取的fasta格式文件gene.lst 需要提取的基因或染色体名字，有无>均可outfile 输出文件#!/bin/perl#unless(@ARGV==3){# die "usage: $0 <inpu.

2020-11-12 02:55:42 2994 2

原创 bed和gff文件按染色体号排序

注释文件通常按照染色体序号升序排列，而有时需要我们对获取的注释文件进行排序。对于chr01这种直接sort就可以，但是对于chr1, chr2… chr11这种，直接sort的结果是chr11排在chr2前面。解决这种情况的方法很简单，提取染色体中的数字，然后使用sort的-n参数就可以。而写成脚本复用起来也比较方便。有些物种染色体命名可能特殊，所以line 24的正则匹配要针对不同情况修改。现在的脚本匹配染色体命名为Chr chr CHR。#!/usr/bin/perl# 2020-11-12.

2020-11-12 02:49:21 1524

原创 Bio.Entrez下载PubMed中的文献

有些东西不常用，所以要多做记录#导入模块from Bio import Entrez, Medlineimport re#邮箱不是强制性，但NCBI要求出现问题时可以联系到用户。也可以在Entrez.esearch()的参数列表里设置email="[email protected]"Entrez.email = "[email protected]"#搜索关键词，就像在线搜索一样，可以用“AND”和“OR”。以及关键词类别，如[Year], [Organism], [Gene]等。keyword = 'miR15.

2020-11-06 16:06:16 762 1

原创 GetOrganelle软件从ngs数据中组装线粒体、叶绿体基因组；GeSeq网站注释细胞系基因组

GetOrganelle安装conda install -c bioconda getorganelleor download from github unzip GetOrganelle-master.zip; cd GetOrganelle-master python setup.py install get_organelle_config.py --add embplant_pt,embplant_mt #v1.7.0版本后，默认的database需要手动下载，我在这里这下载了植物p

2020-08-29 16:08:07 7345 4

原创使用Aspera上传数据到SRA

Install下载地址（网上有好多下载地址是错误的）：https://downloads.asperasoft.com/en/downloads/8?listtar -zxvf ibm-aspera-connect-3.9.9.177872-linux-g2.12-64.tar./ibm-aspera-connect-3.9.9.177872-linux-g2.12-64找到安装路径，将bin文件夹添加到$PATHupload fastq.gz to SRAascp -i <path

2020-05-16 18:29:55 3496

原创 html5入门笔记

<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>First</title></head><body><a href="https://www.baid...

2020-02-22 17:43:20 191

原创 argparse模块解析命令行参数

#!/usr/bin/python# -*- coding: utf-8 -*-import argparse # 导入模块parser = argparse.ArgumentParser() # 创建解析解释器对象ArgumentParserparser.discription='This script is writen by python3.6'parser.add_argum...

2019-12-30 20:41:53 134

原创 RStudio安装DESeq2

第一次用R…R version 3.6.2install.packages("BiocManager")BiocManager::install(version = "3.10")BiocManager::install("DESeq2")library("DESeq2")上路

2019-12-27 11:36:07 10090

原创健身日记

2019-11-06肩、手臂恢复性训练BFT1003 肩部推举训练器（空杆热身1组15次，3组）固定肩部推举（4组）左侧没力气时可以右侧带一点绳索面拉（4组）后束动作，找感觉比较好肩部侧平举（1组5kg，3组2.5kg）固定二头弯举（4组）固定三头器械（4组）坡度走（10min）...

2019-11-07 12:29:28 842

原创植物群体遗传学--笔记

《植物群体遗传学》徐刚标科学出版社表型可塑性（phenotypic plasticity）：基因型相同的个体，受不同环境的影响而产生不同性状表现的现象称为表型可塑性。表型可塑性是生物对环境的一种适应。...

2019-11-05 20:11:13 600

翻译 deepToolss 3.3.0用户手册（未完）

deepToolss 3.3.0用户手册Get helpParameters of decrease the run timeFiltering BAMs while processingGet helpbamCoverage --helpParameters of decrease the run timenumberofProcessors多进程 e.g. --numbero...

2019-09-24 17:38:18 249

原创第十一章 perl模块

寻找模块perldoc TAP::Object #打开模块的文档cpan -a #创建autobundle文件，会列出所有已安装的模块，包括版本号安装模块使用MakeMaker封装的模块安装perl Makefile.PL INSTALL_BASE=/Users/Zorn/lib #使用INSTALL_BASE参数指定安装目录make install...

2019-08-23 20:37:46 673

转载 blat参数详细说明

blat - Standalone BLAT v. 36x2 fast sequence search command line toolusage:blat database query [-ooc=11.ooc] output.pslwhere:database and query are each either a .fa, .nib or .2bit file, or a list...

2019-04-20 15:48:26 1889

原创 Bedops使用教程

感觉比bedtools更灵活一些。

2019-04-16 09:44:55 2790 1

原创植物SNP数据下载链接

SoybeanResequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean. Nature Biotechnologyhttps://figshare.com/articles/Soybean_resequencing_pr...

2019-04-15 15:28:38 439

原创 MCScanX共线性分析

Phytozome数据处理下载gene.gff3和transcript_primaryTranscriptOnly.fa两个文件，接下来数据整理需要保证gff文件中的基因名与fasta文件中的基因名相同。代码对于拟南芥试用，其它植物因为序列命名问题，稍有差异。GFF数据Phytozome下载的gene.gff3文件中，mRNA的会注释出多个转录本，gene注释是唯一的，所以我们取出ge...

2019-04-03 23:20:37 5626 3

原创 perl对blast结果bit score进行筛选，保留最大值

while(<>){ chomp; $line=$_; @line=split /\t/,$line; ($name, $score)=@line[0,11]; if(!exists($max{$name})){ push @names,$name; } if(!exists($max{$name})||$s>$max{$name}){ $max{$name...

2019-04-03 12:37:15 2398 8

原创 perl的chomp重要性

下午用到计算序列长度，忘记对输入序列去除换行符，导致计算的所有长度均+1chomp;

2019-03-27 16:18:34 323

原创 entrez搜索SRA数据库info

想下载拟南芥一些特定组织的RNAseq数据，通过entrez把各个库的info下载，然后筛选后进行下载Entrez Direct: E-utilities on the UNIX Command LineInstallation cd ~ /bin/bash perl -MNet::FTP -e \ '$ftp = new Net::FTP("ftp.ncbi.nlm....

2019-03-27 11:23:55 327

原创 perl实现序列反向互补

#!/usr/bin/perl -wprint"Input sequence:\n";chomp(my $seq = <STDIN>);$ seq =~ tr/atcguATCGU/tagcaTAGCA/;print “Reverse complement sequence:\n”print scalar reverse $seq;#或者使用下面这种形式输出，因为reve...

2019-03-23 00:54:04 3313

原创 perl实现计算GC含量

#!/usr/bin/perl -wunless(@ARGV==2){ die "Usage: perl $0 <input_fasta> <output> error:$!\n";}my($input, $output)=@ARGV;open INPUT, $input;open OUTPUT, ">$output";#===============...

2019-03-22 19:22:11 2410

原创 perl根据ID提取序列

#!/usr/bin/perl -wunless(@ARGV==3){ die "Usage: perl $0 <ID_lst> <input_fasta> <output> error:$!\n";}my($lst, $input, $output)=@ARGV;open LST, $lst;open INPUT, $input;open OU...

2019-03-21 19:23:11 2956 2

原创 perl实现去除fasta格式序列换行符

#!/usr/bin/perl -wuse strict;unless (@ARGV==2){ die "Useage: perl $0 <input.fa> <out.length>\n";}my($input,$output) = @ARGV;open INPUT,$input || die "error: can't open file: $input\n...

2019-03-20 00:50:56 1887

转载 awk根据某列内容去重

awk '!a[$1" "$2]++{print}' text.txt原理”!” 非a[$0]，以$0为数据下标，建立数组aa[$0]++，即给数组a赋值，a[$0]+=1

2019-02-20 16:35:08 2333

原创 unique fasta reads转为redundant fasta reads

#!/usr/bin/pythonimport argparseparser = argparse.ArgumentParser()parser.add_argument("inputFile", help="input a sequence file", type=str)args = parser.parse_args()inp = args.inputFilefr = open...

2019-01-24 14:11:04 133

原创 fasta序列多行变一行(toONElineFASTA.py)

def toONElineFASTA(file): 'Convert multi-line fasta to one-line fasta' db = {} for line in file.readlines(): if line.startswith('>'): keys = line.strip() ...

2019-01-11 14:33:53 3282

原创 MD5校验文件完整性

$ md5sum genome1 genome2 # 发现这两个文件md5值完全一样，也就说明这两个文件完全相同c05983a95a48d57e137ba35da59aac3e genome1c05983a95a48d57e137ba35da59aac3e genome2$ md5sum genome1 genome2 > ./genome.md5sum$ md5sum ...

2019-01-10 14:14:50 2766

空空如也

空空如也