自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

相羽

孤陋寡闻,愚蒙等诮。

  • 博客(32)
  • 资源 (1)
  • 收藏
  • 关注

原创 SAM得到完美匹配(perfect match)

主要针对bwa生成的sam文件中,如何找到完美匹配的比对结果。

2017-02-22 15:03:49 7773

翻译 Klib - C语言通用库

Klib - C语言通用库samtools,bwa等软件都会设计到这个库,在项目中也比较方便加入这个库。 来自:https://github.com/attractivechaos/klib简介Klib是C语言写成的,独立的轻量级的库,并且遵循MIT/X11声明。其中的大部分是独立的外部库,只是用到了C标准库,相互之间也是独立的。如果使用这个库中的一部分,只需要将使用到的文件拷贝到你自己的项目中即

2016-02-21 21:08:08 98385

原创 mysql5.7修改root密码

前些天在windows下安装了mysql5.7.9,设置了root密码,这几天想用,密码给忘记了。1,此方法只适用于没有其他用户设置的mysql,有可能会清除所有用户信息(自己看情况使用):关闭mysql服务,mysql5.7.9的服务名可能为MySQL57,注意一下。>net stop mysql清除或移动mysql安装目录下的data目录下的所有数据(关于data目录存放文件的

2015-12-19 11:56:35 2320

原创 R语言的一些笔记

在使用R语言中,有好多问题,此文会持续的记录一些遇到的问题及解决方法。1,在终端打印矩阵或数据框时,打印的列数太少,尤其是对宽屏幕,更是浪费。在R的options()函数中有参数width,可以设置打印的列数,width参数解释如下: 所以可以设定options(‘width’=200)来增加打印的宽度。 例如:sink("out.txt")options('width'=200)print

2015-07-28 09:42:18 910

原创 折腾vim YouCompleteMe

服务器上的vim版本太低,安装YouCompleteMe居然要7.3.584版本以上的,鬼知道那个是7.3.584 ……安装7.4吧,命令: >cd vim74 >./configure –prefix=/home/sunhy/software/vim74 –with-features=huge –enable-multibyte –enable-rubyinterp=yes –en

2015-05-09 14:37:39 3434

转载 关于自然常数e的理解

利息增长模型在上中学学习对数的时候,我们就学到了一个叫做e的东西(e≈2.71828e\approx 2.71828),后来又学了e的定义,(e=limn→∞(1+1n)ne=\lim \limits_{n\to \infty}(1+\frac{1}{n})^n),但是始终缺乏一个直观的理解,为什么e要这么定义,为什么到处都会有他的身影。后来在研究一个增长模型的时候,重新研究了下e的定义,找到了几个

2015-04-20 13:42:02 1038

原创 摘录

越人歌刘向书中对歌词的古越语记音用了三十二个汉字,如下: 滥兮抃草滥予昌枑泽予昌州州鍖州焉乎秦胥胥缦予乎昭澶秦逾渗惿随河湖[3] 楚译人把它译成“楚语”(即姚先生说的楚地汉语),用了五十四个汉字,“词采声调,宛然楚辞”: 今夕何夕兮,搴舟中流。 今日何日兮,得与王子同舟。 蒙羞被好兮,不訾诟耻。 心几烦而不绝兮,得知王子。 山有木兮木有枝,心悦君兮君不知。

2015-03-27 14:05:52 708

原创 linux 多线程下简单数据类型的存取与原子变量

linux 多线程下简单数据类型的存取与原子变量我们知道,count++这种操作不是原子的。一个自加操作,本质是分成三步的:从缓存取到寄存器在寄存器加1存入缓存。由于时序的因素,多个线程操作同一个全局变量,会出现问题。这也是并发编程的难点。在目前多核条件下,这种困境会越来越彰显出来。 最简单的处理办法就是加锁保护,最初的解决方案。看下面的代码:pthread_mutex_t count_l

2015-02-13 15:48:08 671

转载 POSIX 线程详解

关于POSIX线程的文章,中文比较好的,还真不好找。这些文章都比较老了,不过可以用来了解下。下面的文章是从IBM developerworks上转载过来的,还不错。原文路径:http://www.ibm.com/developerworks/cn/linux/thread/posix_thread1/一种支持内存共享的简捷工具POSIX(可移植操作系统接口)线程是提高代

2015-01-30 15:20:21 1954

转载 面向对象的 C

转自:http://www.ibm.com/developerworks/cn/linux/l-cn-cobject/如何写出优美的 C 代码面向对象的语言更接近人的思维方式,而且在很大程度上降低了代码的复杂性,同时提高了代码的可读性和可维护性,传统的 C 代码同样可以设计出比较易读,易维护,复杂度较低的优美代码,本文将通过一个实际的例子来说明这一点。基

2015-01-27 16:01:59 838

转载 使用 getopt() 进行命令行处理

原地址:http://www.ibm.com/developerworks/cn/aix/library/au-unix-getopt.html引言在早期的 UNIX® 中,其命令行环境(当时的唯一用户界面)包含着数十种小的文本处理工具。这些工具非常小,通常可很好地完成一项工作。这些工具通过较长的命令管道链接在一起,前面的程序将其输出传递给下一个程序以作为输入,整个

2015-01-22 15:18:41 405

转载 数学之美番外篇:平凡而又神奇的贝叶斯方法

原文:http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想,一个方法能够专门写出一本书来,肯定很牛

2014-12-26 09:03:27 345

转载 从贝叶斯方法谈到贝叶斯网络

原文路径:http://blog.csdn.net/v_july_v/article/details/409846990 引言    事实上,介绍贝叶斯定理、贝叶斯方法、贝叶斯推断的资料、书籍不少,比如《数理统计学简史》,以及《统计决策论及贝叶斯分析 James O.Berger著》等等,然介绍贝叶斯网络的中文资料则非常少,中文书籍总共也没几本,有的多是英文资料,但初学者一

2014-12-25 14:41:58 458

原创 用perl找到图片信息

今天群里和彦问怎么把图片的按照图片生成日期重命名,sam给出Image::EXIF模块,回来试了试,觉得还不错,记录一下。Exif(Exchangeable image file format):可交换图像文件格式常被简称为Exif,是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据。可以附加于JPEG、TIFF、RIFF等文件之中,为其增加有关数码相机拍摄信息的内容和索引图或

2014-12-17 21:35:29 1257

转载 动态规划:从新手到专家

作者:Hawstein出处:http://hawstein.com/posts/dp-novice-to-advanced.html声明:本文采用以下协议进行授权: 自由转载-非商用-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。前言本文翻译自TopCoder上的一篇文章: Dynamic Programmin

2014-12-16 17:11:10 333

原创 无题

无题漂泊五载未竟功,孓然一身孤灯明。可怜朔风连素月,明朝依旧苦春风?

2014-12-16 12:09:40 383

转载 当我们谈论基因,我们在谈论什么

本文转自:昨天发玩儿关于“只有少数人用用blablabla基因”的吐槽文,工号九千多的BGI新员工玄澄问我,“基因是什么”。我的回复是“这真是一个很困难的问题”。作为节操导师,我不能随随便便就误导和打发了一个新员工,嗯,没错是这样,顺便在收入多于我几倍的新员工面前装装逼什么的。我不知道“基因”是什么,或者说,我其实不知道我们每个人在每种语境下所谓的“基因”是什么。【当我

2014-11-21 08:58:10 862

转载 Perl 中的线程

原文地址:多线程">perl 多线程作者:菜鸟刚学perl多线程,下面是一些多线程的例子,希望看后会有些帮助例子一:http://yufengseu.spaces.live.com/Blog/cns!31875D62B958914B!138.entry以前为了方便自己(当然也是为了偷懒^_^)使用perl写了一个脚本来抓取网页,并进行分析以获取我想要的信息,随着要抓取的网页越来越多,这

2014-10-21 17:20:01 697

转载 RNA-seq测序数据(reads)提交NCBI

RNA-seq测序数据(reads)提交NCBI  RNA-seq的测序数据要向NCBI提交,这里简单总结一下。原始的测序数据(reads) 数据要提交到SRA. RNA-seq的拼接结果应该提交到TSA库,TSA全称TranscriptomeShotgun Assembly Sequence Database,TSA isan archive of computationally as

2014-10-21 17:19:59 10059 1

转载 BED文件格式

BED 文件格式       BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致。必须包含的3列:chrom, 染色体或scafflold 的名字(egchr3, chrY, chr2_random,scaffold0671 )chromStart 染色体或scaffold的起始位

2014-10-21 17:19:57 12321 3

转载 SAM格式说明

转自博耘生物SAM是一种序列比对格式标准,由sanger制定,是以TAB为分割符的文本格式。主要应用于测序序列mapping到基因组上的结果表示,当然也可以表示任意的多重比对结果。不同的软件,不同的时期,不同的研究方向,都会创建一种或者多种格式标准,当然根据当时的需要,创建符合需求的标准,也是最容易的事情,而反过来想要真正的理解标准,也必须理解为什么要创建这样的标准,解决什么样的需要

2014-10-21 17:19:55 1290

转载 COG数据库介绍【转】

Cluster of Orthologous Groups ofproteins(COG)介绍》》》NCBI资源介绍什么是COG? “COG”是Cluster of Orthologous Groups ofproteins(蛋白相邻类的聚簇)的缩写。构成每个COG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或者是paralogs。Orthologs是指来

2014-10-21 17:19:51 9870

转载 BLAST中的E值的理解

一般的,当我们使用BLAST(是一种用于在数据库当寻找任何蛋白质或者基因序列与你的目标序列一致的程序)时,我们会注意到这里有一个E值。那么这个Evalue是什么呢?怎么来理解这个值呢?下面是一个平常的blast结果,Sequences producing significantalignments:Score (S)Egi|83574104|Moth_2374|sporu

2014-10-21 17:19:49 19129 2

原创 关于梦想与坚持-看海贼王写在开头

最近因友人推荐,正在看流行很久了的日本动画《海贼王》,看了没多少,70集。友人推荐理由,团队,有梦想,不放弃,肯为伙伴牺牲。作为奔三的大龄青年,看到梦想和不放弃还是忍不住的特有的吸引和冲动。路飞一个看起来很大条的人,却可以凭借着梦想与勇气,找到了一个又一个团队成员。第一个,卓洛,一个背负着梦想和承诺的男人。和鹰眼决斗中,划过胸膛的巨大刀痕,是他的烙印。当受伤躺在船上,拿刀指天,发誓不会再输,

2014-10-21 17:19:46 709

转载 Loser应该知道的6个残酷人生事实

转载自 [http://www.douban.com/group/topic/36138010/]来自: 天理难容(Weixu@Rutgers)2013-01-2009:24:29译注:此文转载并翻译自cracked.com,文章中很大一块其实和拖延症有关的所以发在这里。【补注1:最初本文发在一个另一个论坛,我用了loser这个词来吸引眼球,但转发豆瓣的时候忘记改标题了。现在为了S

2014-10-21 17:19:37 616

原创 幻想在路上

其实我们都在路上,而我说的路是更为具体的路。体会一种行走在路上的感觉,虽然一直有这样的想法,却一直没有实现。在路上,不管是什么样的艰难困苦都勇往直前的路。在不断的摔打中,看看自己的真心到底是什么。2013.时刻准备着吧,也许某一天,突然下定决心,要走出去了,我期待着这一天。

2014-10-21 17:19:35 361

转载 FASTQ文件详解【转】

FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的事实标准。格式说明FASTQ文件中每个序列通常有四行:序列标识以及相关的描述信息,以‘@’开头;第二行是序列第三行以‘+’开头,后面是序列标示符、描述

2014-10-21 17:19:32 10415

转载 perl模块安装

本文为转载,只为自己学习用。Perl到了第五版增加了模块的概念,用来提供面向对象编程的能力。这是 Perl语言发展史上的一个里程碑。此后,广大自由软件爱好者开发了大量功能强大、构思精巧的 Perl 模块,极大地扩展了 Perl语言的功能。CPAN(Comprehensive Perl ArchiveNetwork)是Perl模块最大的集散地,包含了现今公布的几乎所有的perl模块。安装

2014-10-21 17:19:28 598

原创 生物信息学的基本课程学习

1、数学:高数(上册,下册)、线代、概率论、随机过程,离散数学;2、生物:普通生物学、生物化学、分子生物学、细胞生物学、遗传学、基因组学、蛋白组学等;3、计算机:计算机基础、C语言、C++、JAVA、Perl、数据结构、数据库、数据挖掘、计算机算法、软件工程。这是最基本的,根据方向还有其他很多要学习的。

2014-10-21 17:19:26 1365

转载 Linux查看CPU和内存使用情况

本文属转载,具体出处不明在系统维护的过程中,随时可能有需要查看 CPU 使用率,并根据相应信息分析系统状况的需要。在 CentOS 中,可以通过 top命令来查看 CPU 使用状况。运行 top 命令后,CPU 使用状态会以全屏的方式显示,并且会处在对话的模式 -- 用基于 top的命令,可以控制显示方式等等。退出 top 的命令为 q (在 top 运行中敲 q 键一次)。  操作实

2014-10-21 17:19:23 389

原创 将博客搬至CSDN

感觉csdn可能更适合写或收藏技术类文章,所以

2014-10-16 14:48:55 431

转载 key-value数据库

传统的文件系统中,需要维护目录的层次结构,使用dentry,inode,directory等复杂结构保存元数据的信息;而面对更多定制文件系统的需求,越来越多的系统考虑使用key-value形式保存文件系统中的元数据信息。使用数据库来保存这些元数据的key-value对是一个不错的选择,相比传统的关系型数据库,key-value数据库在这方面更贴近应用需求,因为,保存元数据的数据库往往不会有复杂的关

2013-09-23 09:12:03 882

CMake实践.pdf

Cmake使用教程,cmake的优势也逐渐的被大家所认识,至 少KDE的开发者们给予了cmake极高的评价,同时庞大的KDE项目使用cmake来作为构 建工具也证明了cmake的可用性和大项目管理能力。

2014-11-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除