自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

筑梦新时代的博客

此为本人学习笔记,不具备参考价值,禁止任何形式的传播

  • 博客(29)
  • 问答 (1)
  • 收藏
  • 关注

原创 回归分析课后题答案

回归分析课后题 第一章1.1变量间统计关系和函数关系的区别是什么?变量间的统计关系或相关关系:变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系, 这种统计关系规律性的研究是统计学中研究的主要对象, 现代统计学中关于统计关系的研究已形成两个重要的分支, 它们叫相关分析和回归分析。函数关系:两个变量间完全表现为一种确定性关系。即一个变量的变化能完全决定另一个变量的变化。1.2 回归分析与相关分析的区别与联系是什么?在回归分析中,变量y称为因变量,处在被解释的特殊地位。在

2022-01-14 19:47:12 5534

原创 回归分析笔记(一)

回归分析笔记一、一元回归分析statsmodels库快速入门导入数据方式通常采用如下:数据格式pandas的dataframe+statsmodels.api的调用接口,还可以使用patsy库来使得代码风格R化。注:有两种方法从statsmodels中调用相关功能和类直接调用api以供交互式使用import statsmodels.api as sm直接调用相关程序这样可以避免导入不必要的库如:import statsmodels.discrete.api as smd#

2022-01-14 19:45:45 552

原创 Pandas : OverflowError: Python int too large to convert to C long问题解决的一个方法

有的时候,我们在处理dataframe时,需要将这些dtype(just means data type)是object的数据转换为int,如果数据很大的话,就会出现如下的报错:In [1]: data['itemId'] = data['itemId'].astype(int)Out[1]: Traceback (most recent call last): File "<ip...

2020-01-15 20:55:40 18185

原创 mongoDB初识:基本概念和基本操作

一、基本概念mongoDB是一种NoSQL.NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。二、基本操作use mydb //连...

2020-01-14 20:59:26 150

原创 Pandas:python导入json文件并且整理的一种方法

有的时候pandas需要导入一个json格式的文件,为了方便后续的分析,我们希望能够将其整理成table。import pandas as pddata_str=open('data_json.json',encoding='utf-8').read()#从当前路径下读取文件。使用encoding='utf-8'解决编码问题for i in range(0, 53057): d...

2020-01-14 20:10:28 1211

原创 分子生物学作业

问题:遗传图谱,物理图谱,序列图谱,转录图谱的内容及差异1.遗传图谱遗传图谱是某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。由遗传重组测验结果推算出来的、在一条染色体上可以发生的突变座位的直线排列(基因位点的排列)图。2.物理图谱物理图谱是利用限制性内切酶将染色体切成片段,再根据重叠序列确定片段间连接顺序,...

2019-09-10 19:35:56 1254

原创 python3:时间序列分析

这里主要简要介绍一下rolling()和ewm(),也就是移动平均(moving average)和指数加权(exponentially weighted)相关函数一、rolling函数部分参数翻译rolling官方文档window: 移动窗口的大小。值可以是int(整数值)或offset(偏移)。如果是整数值的话,每个窗口是固定的大小,即包含相同数量的观测值。值为offset(偏移时长...

2019-09-05 17:32:25 601

原创 统计学基础(五):极大似然估计

Fisher的极大似然思想随机试验有多个结果,但在一次实验中,有且只有一个结果会出现。如果在某次试验中,结果{ω\omegaω}出现了,则认为该结果(事件PPP{ω\omegaω})发生的概率最大。\quad假设总体XXX是离散型随机变量,其分布律为:P{X=ak}=pk(θ)(k=1,2,…&ThinSpace;)P\{X=a_k\}=p_k(\theta)\quad (k=1...

2019-07-30 11:11:37 1125

原创 python3:匿名函数和生成器思考

此为本人学习笔记,不具备参考价值,禁止任何形式的传播匿名函数匿名函数形式:lambda x:表达式这里x是参数,匿名函数使用lambda关键字定义,其结果就是返回值。匿名函数有个限制,就是只能有一个表达式,不用写return,返回值就是该表达式的结果。def short_function(x): return x * 2等价于equiv_anon = lambda x: ...

2019-07-25 19:10:59 117

原创 统计学基础(四):矩估计

统计推断的基本问题 参数估计 点估计 区间估计 假设检验 线性回归 方差分析参数通常是刻画总体某些概率特征的数量。当该参数未知时,从总体中抽取一个样本,用某种方法对该参数进行估计,这就是参数估计。假设总体X∼F(x;θ1,θ2,…,θm)X\sim F(x;\theta_1,\theta_2,\dots,\theta_m)X∼F(x;θ1​,θ2​,…,θm​),其中分布F...

2019-07-25 11:28:08 3268

原创 统计学基础(三):抽样分布定理

定理一:

2019-07-23 18:37:52 10820 2

原创 统计学基础(二):三个基本抽样分布

统计学基础目录一、基本概念和三个抽样分布一、基本概念和三个抽样分布1.基本概念总体:研究对象某项指标的全部。样本:所研究对象若干个体,称为样本。记作(x1,x2,…)(x_1,x_2,\ldots)(x1​,x2​,…)如果x1,x2,…,xnx_1,x_2,\dots,x_nx1​,x2​,…,xn​相互独立x1,x2,…,xnx_1,x_2,\dots,x_nx1​,x2...

2019-07-22 20:12:40 920

原创 统计学基础(一):变量分布特征的描述

调和平均数调和平均数(英语:Harmonic mean),是求一组数值的平均数的方法中的一种,一般是在计算平均速率时使用。调和平均数是将所有数值取倒数并求其算术平均数后,再将此算术平均数取倒数而得,其结果等于数值的个数除以数值倒数的总和。一组正数x1,x2…xnx_1, x_2 \dots x_nx1​,x2​…xn​的调和平均数H其计算公式为:H=H=H=n1x1+1x2+⋯+1xn\fr...

2019-07-18 20:38:26 3216

原创 R语言:基本统计分析

此为本人学习笔记,不具备参考价值,禁止任何形式的传播偏度skewness:偏度系数是描述分布偏离对称性程度的一个特征数。当分布左右对称时,偏度系数为0。当偏度系数大于0时,即重尾在右侧时,该分布为右偏。当偏度系数小于0时,即重尾在左侧时,该分布左偏。峰度(peakedness;kurtosis):峰度用于度量x偏离某分布的情况,正态分布的峰度为3。当时间序列的曲线峰值比正态分布的高时,峰度大...

2019-06-08 18:41:10 1849

原创 浙大数据结构:图的表示

此为本人学习笔记,不具备参考价值,禁止任何形式的传播Graph and its representationsGraph is a data structure that consists of following two components:A finite set of vertices also called as nodes.A finite set of ordered pa...

2019-06-04 13:57:45 232

原创 浙大数据结构:并查集 Union-Find

Disjoint Set (Or Union-Find) | Set 1 (Detect Cycle in an Undirected Graph)#define MAXN 1000 /* 集合最大元素个数 */typedef int ElementType; /* 默认元素可以用非负整数表示 */typedef int SetName;...

2019-05-30 21:33:13 206

原创 浙大数据结构:哈夫曼树

传送门:Huffman Coding | Greedy Algo-3// C program for Huffman Coding #include <stdio.h> #include <stdlib.h> // This constant can be avoided by explicitly // calculating height of Huffma...

2019-05-29 20:42:13 184

原创 PCA主成分分析

通俗的数学原理一文看懂主成分分析

2019-05-27 21:04:18 644

原创 浙大数据结构:AVL树

AVL tree is a self-balancing Binary Search Tree (BST) where the difference between heights of left and right subtrees cannot be more than one for all nodes.4 casesa) Left Left CaseT1, T2, T3 and T...

2019-05-21 20:46:22 194

原创 C语言进阶:位运算

工具:二进制十六进制转化计算器1.按位运算& 按位的与| 按位的或~ 按位的非^ 按位的异或<< 左移>> 右移按位的与&两个位都为1时,结果为1,否则为0应用:(1)让某一位为零或某些位为0:x & 0xFE(0xFE是1111,1110,所以x无论是多少(2)是,其末尾与之与运算都为0)取一个数的一段按位的或|两个位...

2019-05-13 10:22:12 164

原创 HIT《C语言程序设计精髓》:动态内存分配

1.动态内存两种内存:栈内存和堆内存栈内存由函数控制,自动分配和释放内存。一般只有几Mb。堆内存由用户自己申请和释放。一般有几个G。2.堆内存申请释放函数在C的文档中,关于realloc函数是这样说的The reallocation is done by either:a) expanding or contracting the existing area pointed t...

2019-05-13 10:22:03 258

原创 HIT《C语言程序设计精髓》:指针与二维数组,指针数组

在一维数组中,如char a[10];这里a的意思是这个数组的首地址。所以定义一个指针int *p=a;就相当于int *p=&a[0]; 而a[1]也就等价于*(a+1)或者*(p+1),这里的1不是给地址加上一个1,也不是给地址加上一个字节,而是给地址加上一个基类型的内存单元。这里p的基类型是int,所以就是加上四个字节。二维数组指针数组单纯用二维数组来保存多行字符串...

2019-05-13 10:21:53 169

原创 HIT《C语言程序设计精髓》:指针在函数中的作用域

指针通常用于函数中多个值的返回,而指针在函数内,其不被函数作用域所限制的只有通过指针来修改其指向的内存,而通过改向其指针方向是受到作用域的限制的。也就是说例如在函数中修改指针指向只在函数内有效,而在主函数中并没有被修改指向,但是在函数中修改指针指向的内存的值则是可以的。#include <stdio.h>void fun(int *p);int main(){ int i[]...

2019-05-13 10:21:42 719

原创 HIT《C语言程序设计精髓》:字符串常量和变量,字符数组和字符指针

1、字符常量 用双引号括起来的一串字符是字符串常量,系统自动为其添加空字符'\0'(ASCII码为0,'0'的ASCII码为'48') e.g. printf("How are you"); 2、字符串变量 1、字符数组 char str[]="china"; 这里str和字符串内容一起被保存在栈内存或静态内存中,所以字符串的内容时可以修改的,但是str是个变量名,它的不可...

2019-05-13 10:21:15 539

原创 英语六级语法:强调句,倒装句和虚拟语气

1、强调句 It is/was ... that... //is强调现在,was强调过去 It is ... that/who... //that强调任何,who强调人 不能强调谓语动词和形容词,谓语动词的强调是在动词前加do2、倒装句 全部倒装:谓语动词+主语 there be 句型 部分倒装: 写成一般疑问句形式 1、否定词位于句首 not,no,never,hardl...

2019-04-08 16:21:36 1059

原创 基因课笔记3:从源代码安装samtools、fastqc的安装、环境变量和shell

1、从源代码安装samtools创建一个samtools安装目录mkdir samtool进入安装目录cd samtoolwget samtools的下载urltar -jxvf samtools的安装包//tar -zxvf xxx.tar.gz//tar -jxvf xxx.tar.gz进入解压目录less README阅读readme文档less INSTAL...

2019-04-07 13:51:45 1399 1

原创 const和指针笔记

int const *p;const int *p;//不能通过*p对p指向的地址储存的值进行更改.通过指针不可修改int a=1;int *const p=&a;*p=2//errorint *const p;//p is const, 指针p是一个常量,所以p的值不能被修改,即p储存的地址不能被改变。这里可以这样,const再指针声明符*的前面,因而指针p是一个常量,...

2019-04-01 20:35:47 60

原创 下载conda,安装numpy,bwa

//首先通过wget url链接//下载conda安装包,miniconda的安装包下载官网为https://conda.io/en/latest/miniconda.htmlsh 文件名(下载的安装包)//如果报错,将sh改为bashexport PATH=/usr/bin:/bin//当更改环境变量时改错了,所有命令都无效时,出现类似如下报错:Command 'vim' is ...

2019-03-29 15:56:20 5237

原创 英语六级写作必备短语词汇1

in the decades to come在未来的十年be/feel bound to do sth=should有责任做某事deserve consideration / attention 值得注意pay due attention to充分重视put great emphasis on充分重视attach great importance to充分重视attach utmost...

2019-03-25 22:39:52 1227

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除