自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1356)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 博客阅读及知识获取指南

本人本硕应用统计学,博士生物数学,目前研究兴趣为机器学习及生物信息,主要更新统计学、机器学习和生物信息学相关BLOG。我业余做前后端开发,所以会更一些Web相关内容。同时,偶尔我也会更新一些其他专业相关的BLOG,比如,心理学和计算机科学。QQ:1033794241工作邮箱:[email protected].....................

2020-06-15 17:34:43 2295 9

原创 图学习文献整理(part1)

图表征学习论文总结

2023-11-03 21:01:52 161

原创 python观察日志(part31)--使用imp.reload()重载已经导入的模块

`imp`模块提供了一个接口,用于实现导入语句的机制.

2023-01-16 09:49:09 422 1

原创 pytorch图机器学习(part1)--入门案例

pytorch图机器学习

2022-12-18 15:38:27 375

原创 生信文献记录(part6)--Iterative transfer learning with neural network for... in scRNA-seq analysis

聚类和细胞类型分类是单细胞RNA-seq(scRNA-seq)分析的重要步骤。随着越来越多的scRNA-seq数据的出现,利用外部良好注释的源数据的监督细胞类型分类方法开始比无监督聚类算法更受欢迎;然而,现有的监督方法的性能高度依赖于源数据的质量,它们对源数据中缺失的细胞类型分类的准确性往往有限。我们开发了ItClust来克服这些限制,这是一种迁移学习算法,借鉴了监督细胞类型分类算法的思路,但也利用了目标数据中的信息,以确保对只存在于目标数据中的细胞进行分类的敏感性。

2022-12-09 11:40:35 342

原创 文献学习(part104)--A Survey of Deep Learning and Its Applications: A New Paradigm to Machine Learning

现在,深度学习是一个current和stimulating的机器学习领域。深度学习是最有效的、有监督的、有时间和成本效益的机器学习方法。深度学习不是一种限制性的学习方法,但它遵守各种程序和拓扑结构,可以应用于巨大的复杂问题的样本。该技术以一种非常分层的方式学习illustrative 和 differential特征. 深度学习方法已经取得了重大突破,在各种应用中都有不错的表现,并具有有用的安全工具。它被认为是通过采用反向传播算法发现高维数据中复杂结构的最佳选择。由于深度学习在众

2022-12-06 10:37:07 291 1

原创 文献学习(part103)--Inductive Representation Learning on Large Graphs

大图中节点的低维嵌入已被证明在各种预测任务中非常有用,从内容推荐到识别蛋白质功能. 然而,大多数现有的方法要求在训练嵌入时图中的所有节点都存在;这些以前的方法本质上是归纳性的,不能自然地推广到未见过的节点. 在这里,我们提出了GraphSAGE,这是一个通用的归纳框架,利用节点特征信息(如文本属性)来为以前未见过的数据有效地生成节点嵌入。我们不是为每个节点训练单独的嵌入,而是学习一个函数,通过从节点的本地邻域采样和聚合特征来生成嵌入。

2022-11-30 16:06:29 816

原创 Machine Learning with Graphs

学习笔记,仅供参考,有错必纠。

2022-11-29 19:59:11 444

原创 python观察日志(part29)--macOS中虚拟环境设置

虚拟环境

2022-11-01 21:17:21 205 1

原创 书籍学习|New Developments in Unsupervised Outlier Detection(part1)

最近,离群点检测作为数据挖掘的一个研究领域有了很大的进展。大量的数据挖掘技术已经被开发出来,对无监督的离群点检测领域产生了影响。我们写这本书的目的是为那些对探索这一迷人领域感兴趣的人提供一个友好而全面的指南。换句话说,本书的目的是提供方便的途径来了解最近对无监督离群检测理论的贡献,评估其对该领域的影响及其对理论和实践的影响。

2022-10-19 10:23:40 423

原创 书籍学习|Supervised and Unsupervised Learning for Data Science(part1)

监督和无监督学习算法在从大数据集获取知识方面显示出巨大的潜力。

2022-10-19 10:13:16 321

原创 书籍学习|Unsupervised Learning Algorithms(part1)

随着大量无标签数据的激增,无监督学习算法--可以自动发现这些数据中有趣和有用的模式--在研究人员和从业人员中得到了普及。这些算法已经发现了许多应用,包括模式识别、市场篮子分析、网络挖掘、社会网络分析、信息检索、推荐系统、市场研究、入侵检测和欺诈检测。在过去的半个世纪里,由于难以开发出理论上合理的、可用于客观评价的方法,因此许多无监督学习算法被提出。

2022-10-19 09:49:06 406

原创 书籍学习|Unsupervised Feature Extraction Applied to Bioinformatics(part1)

这是一本关于非常经典的数学技术的书:主成分分析和张量分解.

2022-10-18 23:56:38 297

原创 书籍学习|Advances in Bioinformatics(part1)

生物信息学是一个迅速发展的生物学领域,并获得了重大的科学和公众关注。它目前被用于生物科学研究的所有领域,并加速了研究工作。它结合了生物学、计算机科学、信息技术、数学和统计学的原理来分析和解释生物数据。

2022-10-18 19:30:48 319

原创 书籍学习|Statistical Modelling and Machine Learning Principles for Bioinformatics Techniques(part1)

生物信息学是一个多方面的领域,涉及生物数据的计算方法、技术和软件工具的发展。为了更好地理解和分析生物数据,生物信息学将计算机科学、自然科学和数学领域结合起来。它涉及到生物数据的收集、建模、信息处理分析和可视化,并反过来帮助创建新的算法和工具。

2022-10-18 18:56:32 264

原创 书籍学习|Generalized Principal Component Analysis(part1)--Preface

本书全面介绍了从一个或多个低维子空间(或流形)中提取并可能被噪声、严重错误或异常值破坏的高维数据建模的数学理论和计算工具的最新进展。

2022-10-18 09:28:17 359

原创 单细胞论文记录(part29)--Overcoming Expressional Drop-outs in Lineage Reconstruction from Single-Cell...

单细胞谱系追踪(Single-cell lineage tracing)为了解单个细胞的命运提供了关键性的见解. 单细胞RNA测序(scRNA-seq)普遍应用于现代生物医学研究,但基于遗传学的scRNA-seq数据的系谱追踪仍未被探索. 来自scRNA-seq数据的变体调取存在独特的 "表达缺失",包括基因表达中的低表达和等位基因偏差,这给血统重建带来重大障碍. 我们介绍了SClineager,它通过借用相关细胞的信息来克服表达缺失,从scRNA-seq数据中推断出准确的进化谱系。我们系统

2022-10-17 21:38:01 224

原创 生信文献记录(part5)--Application of Sparse Representation in Bioinformatics

受L1-norm最小化方法的启发,如基数追寻、压缩传感和Lasso特征选择,近年来,稀疏表示作为一种新颖而有效的数据处理方法出现,并显示出强大的优越性. 研究人员不仅将信号的稀疏表示扩展到图像表现,而且还将向量的稀疏性应用于矩阵的稀疏性. 此外,稀疏表示还被应用于模式识别,并取得了良好的效果. 由于稀疏表示具有多种优点,如对噪声不敏感、鲁棒性强、对选定的特征不太敏感、没有 "过拟合 "现象等。

2022-10-16 17:17:31 299

原创 生信文献记录(part4)--Ensemble deep learning in bioinformatics

Ensemble方法和深度学习模型的显著灵活性和适应性导致了它们在生物信息学研究中的应用激增. 传统上,这两种机器学习技术在生物信息学应用中基本上被当作独立的方法论. 然而,最近出现的Ensemble深度学习–其中两种机器学习技术被结合起来以实现模型准确性、稳定性和可重复性的协同改进–促使了新一轮的研究和应用. 在这里,我们分享了最近ensemble深度学习的主要发展,并看看他们的贡献是如何使从基础序列分析到系统生物学的广泛的生物信息学研究受益.

2022-10-15 20:14:15 447

原创 生信文献记录(part3)--Statistical power for cluster analysis

聚类算法在生物医学研究中越来越受欢迎,因为它们具有识别数据中离散子群的能力,而且在主流软件中越来越容易获得。虽然存在算法选择和结果评估的指南,但没有牢固确立的方法来计算聚类分析的先验统计能力。在这里,我们通过模拟来估计常见分析功能的性能和分类精度。我们系统地改变了子组的大小、数量、分离(效应大小)和协方差结构。然后,我们对生成的数据集进行降维处理(无,多维缩放,或统一流形近似和投影)和聚类(K-means,带有Ward或平均联系和欧氏或余弦距离的聚类分级,HDBSCAN)。

2022-10-12 22:41:13 389

原创 生信文献记录(part2)--Deep learning-based clustering approaches for bioinformatics

聚类是许多数据驱动的生物信息学研究的核心,是一种强大的计算方法。特别是,聚类有助于分析序列、表达、文本和图像等形式的非结构化和高维数据。此外,聚类被用来深入了解基因组学层面的生物过程,例如,基因表达的聚类可以深入了解数据中固有的自然结构,了解基因功能、细胞过程、细胞亚型和了解基因调节。

2022-10-11 17:00:36 445

原创 生信实验记录(part4)

代码记录

2022-09-28 17:24:17 591

原创 单细胞论文记录(part28)--GCNG: graph convolutional networks for inferring gene interaction from ST data

大多数从表达数据中推断基因-基因相互作用的方法都集中在细胞内的相互作用. 高通量空间表达数据的出现,为推断细胞内和细胞间的这种相互作用的方法打开了大门. 为了实现这一目标,我们开发了基因图卷积神经网络(GCNG). GCNG将空间信息编码为图,并通过监督训练将其与表达数据相结合. GCNG改进了先前用于分析空间转录组学数据的方法,并能提出新的细胞外相互作用的基因对. GCNG的输出也可用于下游分析,包括功能基因分配.

2022-09-28 10:38:36 247

原创 文献学习(part102-A)--Autoencoders

自编码器是神经网络的一种特殊类型,它主要被设计为将输入编码为一种压缩的、有意义的表示,然后再将其解码,使重建的输入尽可能地与原始输入相似. 本文调查了当今主要使用的不同类型的自编码器. 它还描述了自编码器的各种应用和使用情况.

2022-09-25 16:35:24 324

原创 文献学习(part100-C)--An Introduction to Autoencoders

学习笔记,仅供参考,有错必纠

2022-09-23 19:07:46 405

原创 文献学习(part100-B)--An Introduction to Autoencoders

学习笔记,仅供参考,有错必纠

2022-09-22 21:16:24 255

原创 单细胞论文记录(part27)--Method of the Year: spatially resolved transcriptomics

如果一个研究人员正在制作冰沙,这可能是小吃时间. 或者,这可能是为大量RNA测序准备样本的时刻,在这种情况下,组织被均质化并进行分析,以获得来自组织细胞中mRNA的平均基因表达–其转录组.

2022-09-19 09:03:31 312

原创 单细胞论文记录(part26)--Spatial components of molecular tissue biology

以空间分辨率的方式分析RNA和蛋白质表达的方法正在迅速发展,使得全面描述健康和疾病中的细胞和组织成为可能. 为了最大限度地利用这些技术获得的生物学见解,关键是要清楚地阐明组织的空间分析中的关键生物学问题,并开发必要的计算工具来解决这些问题. 分析工具的开发者需要决定每个细胞的内在分子特征,以及如何将细胞形状和形态特征纳入分析中. 另外,在不同长度尺度上比较不同组织样本的最佳方法仍在寻求之中.

2022-09-17 16:25:43 304

原创 单细胞论文记录(part25)--Cell type-specific inference of differential expression in spatial transcriptomics

空间转录组学的一个核心问题是检测跨组织背景的细胞类型中的差异表达(DE)基因. 学习DE的挑战包括跨空间的细胞类型组成的变化和测量像素检测多种细胞类型的转录物. 在此,我们介绍了一种统计方法,即细胞类型的差异表达推断(C-SIDE),它可以在空间转录组学中识别细胞类型的特定DE,并考虑到其他细胞类型的定位. 我们将基因表达建模为跨细胞类型的对数线性细胞类型特定表达函数的加性混合物. C-SIDE的框架适用于许多情况.

2022-09-16 08:56:32 398

原创 单细胞文献学习(part8)--Characterizing spatial gene expression heterogeneity in spatially resolved ...

最近的技术进步使固定组织中数百至数千个基因的表达谱的空间分辨率测量成为可能,而且是单细胞分辨率. 然而,能够考虑到细胞类型固有的三维空间组织和组织内非均匀细胞密度的可扩展计算分析方法仍然缺乏. 为了解决这个问题,我们开发了MERINGUE,这是一个基于空间自相关和交叉相关分析的计算框架,可以识别具有空间异质性表达模式的基因。

2022-09-15 22:43:31 263

原创 单细胞论文记录(part24)--Transcriptome-scale spatial gene expression in the human dorsolateral prefrontal...

我们使用10x Genomics Visium平台来定义6层人类背外侧前额叶皮层(DLPFC)中基因表达的空间拓扑. 我们确定了广泛的层级富集的表达特征,并完善了与之前层级标记的关联. 我们将我们的层级表达特征叠加到大规模单核RNA测序数据上,加强了表达驱动的集群的空间注释. 通过整合神经精神疾病基因集,我们显示了与精神分裂症和自闭症谱系障碍相关的基因的差异性层富集表达,突出了空间定义的表达的临床意义.

2022-09-08 23:04:31 210

原创 单细胞论文记录(part23)--SC3 - consensus clustering of single-cell RNA-Seq data

单细胞RNA-seq(scRNA-seq)可以根据全局转录组的特征进行定量的细胞类型描述. 我们提出了单细胞共识聚类(SC3),这是一个用户友好的无监督聚类工具,通过协商一致的方法结合多种聚类方案,实现了高精确度和稳健性. 我们证明SC3能够根据从病人身上收集的肿瘤细胞的转录组识别亚克隆.

2022-09-08 18:01:24 280

原创 单细胞论文记录(part22)--Giotto: a toolbox for integrative analysis and visualization of spatial expression

空间转录组和蛋白质组技术提供了新的机会来研究细胞在其原生微环境中的情况. 在这里,我们提出了Giotto,一个用于空间数据分析和可视化的全面和开源的工具箱. 该分析模块通过实现广泛的算法来提供端到端的分析,以描述组织构成、空间表达模式和细胞相互作用. 此外,单细胞RNAseq数据可以被整合到空间细胞类型富集分析中. 可视化模块允许用户交互式地将分析结果和成像特征可视化. 为了证明其普遍适用性,我们将Giotto应用于包括不同技术和平台的广泛的数据集.

2022-09-06 22:54:24 280

原创 单细胞文献学习(part7)--Visualization and analysis of gene expression in tissue sections by spatial transcri

对组织学切片中蛋白质或信使RNA(mRNA)模式的分析是生物医学研究和诊断学的基石. 我们设计了一种策略,我们称之为 "空间转录组学",它允许在单个组织切片中以空间分辨率对转录组进行可视化和定量分析. 通过将组织学切片置于具有独特positional barcodes的阵列式反转录引物上,我们展示了高质量的RNA测序数据,并保持了小鼠大脑和人类乳腺癌的二维位置信息. 空间转录组学提供了定量的基因表达数据和组织切片内mRNAs分布的可视化,并实现了新型的生物信息学分析,在研究和诊断中很有价值

2022-08-23 23:23:50 215

原创 单细胞论文记录(part21)--Demystifying “drop-outs“ in single cell UMI data

数据的分析一直具有挑战性,特别是由于在UMI计数中观察到过多的零点. 一个普遍的观点是,许多检测到的零是在实验过程中发生的 “drop-outs”,这些零应该通过归一化、方差稳定化和推算等程序加以说明. 在这里,我们广泛地分析了公开可用的UMI数据集,并对现有的scRNA-seq工作流程提出了挑战.

2022-08-23 19:55:18 275

原创 单细胞论文记录(part20)--A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing ...

对人类的心脏形态发生过程的了解还不全面. 它的完整特征需要以单细胞的空间分辨率深入探索整个器官的基因表达协调过程. 在这里,我们提出了一种分子方法,揭示了胚胎心脏在三个发育阶段的细胞类型的全面转录情况,并将细胞类型的特定基因表达映射到特定的解剖学领域. 空间转录组学确定了独特的基因谱,与每个发育阶段的不同解剖区域相对应. 通过单细胞RNA测序确定的人类胚胎心脏细胞类型证实并丰富了胚胎心脏基因表达的空间注释. 然后,原位测序法被用来完善这些结果,并为三个发育阶段创建一个空间亚细胞图.

2022-08-23 17:31:28 224

原创 高级计量经济学(part2)--小样本OLS

“最小二乘法" (Ordjnary Least Square, 简记OLS) 是单一方程线性回归模型最常见、最基本的估计方法.

2022-08-22 23:42:04 959

原创 高级计量经济学(part1)--什么是计量经济学

顾名思义,”计量经济学" ( E conometrics, 也译为“ 经济计量学)就是运用概率统计的方法对经济变量之间的(因果)关系进行定量分析的科学. 之所以把“因果”两个字加括号,是因为计量经济学常常不足以确定经济变量之间的因果关系(由于实验数据的缺乏) ,另一方面,大多数实证分析的目的恰恰正是要确定变量之间的因果关系(即是否X 导致Y),而非仅仅是相关关系. 因此,在学习与应用计量经济学的过程中,很有必要以“因果关系”作为思考的框架与指引.

2022-08-22 21:10:53 502

原创 深度学习(part9)--使用CNN完成MNIST手写体识别

代码笔记,仅供参考,有错必究。

2022-08-17 20:48:56 372

原创 深度学习(part8)--CNN卷积神经网络

学习笔记,仅供参考,有错必究;

2022-08-17 19:35:19 657

JDK1.6中文手册.CHM

JAVA中文查询,学JAVA的时候用的。 欢迎大家看文档,来学习。

2020-04-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除