自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 自然语言处理之____Fasttext

1,fasttext架构fasttext的模型类似于word2vec中的cbow模型,cbow是预测中间的词,而fasttext是用整个文本的特征去预测文本的类型fasttex使用了层次softmax,层次softmax技巧是建立在哈夫曼编码的基础上,fasttext利用了类别不均衡这个事实,对标签构建树型结构,出现次数越少的标签在越后面,层次越深,这样能够极大的提高计算效率2,fasttext的...

2018-02-21 11:35:40 657

原创 最小生成树之克鲁斯卡尔算法

关于最小生成树的经典算法一个是普里姆算法,另一个就是克鲁斯卡尔算法,在这里和大家一起讨论,有不对的地方希望大家多多指教,先上图和普里姆算法用一个数组进行比较不同的是,克鲁斯卡尔算法用的是边进行比较,一条边的起始节点,终端 节点,和边的权值再按权值的大小对边从小大到进行排序,而克鲁斯卡尔算法的核心思想是,要找到最小的生成树,那么就将边从小到大一条一条加进去,只要碰见加进去会出现回环就加,这样从小到大...

2018-02-15 16:45:34 185

原创 最小生成树普里姆算法

最近在研究数据结构与算法,在这里和大家分享下关于最小生成数的经典算法,普里姆算法,在许多场景下都是应用广泛的运用一个邻接矩阵来表示图之间的关系,矩阵中的数值表示权值,而我们需要找到一组最小的权值且能够联通图上的所有点,首先,普里姆算法的核心就是运用一个数组存储当前找到的最小边,然后一直往下找直到全部遍历完,话不多说直接上代码解释,这里是用java写的public void prim(){ i...

2018-02-15 16:16:59 332

原创 浅析机器学习的主题模型和语义分析

下面和大家分享下机器学习中LDA主题模型的心得,首先从大体上来说假设有400篇文档,每一篇文档后面都m个主题,可以是 医学,教育,军事。。 那么对这400篇文档我们提取出它的词库,假设一共有L个词 那么每一个主题后面都对应着一个词库,我们可以理解为每一个主题后面都对应着L维的一个词分布。好的接下来我们拿到一篇文档,它后面有个主题分布是m维的,那么我们从这m维的主题分布中根据分布选出一个主题,然后这

2017-11-12 21:25:53 1442

原创 解析机器学习中的几种常见聚类算法

关于聚类算法一直是近几年来机器学习的热门,下面谈谈自己对其中几种聚类算法的理解,首先在谈聚类算法之前我们引入相似度这么一个概念,什么是相似度呢,简单来说假设有M个样本,其中任意两个样本之间的相似的度量,很明显我们需要一个标准去度量它们下面有几种常见的度量标准:1.欧式距离 2.杰卡尔德距离 3.相关系数1 K-Means算法 还有一些度量标准在这里就不多做介绍了,接下来我们介绍第一

2017-11-06 19:56:24 1475

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除