自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (21)
  • 收藏
  • 关注

原创 基于Transformer的三元组抽取和实践

Bert 原理模型介绍代码实践bert 原理Bert的全名是Bidirectional Encoder Representations from Transformers,其主要结构是Transformer的encoder层,其包括两个训练阶段,预训练与fine-tuningBERT_BASE (L=12, H=768, A=12, Total Parameters=110M) BERT_LARGE (L=24, H=1024, A=16, Total Parameters=340M).ht

2021-03-02 14:06:01 3573 5

原创 无监督学习文本使用到的技术(一)

概览:1.doc2vec 训练句子向量2.word2vec训练词向量3.kmeans/dbscan训练句子聚类4.tfidf寻找关键信息。5.LDA主题文本聚类组合使用:doc2vec+tfidf+kmeans先从doc2vec谈起来: 1.文本分词 jieba/hanlp 2.建立分词和下标id##words_list =['aaa',...

2019-07-24 14:38:17 679

原创 推荐系统概述

推荐系统遇上深度学推荐系统遇上深度学习系列:推荐系统遇上深度学习(一)--FM模型理论和实践推荐系统遇上深度学习(二)--FFM模型理论和实践推荐系统遇上深度学习(三)--DeepFM模型理论和实践推荐系统遇上深度学习(四)--多值离散特征的embedding解决方案推荐系统遇上深度学习(五)--Deep&Cross Network模型理论和实践推荐系统遇上深度...

2018-07-19 16:18:59 414

原创 Elasticsearch配置文件详解

a. 在上面博客中,我们已经安装并且成功配置了Elasticsearch以及部分插件,接下来我们就需要看看Elasticseach的配置文件的信息以及文档的一些说明。  b.首先找到Elasticsearch的安装位置,跳转到elasticsearch的config文件夹下,在此文件夹下含有两个配置文件:elasticsearch.yml和logging.yml,第一个是Elasticse

2016-10-25 21:49:37 2440

原创 常用统计数学公式学习(1)方差与期望值

怎么证明 1) D(X)=E(X^2)-[E(X)]^2 2) D(X)=E[X-E(X)]^2证明如下所示: 这是一个数学统计的问题.D(X)指方差,E(x)指期望.E(X)说简单点就是平均值,具体做法是求和然后除以数量.D(X)就是个体偏离期望的差,再对这个差值进行的平方,最后求这些平方的期望.具体操作是,(个体-期望),然后平方,再对这些平方值求平均值.说清楚

2016-02-15 16:33:51 12619 1

转载 Python学习笔记(一)压缩与解压缩文件

Python压缩与解压缩文件 Python能够直接处理zip文件中的数据,例如需要将对应目录或多文件打包或压缩成zip格式,或者需要查看一个zip格式的归档文件中部分或所有的文件同时避免将这些文件展开到磁盘上,自1.6版本起,python中zipfile模块以实现相应操作。不过zipfile模块目前还不能处理分卷zip文件和带有注释的zip文件。目前仅整理对zip文件的读取

2015-12-18 19:50:42 1024

原创 多线程之CompletionService使用

如果你向Executor提交了一个批处理任务,并且希望在它们完成后获得结果。为此你可以保存与每个任务相关联的Future,然后不断地调用timeout为零的get,来检验Future是否完成。这样做固然可以,但却相当乏味。幸运的是,还有一个更好的方法:完成服务(Completion service)。CompletionService整合了Executor和BlockingQueue的功能

2015-06-08 19:38:08 757

原创 利用Java NIO 实现文件监控功能。

利用java7提供的工具包实现文件的创建,修改,删除监控服务。package com.news.feature;import java.io.IOException;import java.nio.file.FileSystems;import java.nio.file.Files;import java.nio.file.Path;import java.nio

2015-04-29 12:38:05 1652

原创 Eclipse Market连不上网的问题

Eclipse Market有时候会有连不上网的问题,解决方案是 检查  window/preference/general/Network Connections 找到后点击 把Native 改为 Directly.

2014-12-09 19:58:23 1762

原创 词语语义度计算

Recently,I am researching some technologies about the similarity of two

2014-10-30 19:23:19 463

原创 如何在Maven中加入依赖

在Maven中加入依赖如下所示maven “ com.sun.media”  repository

2014-10-30 01:18:29 729

原创 利用FutureTask进行线程并发操作

package graph;import java.util.concurrent.Callable;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.FutureTask;import java.ut

2014-04-14 00:01:23 457

原创 开始

以往我都是在博客园上活动,现在转到CSDN上来,技术交流与学习。

2013-09-15 01:11:16 356

HBase权威指南

HBase学习,比较权威的一本书,大家可以进行参考学习。

2015-04-27

数据挖掘:概念与技术

数据挖掘:概念与技术,有愿意研究学习数据挖掘的同学可以进行深入研究。

2015-04-27

Redis设计与实现

适合于有一定基础的同学,学习,介绍Redis的实现原理。

2015-04-27

斯坦福机器学习课程

斯坦福机器学习课程全部资料,对机器学习有兴趣的同学,可以参考本资料。

2015-04-27

模式识别机器学习

模式识别,对机器学习有兴趣的同学可以去研究一下。

2015-04-27

Node js 文档

Node js ,作为一门新型的后端js语言,对广大javascript funs来说有很大帮助哦

2014-11-02

Oracle优化

基于Oracle海量数据的开发,对喜欢海量数据优化的同学来说有很大的帮助。

2014-10-29

HTML5 学习

HTML5 学习文档,对研究新技术的同学有很大的帮助。

2014-10-29

自己动手写网络爬虫

自己动手写网络爬虫源代码,对搜索爱好者有很大帮助。

2014-10-18

智能Web算法中文版

智能Web算法讲的是最新的web聚类,分类等实用性很强的算法。

2014-04-20

经典算法150

经典算法文档里面包含程序猿应掌握的150种常用算法,很适合算法入门,里面有Java和C++两种语言编写。

2014-04-12

Git中文教程

Git用来上传coding的版本控制器,会逐渐取代SVN,可以学习。

2014-04-12

MongoDB权威指南

MongoDB权威指南适合于研究No-SQL的程序猿funs,比较权威的指南。

2014-04-12

HTML5高级程序设计

最新HTML5开发高级编程,适合广大WEB程序猿。

2014-04-12

Java数据结构与算法

Java数据结构与算法是基于Java写的,适合广大Java程序猿。

2014-04-12

数据挖掘资料

数据挖掘内容,里面主要是对数据的一种深层次介绍。

2012-10-31

数据挖掘技术

对数据仓库,数据挖掘感兴趣的朋友可以看一看。

2012-10-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除