自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

2tong

茶轴上编织小梦想,期望不辜负这时光,请多指教喽

  • 博客(86)
  • 资源 (1)
  • 收藏
  • 关注

原创 动手学CV-学习札记

从深度学习环境配置、Pytorch基础使用介绍、自动求梯度、线性回归、MNIST分类挑战入手,学习CV

2021-10-17 23:33:00 954 1

原创 关于中文预训练模型泛化能力挑战赛学习札记

先留个坑

2021-02-21 00:29:32 190

原创 知识图谱创建--创建图谱

Neo4j创建class MedicalGraph: def __init__(self): pass # 读取文件,获得实体,实体关系 def read_file(self): psss # 创建节点 def create_node(self, label, nodes): pass # 创建疾病节点的属性 def create_diseases_nodes(self, disease_.

2021-01-13 21:30:04 320

原创 知识图谱学习笔记--知识图谱基础知识

一、知识图谱简介1.1 引言从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。早在 2010 年微软就开始构建知识图谱,包括 Satori 和 Probase;2012 年,Google 正式发布了 Google Knowledge Graph,现在规模已超 700 亿。目前微软和 Google 拥有全世界最大的通用知识图谱,Facebook 拥有全世界最大的社交知识图谱,而阿里巴巴和亚马逊则分别

2021-01-11 23:00:25 280

原创 2020-11-27

Task02:数据分析占个位子

2020-11-27 22:21:57 63

原创 2020-11-25

#### 零基础入门推荐系统 - 新闻推荐***参考链接:https://tianchi.aliyun.com/competition/entrance/531842/information占坑

2020-11-25 23:33:11 64

原创 Task3_SVM学习

1. 简介1.1 什么是SVM支持向量机(Support Vector Machine,SVM)是一个非常优雅的算法,具有非常完善的数学理论,常用于数据分类,也可以用于数据的回归预测中,由于其优美的理论保证和利用核函数对于线性不可分问题的处理技巧, 在上世纪90年代左右,SVM曾红极一时。 本文将不涉及非常严格和复杂的理论知识,力求于通过直觉来感受 SVM。2.实践## 基础函数库import numpy as np## 导入画图库import matplotlib.pyplot as plt

2020-08-26 23:07:46 106

原创 Task2_决策树

1. 简介1.1 什么是决策树决策树是一种常见的分类模型,在金融分控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。1.2 决策树的优点具有很好的解释性,模型可以生成可以理解的规则。可以发现特征的重要程度。模型的计算复杂度较低。1.3 决策树的缺点模型容易过拟合,需要采用减枝技术处理。不能很好利用连续型特征。预测能力有限,无法达到其他强监督模型效果。方差较高,数据分布的轻微改变很容易造成树结构完全不同。

2020-08-22 22:17:46 117

原创 Task1_LR学习

1. 简介1.1 什么是LR?逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。而对于逻辑回归而言,最为突出的两点就是其模型简单和模型的可解释性强。1.2 LR的优劣势2.1 优点:实现简单,易于理解和实现计算代价不高,速度很快,存储资源低2.2 缺点:容易欠拟合分类精度可能不高

2020-08-20 23:33:33 170

原创 零基础入门NLP_Task6 基于深度学习的文本分类3_Bert

Task6 基于深度学习的文本分类3Author: 2tong与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。BertBERT是一个基于Transformer的多层Encoder,通过执行一系列预训练,进而得到深层的上下文表示。相关知识Transformer原理Transformer模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的解码部分是由相同数量的解码器的堆叠。####### 相关论文Attention is All You Need

2020-08-04 23:49:19 811

原创 from __future__ import print_function 用途?

最近阅读代码的时候,常见到如下所示的代码:from __future__ import print_functionimport torchfrom __future__ import print_function的作用主要是在python2.X中引入python3.X的print特性。from __future__ import print_functionprint("hello, 2tong.")...

2020-08-01 20:14:22 223

原创 零基础入门NLP_Task5_基于深度学习的文本分类2_Word2vec

Task5 基于深度学习的文本分类2Author: 2tong与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。Word2vec基础知识word2vec模型背后的基本思想是对出现在上下文环境里的词进行预测。对于每一条输入文本,我们选取一个上下文窗口和一个中心词,并基于这个中心词去预测窗口里其他词出现的概率。因此,word2vec模型可以方便地从新增语料中学习到新增词的向量表达,是一种高效的在线学习算法(online learning)。word2vec的主要思路:通过单词

2020-07-31 21:42:35 267

原创 零基础入门NLP_Task4_基于深度学习的文本分类1 学习笔记

Task4 基于深度学习的文本分类1Author: 2tong与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。以FastText为例,学习基于深度学习的文本分类。FastText基本信息FastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。所以FastText是一个三层的神经网络,输入层、隐含层和输出层。和TF-IDF比较FastTe

2020-07-26 22:02:55 155

原创 零基础入门NLP_Task03_基于机器学习的文本分类_学习笔记

Task3 基于机器学习的文本分类 学习笔记Author: 2tong文本表示方法1.One-hot这里的One-hot与数据挖掘任务中的操作是一致的,即将每一个单词使用一个离散的向量表示。具体将每个字/词编码一个索引,然后根据索引进行赋值。One-hot表示方法的例子如下:句子1:我 爱 哈 尔 滨句子2:我 喜 欢 橙 子首先对所有句子的字进行索引,即将每个字确定一个编号:{ '我': 1, '爱': 2, '哈': 3, '尔': 4, '滨': 5, '喜': 6,

2020-07-25 22:55:29 113

原创 零基础入门NLP_Task2_数据读取与数据分析 学习笔记

Task2 数据读取与数据分析 学习笔记Author: 2tong教程学习1.数据读取>>> import pandas as pd>>> train_file = './data/train_set.csv'>>> train_df = pd.read_csv(train_file, sep='\t', nrows=100)>>> train_df.head() label

2020-07-22 21:24:56 129

原创 零基础入门NLP之新闻文本分类_赛题理解_学习笔记

Author: 2tongRef: 零基础入门NLP之新闻文本分类Task1 赛题理解 学习笔记基本信息1. 赛题目标2. 赛题任务3. 赛题数据3.1 数据大小3.2 数据格式解题思路1.赛题本质2.赛题难点3.赛题指标4.赛题分析技术储备1.分类问题常用评价指标2.TF-IDF基本信息1. 赛题目标接触NLP的预处理、模型构建和模型训练等知识点2. 赛题任务以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。3. 赛题数据3.1 数据大小train..

2020-07-20 23:39:22 199

原创 MySQL报错:Incorrect string value: '\xE6\x9D\x82\xE8\xB4\xA7...' for column

看到这种Incorrect string value: '\xE6\x9D\x82\xE8\xB4\xA7...' for column时,可以考虑数据库编码是否支持utf8。进行确认后,一般可以解决。

2020-03-18 16:04:04 802

原创 Swagger配置

前言:集成swagger到已进行interceptor配置的spring boot项目中;解决问题:1.swagger配置2.interceptor不对swagger进行拦截配置swagger首先,在pom文件中引入依赖:<properties> <io.springfox.version>2.9.2</io.spring...

2020-03-18 15:36:19 225

原创 spring boot填坑(一)

问题1:Failed to configure a DataSource.报错信息节选如下所示:***************************APPLICATION FAILED TO START***************************Description:Failed to configure a DataSource: 'url' attribut...

2020-03-16 11:53:34 515

原创 Redis安装及配置

1.安装及配置环境Windows 10,64位系统2.安装步骤2.1 下载msi下载地址是:https://github.com/MicrosoftArchive/redis/releases/tag/win-3.2.100官网地址为:https://redis.io/2.2 使用msi进行安装逐步点击Redis-x64-3.2.100.msi的安装协议即可,根据自己的...

2019-11-21 17:12:19 142

原创 Jupyter安装

1.安装方式pip install jupyter可能遇到的问题:目标计算机积极拒绝,大概是这样的报错:解决方式:关掉代理服务器设置,再次尝试,成功解决。2.使用方式本地启用方式:jupyter notebook...

2019-10-17 17:15:16 157

原创 Linux的软链接与硬链接

Linux链接分为两种,一种是软链接,或者说是符号链接(Symbolic Link),一种是硬链接(Hard Link)。1.什么是软链接软链接文件有些类似于我们熟知的Windows快捷方式。它实际上是一个特殊的文件。对软链接而言,文件实际上是一个文本文件,其中包含有另一个文件的存储位置信息。[zhangtong@rack5-8 test]$ touch 2tong.vcf[zha...

2019-10-17 15:46:02 207

原创 Python 2.7 --- 小手册

不定期整理,仅用于学习和记录,如果有错误,请及时帮忙订正,谢谢~1.Filter函数1.1 使用方式##语法filter(function, iterable)##Python 2.7返回的是一个list,Python 3返回的是一个迭代器##举例 def greater_than_five(n): return n > 5 newlist = filte...

2019-10-12 17:39:33 195

原创 祖源分析相关链接推荐

1.推荐一个工具GitHub链接为:https://github.com/wegene-llc/radmixture使用时可以参考的博客:https://blog.csdn.net/zd200572/article/details/88692814

2019-04-17 09:43:58 380

原创 Whoosh初次使用

1.Python代码1.1 构建索引def build_index(file_path): start_time = time.clock() schema = Schema(title=TEXT(stored=True), path=ID(stored=False), content=TEXT(stored=True)) ix = cr...

2019-04-12 13:39:54 333

原创 lucene 初次使用

1.使用方式1.1 构建索引 /** * 指定indexDir、filePath构建索引 * * @param indexDir:索引文件夹的路径 * @param filePath:要建立索引的文件路径 * @return 如果indexDir存在同名的文件,则return false,文件夹存在,不构建,return true...

2019-04-12 13:18:25 160

原创 Climbing Stairs问题

难度级别:Easy1.题目描述You are climbing a stair case. It takes n steps to reach to the top.Each time you can either climb 1 or 2 steps. In how many distinct ways can you climb to the top?Note: Given n...

2019-04-08 14:08:14 120

原创 Maximum Subarray问题

1.问题描述Given an integer array nums, find the contiguous subarray(containing at least one number) which has the largest sum and return its sum.Example:Input: [-2,1,-3,4,-1,2,1,-5,4],Output: 6E...

2019-04-08 11:18:24 167

原创 Python回顾整理与学习--------range和xrange的异同

Python 2中:1.range([start,] stop[, step])根据指定的初始值start,stop和步长step返回一个list。>>>range(0,3,1)[0,1,2]>>>range(0,4,2)[0,2]2.xrange([start,] stop[, step])根据指定的初始值start,stop和...

2019-04-08 10:09:19 121

原创 前端页面常用小知识

1.想要将button默认的样式去除#button{ margin: 0; padding: 0; outline: none; border: 1px solid transparent; }2.想要一行显示多列的布局 &lt;div class="form-group"&gt; &lt;label for="name" ...

2019-02-25 14:44:00 141

原创 数据库设计优化

1.推荐的博客帖子https://blog.csdn.net/Enjoy_endless/article/details/79506276

2019-02-20 10:08:07 98

原创 回首与展望

 2018年的小回首:不知不觉,已经转正一年零三个月了,这一年多的时光里,有很多收获。去301的时候,不再只去门诊大楼、外科大楼逛逛了,也去肿瘤大楼蹲点守候守候了;加班不再只是为了写代码完成需求,也有等待需求提出方进行需求沟通的时候了;公司不再只使用Struts2了,也开始用Spring boot了,未来还会用Spring cloud;除了写代码,也去参加了GATK的培训,...

2019-01-23 10:47:11 265

原创 Spring Boot接收文件上传

遇到的问题:今日份的工作任务之一,是需要将师兄写好的代码,整合到项目中来,在修改的过程中遇到一些问题,一直提示request.getInputStream().read()这句语句执行后,buffer并没有获取到相应的值。开始进行尝试解决这个问题,首先核对了下师兄那里可以跑通的代码:请求头如下所示:参数,表单数据如下所示:划重点,Content-type为ap...

2019-01-14 18:25:02 1589

原创 Windows安装Nexus

前言:nexus基于简单文件系统而非数据库,是一个占用内存较少的、提供强大仓库管理功能、构件搜索功能的采用ExtJS应用框架的REST客户端。虽然,nexus更常见的可能是被称之为Maven仓库管理器,由于新的活儿是查询nexus搭建npm私服的方式,和maven仓库管理器类似,希望将通过npm下载的内容,下载到nexus私服上,而后,其余的小伙伴就可以直接从nexus私服上下载这些库了,...

2019-01-14 17:42:34 587

原创 Mysql数据库大量删除后,一条语句帮助断层消失

最近进行数据库操作,遇到一个问题,就是大量删除一个数据表中的数据后,由于设定了id是自增的,导致再插入时,默认生成的id会很大,这个时候想要再次插入新的数据,应该怎么办呢?1.明确目前最后一个id的大小select id from tags order by id DESC limit 0,1; 假设返回的是9,则设置数据表从10开始自增 2.修改这个数据表从10开始自增a...

2018-10-15 14:52:40 894

原创 初识swappiness参数

参数意义1.vm.swappiness参数可以在机器使用内存、交互分区的比例进行调整,起到优化作用2.vm.swappiness的值在0-100之间,当为0的时候,表示最大限度只用物理内存,而后使用swap空间,swappiness为100时,表示最大限度使用swap空间,把内存中的数据及时搬运到swap空间中去3.当内存使用到(100-vm.swappiness)%时,就会开始出现交...

2018-09-07 15:12:49 2454

原创 Jhistper脚手架入门---构建一个单体架构的应用

环境准备1.win10 家庭版的操作系统2.eclipse作为编辑器3.npm安装4.yarn安装项目搭建1.询问是否支持返回使用统计信息以支持工具的提升2.询问采用哪一种应用架构,这里以单体架构为例,嗯,因为刚刚接触,也不是很熟悉,还是从最简单的开始~3.询问应用名称注意:名称只能是大小写字母,数字和下划线的任意组合,不允许任何其它字符。...

2018-09-07 11:07:38 363

原创 Jhistper脚手架入门---前端修改

环境准备1.win10 家庭版的操作系统2.eclipse作为编辑器3.npm安装4.yarn安装5.一个已经搭建好了的单体架构应用Tips:搭建方式可以见Jhistper脚手架入门---构建一个单体架构的应用修改指南指南一:1.对前端页面进行相应的修改2.键入npm run webpack:build3.如果build成功的话,就可以了...

2018-09-07 11:07:30 369

原创 Jhistper脚手架入门-修改/升级实体

环境准备1.win10 家庭版的操作系统2.eclipse作为编辑器3.npm安装4.yarn安装5.一个已经搭建好了的单体架构应用Tips:搭建方式可以见Jhistper脚手架入门---构建一个单体架构的应用修改指南指南一:修改/升级已建立的entityTips:entity意味着这种方式的修改对象不包括自动生成的jhi_user这种表了键入j...

2018-09-07 11:07:20 239

原创 vi常用命令

1:进入编辑模式键入i,可以进入编辑模式2:退出&gt;ESC&gt;:q!3:保存并退出&gt;ESC&gt;:wq!4:显示当前行号&gt;:nu5:显示所有行号&gt;set nu6:跳转至某一行&gt;:1...

2018-09-03 13:19:21 114

C++基础教程

个人是个渣,觉得这份文档很实用,也很适用于初学者。有些知识也很详细的~

2014-07-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除