自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 10 大基本排序 --python

1 冒泡:相邻的元素作比较def bubble_sort(num): for i in range(1,len(num)-1): for j in range(len(num)-i):#后面的i个排序已完成了,不用再排了 if num[j]>num[j+1]: num[j],num[j+1] = num[...

2019-08-21 12:13:43 102

原创 keras----CNN评论分析

相比用tensorflow我更倾向用keras,理由:1. keras使用对于我来说更加简便。2. keras自带优化模型工具较好 3. 代码相对要简单一点在keras我用了3个模型,分别是cnn、RNN、cnn_rnn文本预处理:对于文本我们一般想到的都是去除标点符号和停用词,这里说明一点,之前我认为我的训练数据过少,打算不去停用词,这样训练会有更多的词汇和特征,但其实去除停用词可以...

2019-03-10 16:45:28 224

原创 集成学习

在我调试代码时,在后期可能是因为文本处理太多,总是导致过拟合现象,经过查阅资料,发现有很多种处理过拟合的方法防止过拟合的方法: (1) 正则化 (2) 数据增强,(这个方法我是根据CNN处理图片的方式,将每一行文本的内容打乱,这样我们的数据集就会增大将近1倍,这里需要注意的是,测试集放的数据在数据集中只有一个,该方法对数据的准确率作用不明显,大约提高1%) (...

2019-03-10 16:45:15 143

原创 svm旅游内容等级分类

处理文本:使用的全国高校应用创新大赛的数据集,共有两万条http://117.50.29.62/注意:文本的编码格式,一般为utf-8或者gb18030,经常报错的:1 UnicodeDecodeError: 'gbk' codec can't decode byte 0xfd in position 3061: illegal multibyte sequence解...

2019-03-10 16:44:56 386

原创 tensorflow——CNN旅游文本分类

CNN基本介绍1. CNN(卷积神经网路)是在近两年才用在文本处理上面的,本次实验中用tensorflow和keras分别实现了文本处理。tensorflow中,主要分为词嵌入层、卷积层、池化层和全连接层,要真正理解CNN首先要弄明白每个参数的作用,以及他每一步作用的方式和物理意义。(盗图)根据此图来讲解释CNN在文本的实现:1 CNN将文本内容按字读取,然后统计每个字出现的...

2019-03-10 16:44:24 626

原创 word2vec和胶囊网络

word2vecwordvec两种方式:cbow和skip-gram,两者在本质上是差不多的,只不过一个是用中间词预测周围侧,一个是用周为词预测中间词。两种模型:基于Hierarchical Softmax构造哈夫曼树,将问题变为多个二分类基于Negative Sampling模型参考文献:https://blog.csdn.net/itplus/article/det...

2019-03-10 16:43:47 121

原创 在线选课系统

一、数据库设计 需注意:  1. 考虑实体与实体之间的关系,如继承(学生和老师继承用户的属性,但他们分别是各自的)2. 考虑变量的类型与大小(如Id的类型设置为varchar(23),其中前三位是类型(stu),中间17位为时间戳,后面的3位1到999的随机数)、上传时间的类型设置为char(17)3. 数据库的字段最好用全部用大写,否则使用时要用双引号包含,数据库的值如果包含字母和数字时,用单引...

2018-05-16 18:57:52 4207 2

原创 Mybatis

1. id属性与定义的接口方法名一样,Mybatis通过这种方式将接口方法与xml中定义的sql语句联系在一起         接口方法只可以重载的,但是id不能重复,在同名方法中,增加一个RowBound类型的参数用于实现分页查询         resultMap用来配置java对象的属性和查询结果列对应的关系 <select id="selectById" resultMap="...

2018-05-12 09:00:08 132

原创 使用元数据来浏览数据库中的所有表

元数据:描述数据库或其组成部分的数据package dbcconnection;import java.awt.BorderLayout;import java.awt.Component;import java.awt.EventQueue;import java.awt.GridBagConstraints;import java.awt.GridBagLayout;imp

2018-01-10 17:52:50 212

原创 mysql数据库连接

package Test;import java.nio.file.*;import java.sql.*;import java.io.*;import java.util.*;public class TestDB {public static void main(String[] args) throws IOException{// TODO Auto-gene...

2018-01-09 14:50:08 135

香港城市大学语料库;微软亚洲研究院语料库;北京大学语料库;

香港城市大学语料库(1 772 202 字,训练集)、微软亚洲研究院语料库(1 089 050 字,训练集)、北京大学语料库(1 833 177 字,训练集

2019-02-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除