自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

不再的blog

一只会喊666的咸鱼

  • 博客(44)
  • 资源 (3)
  • 收藏
  • 关注

原创 MyBatisPlus入门

mybatisplus入门,就是mybatis的扩展版本

2022-07-04 20:01:42 193 1

原创 Spring Initializr初始化器创建springboot工程失败的解决方案

Initialization failed for https://start.spring.io想通过IDEA默认配置创建一个springboot项目,但是点击next后显示IntelliJ “Initialization failed for ‘https://start.spring.io’ Please check URL, network and proxy settings”,无法创建我在浏览器地址输入url’https://start.spring.io’是可以正常打开的.........

2022-07-03 16:20:05 753

原创 02-开发环境和工具

尚融宝项目笔记,自用

2022-07-01 17:48:52 857

原创 01-尚融宝项目介绍

金融项目,尚融宝自学相关笔记,自用

2022-06-07 15:41:54 1280

原创 《Improved Recurrent Neural Networks for Session-based Recommendations》 DLRS 2016 阅读笔记

《Improved Recurrent Neural Networks for Session-based Recommendations》 DLRS 2016 阅读笔记摘要:本篇论文在上篇论文的基础上对该模型进行优化,主要体现在以下几点:新的数据预处理方式,数据增强数据分布改变(时效性)Generalised distillationitem embedding代替全预测空间1.基础模型模型依旧简单,但是不同于之前的模型,它对embedding层加入了dropout参数来防止过拟合。

2020-09-27 18:31:14 340 2

原创 关于本地修改代码后与远程分支有冲突解决办法(这样会使本地被修改的代码被覆盖掉)

本地修改代码和远程分支有冲突:List itemgit fetch --allgit reset --hard origin/mastergit pullgit status到现在为止和自己的origin master相同git fetch upstreamgit rebase upstream/mastergit push origin master到现在为止把上游分支拉取下来,并且push上到自己fork的项目的master分支,结束。...

2020-09-02 19:20:18 878

原创 第二章:第二节数据重构1

复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。# 导入基本库import numpy as npimport pandas as pd# 载入data文件中的:train-left-up.csvtext = pd.read_csv('/Users/chenandong/D

2020-08-23 23:53:53 198

原创 动手学数据分析-task2数据清洗及特征处理

数据分析主要是包括:数据清洗数据的特征处理数据重构数据可视化开始之前,导入numpy、pandas包和数据#加载所需的库import numpy as npimport pandas as pd#加载数据train.csvtrain_data = pd.read_csv('../titanic/train.csv')2 数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的

2020-08-22 01:57:52 278

原创 关于torch.index_select()和torch.gather()函数的使用和区别

前言:因为和人大合作一个项目,人大小哥哥给我原来的代码做了个简化,因此想记录一下,关于torch.gather()这个函数,感觉突然通了应用场景主要是在input:(batch_size,seq_len,embedding_dim)作为输入,进入gru以后返回也是(batch_size,seq_len,embedding_dim),但是由于有padding_id,只想拿到第item_list_len返回的那个隐藏层。代码def forward(self, interaction):

2020-08-19 23:06:04 1216

原创 动手学数据分析——Task01_数据加载

前言这是一门诞生于datawhale的课程,学习它的时候搭配datawhale所配备其他资源会更好,项目地址:https://github.com/datawhalechina/hands-on-data-analysis数据集下载:https://www.kaggle.com/c/titanic/overviewimport numpy as npimport pandas as pdimport osos.getcwd()'C:\\Users\\lyj\\Desktop\\pyproj

2020-08-16 17:55:34 613

原创 特征工程(科大讯飞阿泽大佬share)

时序预测任务简介2.特征工程常见操作(数据清洗,特征构造,特征筛选)数据清洗:提高数据质量,降低算法用错误数据建模的风险特征变换:模型无法处理或者不适合处理a) 定性变量编码:Label Encoder;onehot encoder;distribution Encoderb)标准化和归一化(对于lr模型来说,但是xgb就不需要):z分数标准化(标准正态分布),min-max归一化缺失值处理:减少不确定性和不可靠输出a)不处理:少量样本缺失b)删除:大量样本缺失c)补全:(同类)均值/

2020-08-11 00:00:20 430

原创 关于xgboost的一些整理

XGBOOST的三大板块XGBoost本身的核心是基于梯度提升树实现的集成算法,整体来说可以有三个核心部分:集成算法本身,用于集成的弱评估器,以及应用中的其他过程。三个部分中,前两个部分包含了XGBoost的核心原理以及数学过程,最后的部分主要是在XGBoost应用中占有一席之地。我们的课程会主要集中在前两部分,最后一部分内容将会在应用中少量给大家提及。接下来,我们就针对这三个部分,来进行一一的讲解from xgboost import XGBRegressor as XGBRfrom skl

2020-08-10 20:10:30 8412 6

原创 Task06使用Bert进行文本分类

前几天和好久没见的朋友出去玩了几天,发现打卡学习跟不上了,Bert一直没太理解,感觉只会单纯掉包,打算mark一下,这几天把task05和task06继续重新完善一下。看到了一个大佬的github感觉可以参考一下。先mark一下pytorch版本的code,后续自己再重新把知识点捋完以后用tf2重写一下,加深理解。`import pandas as pdimport reimport numpy as npclass GetInit:def init(self, data_root):prin

2020-08-05 01:56:55 289

原创 Task05 word2vec,textrnn,textcnn

使用gensim训练word2vec本DEMO只使用部分数据,使用全部数据预训练的词向量地址:链接: https://pan.baidu.com/s/1ewlck3zwXVQuAzraZ26Euw 提取码: qbprimport loggingimport randomimport numpy as npimport torchlogging.basicConfig(level=logging.INFO, format='%(asctime)-15s %(levelname)s: %(me

2020-08-03 08:48:20 166

原创 小白如何使用DSW玩转天池NLP算法大赛

如何使用DSW玩转天池算法大赛一、创建并打开DSW实验室前往天池实验室即可创建并进入你的实验室。在执行这一步之前需要确保已经登录了阿里云和天池账号。进入之后点击我的实验室,点击左侧新建选择PAI-DSW(免费5小时GPU哦~),进入之后等待几秒后我们会看到如下页面:如上图所示,左侧是DSW实验室的⽂件区,在这⾥你可以看到在你的实验室⾥的所有⽂件夹和⽂件。双击⽂件夹即可进入这个⽂件夹。中间是⼯作区,所有被打开的⽂件都会在⼯作区显示出来。右侧是计算资源区域,在这⾥你可以看到你当前使⽤的资源类型。点击右边计算

2020-07-29 04:00:00 4793 5

原创 基于深度学习的文本分类1-FastText

基于深度学习的文本分类1-FastText续基于机器学习的文本分类(上次使用了CountVector+RidgeClassifer和Tfidf+RidgeClassfier)# tfidf+xgbimport numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.feature_extraction.text import TfidfVectorizerfro

2020-07-28 00:16:14 1918

原创 nlp文本分类Task3--基于机器学习的文本分类

nlp文本分类Task3–基于机器学习的文本分类学习目标1.学会TF-IDF的原理和使用2.使用sklearn的机器学习模型完成文本分类文本表示方法 Part1在机器学习算法的训练过程中,假设给定NNN个样本,每个样本有MMM个特征,这样组成了N×MN×MN×M的样本矩阵,然后完成算法的训练和预测。同样的在计算机视觉中可以将图片的像素看作特征,每张图片看作hight×width×3的特征图,一个三维的矩阵来进入计算机进行计算。但是在自然语言领域,上述方法却不可行:文本是不定长度的。文本表示成计

2020-07-26 02:33:59 310

原创 天池零基础入门NLP之新闻文本分类task2--数据分析

nlp文本分类Task2–数据分析1.对赛题数据进行了读取2.对新闻长度,label分布进行了可视化3.分析了赛题每篇新闻平均句子长度,每类新闻中出现次次数最多的字符4.分析了每类新闻中的关键词import numpy as npimport matplotlib.pyplot as pltimport pandas as pd%matplotlib inlinedata_df = pd.read_csv('data/train_set.csv',sep='\t')data_df.h

2020-07-22 21:30:53 849

原创 天池零基础入门NLP之新闻文本分类--赛题理解

天池零基础入门NLP之新闻文本分类赛题理解赛题名称:零基础入门NLP之新闻文本分类赛题目标:通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触NLP的预处理、模型构建和模型训练等知识点。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题。学习目标理解赛题背景与赛题数据完成赛题报名和数据下载,理解赛题的解题思路赛题数据赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分

2020-07-21 22:36:40 817

原创 编码的良好习惯

在写函数前首先写注释(/**然后打回车,方法的作用,第一个参数。。。返回值类型):/** * 方法的作用 * @param agrs1参数1 * @param args2参数2 * @return返回值类型 */ public String method(String agrs1,String args2){ retur...

2018-03-11 16:54:23 168

原创 Hadoop入门学习笔记_day01(大数据的相关概念 )

一、大数据的相关概念:(一)大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到获取、管理、处理、并整理成为帮助企业经营决策更积极的资讯。随着技术的不断发展,符合大数据标准的数据集容量也会增长不同行业使用的软件和数据集可能差别较大大数据在今天不同行业的范围可以从十几TB到几PB(二)大数据的四个特点–4Vs大量:数据量大,从TB级别跃升到P...

2018-03-11 16:51:29 461

原创 关于JavaScript的入门

一、js简介1、js是什么2、js作用3、组成4、引入方式 外联式:src引入二、基本语法1、变量2、原始数据类型undefined类型:当声明的对象未初始化时,该变量类型的默认值是undefined3、引入数据类型4、运算符5、逻辑语句三、js内建对象(Number,Boolean,String,Array,Date,Math,RegExp)一些较...

2018-03-04 19:20:27 198

原创 ajax入门 json格式(①异步校验用户名是否存在 ②站内搜索)

Ajax一 、DescriptionAJAX:Asynchronous(异步的) Javascript And XML      1.什么是同步,什么是异步 同步现象:客户端发送请求到服务器,当服务器端返回响应前,客户端一直处于等待卡死状态。当服务器端返回响应后,页面会被刷新。用户体验不好。 异步现象:客户端发送请求到...

2018-02-25 23:48:51 362

原创 书城后台管理系统(添加;批量删除;回显修改;多条件查询;分页)

书本信息的增删改查案例书城的全部书本查询 基本思路即为findAllBook(),很简单 主要代码如下: dao:public List<Book> getAllBook() throws SQLException { QueryRunner qr = new QueryRunner(DBCPUtil.getDataSource()); ...

2018-02-22 06:31:42 3221 4

原创 DBUtils以及相关案例 ThreadLocal概述 转账业务案例

一、DBUtils介绍 apache可以仔细看下这篇博文:https://www.cnblogs.com/xdp-gacl/p/4007225.html什么是dbutils,它的作用DBUtils是java编程中的数据库操作实用工具,小巧简单实用。 DBUtils封装了对JDBC的操作,简化了JDBC操作。可以少写代码。 1.对于数据表的读操作,他可以把结果转换成List,A...

2018-02-11 21:34:48 305

原创 数据库连接池 优化性能 DBCPUtils C3P0Utils的使用

数据库连接池数据连接池概述: 数据库连接池负责分配、管理和释放数据库连接,它允许应用程序重复使用一个现有的数据库连接,而不是再重新建立一个; 释放空闲时间超过最大空闲时间的数据库连接来避免因为没有释放数据库连接而引起的数据库连接遗漏。这项技术能明显提高对数据库操作的性能。数据库连接池原理:应用程序直接获取链接的缺点: 每个用户请求时都向数据库获得连接,而数据库创建连接时消耗的...

2018-02-09 23:53:17 581

原创 MySql事务(JDBC手动控制事务 事务的特性 事务的隔离级别)

MySql事务事务的概述:事务指逻辑上的一组操作,组成这组操作的各个单元,要么全部成功,要么全部不成功。 事务案例: A–B转账,有以下两条sql语句: update count set money=money+100 where name=’aaa’; update count set money=money-100 where name=’bbb’; 其中一条sql语句失...

2018-02-08 22:55:28 191

原创 JAVAWEB开发模式(MVC 分层思想)

MVC开发模式(JSP+Servlet+JavaBean)和分层思想一、JavaWeb开发模式: C/S:客户端/服务器(胖客户端) B/S:浏览器/服务器(瘦客户端)二、MVC开发模式: M:Model模型: JavaBean|四种作用域 V:view 视图 C:Controller 控制器 Servlet 二、分层思想: 只在Servlet中处理业务操作,会导致程序

2018-02-07 12:48:11 3521

原创 JSP--JSTL标签

JSTL概述使用JSTL实现JSP页面中逻辑处理。如判断、循环等。1.使用JSTL:1)需要导入第三方包 jstl库 2)加入taglib指令 2.核心标签库2.1:通用标签>set、out、remove 核心标签库: 设置变量:set var="num" value="${10+5}" scope="request">set>

2018-02-07 00:11:20 108

原创 JSP--EL表达式

EL表达式1、EL概述和基本语法要简化jsp中java代码开发。 它不是一种开发语言,是jsp中获取数据的一种规范 <% Student stu = (Student) request.getAttribute("s"); out.print(stu.getName()); %> ${s.name}

2018-02-06 23:09:32 140

原创 通过案例比较四大域对象的作用域

pageContext的作用域只在当前页面: 重点: pageContext可以操作其他三大域对象pageContext.setAttribute("p","request",PageContext.REQUEST_SCOPE);等同于req.setAttribute("p","request"); 其他session application 类似pageContext.jsp

2018-02-06 16:00:48 580

转载 JavaWeb中绝对路径和相对路径

以下是参考别人的博客做出的自我总结: 详情可参考https://www.cnblogs.com/jasonHome/p/5551358.html1.绝对路径的问题   1)开发时建议编写”绝对路径”:写绝对路径肯定没问题,但是写相对路径可能会出问题   2)编写绝对路径可以避免上述问题:  ① 在javaWEB中什么叫“绝对路径”:相对于当前 web 应用的根路径(context...

2018-02-06 10:58:49 894

原创 JSP--JSP简介及原理;3个指令;6个动作;9个对象

一、JSP概述jsp其实就是servlet。二、JSP原理三、JSP最佳实践以及request和session的区别案例:实现一个登录界面,如果用户名以及密码正确跳到success.jsp,否则带回在login.jsp显示用户名或密码错误。jsp的最佳实践:jsp:展示用户数据 servlet:重点编写java逻辑(接收表单数据、处理业务逻辑、分发转向)

2018-02-05 22:19:52 288

原创 访问一个servlet却直接下载文件

问题: resp.setContentType(“test/html”); —根本就不知道你返回的流是什么类型,自然就变成了下载。解答: resp.setContentType(“text/html”); —返回的流是可以被解析的html

2018-02-04 15:17:49 4664 7

原创 cookie和session详解

Session(Session是以用户为单位的)会话概述     session,中文经常翻译为会话,比如打电话时从拿起电话拨号到挂断电话这中间的一系列过程可以称之为一个session。会话一词用的就是其本义,是指从一个浏览器窗口打开到关闭这个期间。      Session是服务器端技术,利用这个技术,服务器在运行时可以为每一个用户的浏览器创建一个其独享的HttpSession对象

2018-02-02 22:10:37 187

原创 HttpServletRequest和HttpServletReponse部分方法汇总

HttpServletRequest请求行:           getRequestURL();//返回客户端发出请求时的完整URL           getRequestURI();//返回请求行中的资源名部分           getContextPath();//当前应用的虚拟目录请求消息头:

2018-02-02 15:35:59 507

原创 关于ServletContext详解

Servlet的生命周期:实例化 =》先初始化自己继承的类 初始化=》 init() (第一次访问的时候创建) 运行=》 dopost() doget() service() (每次有人访问都会执行) 销毁=》 destory()出生:(实例化–>初始化)第一次访问Servlet就出生(默认情况下) 活着:(服务)应用活

2018-02-01 21:46:15 206

原创 关于递归的一些练习

###23.01_File类递归练习(统计该文件夹大小)* 需求:1,从键盘接收一个文件夹路径,统计该文件夹大小* /** * 从键盘接收一个文件夹路径 * 1.创建键盘录入对象 * 2.定义一个无限循环(可能录错) * 3.将键盘录入的结果存储并封装成File对象 * 4.对File对象判断 * 5.将文件夹路径对象返回  * 统计该文件夹大小 * 1

2018-01-30 00:22:01 214

原创 路径中“/" "\" "\\"的区别

总结为一下几点:导言:Unix使用斜杆/ 作为路径分隔符,而web应用最新使用在Unix系统上面,所以目前所有的网络地址都采用 斜杆/ 作为分隔符。Windows由于使用 斜杆/ 作为DOS命令提示符的参数标志了,为了不混淆,所以采用 反斜杠\ 作为路径分隔符。所以目前windows系统上的文件浏览器都是用 反斜杠\ 作为路径分隔符。随着发展,DOS系统已经被淘汰了,命令提示符

2018-01-29 17:48:48 7169 1

原创 面向过程的语言

1.想好其方法的思路2.方法的返回值类型3.方法的参数列表

2018-01-28 17:13:06 5060

011XGBoost.zip

菜菜的sklearn课堂的第11章,xgboost的pdf加code,非常详细,很好。对于小白学习非常有帮助,可以配合视频一起使用,加油

2020-08-08

Linux操作系统实用教程课件

Linux操作系统实用教程课件,有利用更好深入理解Linux操作系统。

2018-02-04

阿里巴巴开发文档

阿里巴巴开发文档,程序员编程语言规范。有利于形成良好地代码规范!

2018-01-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除