自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 资源 (1)
  • 收藏
  • 关注

原创 【开发杂记】如何用pyintaller打包出体积较小的exe文件

用程序解决一些业务上的重复劳动,由于内网环境且没有开发环境,常常需要做成.exe文件到其他电脑上执行。因为本人接触python多些,就用python解决,流程总结如下。

2022-09-07 10:13:18 972 1

原创 【开发杂记】基于Python和TK的exe应用程序开发

0 前言   一开始也没想到要做这个,人力的领导嫌用Excel太烦了想把一些机械重复劳动以程序替换,所以产生了这个需求。由于是面向个人需求开发的产品,所以做成单机的,一套做下来感觉事倍功半,以后还是B/S架构做成网页好点,这里避免工作浪费在这里总结一下全过程。目录0 前言1 数据2 需求3 GUI工具TK(tkinter)4 功能实现4.1 整体框架4.11主界面4.12 主界面配件4.2 上传功能实现4.3 查询功能实现4.31 查询条件交互功能实现4.32 查询算法实现4.33 查询结果展示功能实现

2022-01-16 15:49:29 962

原创 【经验总结】“投”——如何寻找适合投递的期刊或者会议

前言  文章写好了就要投稿,对于大部分的投稿,一般是由导师替你把握。但若没有了前人经验,靠自己如何去挑选哪些期刊或者会议适合自己呢?本期的经验总结就是讨论这一点。  本系列主要总结一些工具和方法论,感兴趣可继续阅读以下文章:【经验总结】“找”——如何找相关领域的文献【经验总结】“读”——如何阅读外文文献【经验总结】“投”——如何寻找适合投递的期刊或者会议1. 国内——小木虫  这是一个功能非常多的网站,我们在这里主要使用它的社区板块。期刊会议评价  其优点在于它的社交论坛是“

2020-10-24 09:57:03 2547 1

原创 【文献阅读】2020-SIGIR-Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group

说明1.原文链接。2.本人及翻译软件的翻译水平有限,粗读即可,精读请看原文。标题1.题目:面向序列组推荐的群感知长、短期图表示学习    Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group Recommendation2.作者:  华东师范大学、微信搜索应用部门、乔治亚理工学院摘要  顺序推荐和群推荐是推荐系统中的两个重要分支。虽然我们已经对这两个分支进行了大量独立的研究,

2020-09-20 17:05:13 992

原创 【数据处理】数据集划分、打乱(shuffle)、以及keras里K-折交叉验证

前言  在进行机器学习的时候,本质上都是在训练模型,而训练模型都离不开对数据集的处理。往往在模型表现不佳或难以再提升的情况下,进行一定的处理,科学的训练会使模型再更进一步。目录前言1 数据集划分1.1 常规理解1.2 自己理解2 打乱(shuffle)2.1 numpy里的shuffle2.2 keras里的shuffle2.3 sklearn里的shuffle ★2.4 代码(2.1和2.3两种)3 keras里进行K-折交叉验证3.1 K-折交叉验证3.2 keras模型实现K折交叉验证3.3 完整

2020-06-27 16:11:16 19434 4

原创 【深度学习】卷积神经网络CNN以及池化层的理解与运用

前言目录前言1 卷积神经网络 CNN1.1 理论理解1.2 实践理解1.2.1 tensorflow 上CNN使用样例1.2.2 keras 上CNN使用样例2 池化层2.1 理论理解2.2 实践理解2.2.1 tensorflow 上池化层使用样例2.2.2 keras 上池化层使用样例3 基于Keras的分类问题实践3.1 数据集及问题描述3.2 核心代码3.3 实验结果3.4 完整代码1 卷积神经网络 CNN1.1 理论理解  CNN出现已有非常长的历史了,直接拿已有的解释性文章来进行参考,这

2020-06-24 16:47:57 1395

原创 【深度学习】 Attention机制的几种实现方法总结(基于Keras框架)

说明  在讲解了Dense+Attention以及LSTM+Attention时,还是使用了别人的代码,因此很多同学对一些地方仍有不够清晰的认识,在这里分享下自己的经验,并基于实践重新设计了实验。这是本人在Attention实践后的经验之谈,所讲不一定完全正确,欢迎讨论。目录说明1 前情提要1.1 参数设定1.2 数据集生成2 模型构建2.1 总体构建2.1.1 搭建模型2.1.2 获取注意力2.1.3 训练模型并可视化注意力3 注意力机制实现3.1 Baseline3.2 第一种Attention机制

2020-06-09 18:27:43 11366 13

原创 【文献阅读】 Fair Sequential Group Recommendations

说明1.原文链接。2.本人及翻译软件的翻译水平有限,粗读即可,精读请看原文。标题1.题目:公平的群组序列推荐 Fair Sequential Group Recommendations2.作者:摘要  推荐系统已经融入到我们的日常生活中,从音乐到健康推荐,推荐系统提升了用户的体验。与此同时,随着社交媒体的扩张,现在比以往任何时候都更容易形成群体。因此,团体推荐人变得更受欢迎。通常,我们认为组和推荐系统之间的交互是一个独立的过程;组向系统请求一些建议,系统回答,而不考虑过去的交互。更现实的情况

2020-06-09 08:19:08 483

原创 【文献阅读】 2020-WWW-Attentive Sequential Models of Latent Intent for Next Item Recommendation

说明1.原文链接。2.WWW2020其他推荐系统文章。3.本人及翻译软件的翻译水平有限,粗读即可,精读请看原文。标题1.题目:基于潜在意图的注意力序列模型给下一个项目推荐 Attentive Sequential Models of Latent Intent for Next Item Recommendation2.作者:​​​​​​摘要  用户在电子商务服务中表现出不同的意图(如发现商品、购买礼品等),这促使他们以多种方式(如单击、添加到购物车、添加到收藏夹、购买)与各种商品进行交互。

2020-06-01 11:41:00 1462 2

原创 【推荐算法】从零开始做推荐(六)——贝叶斯性化排序 (BPRMF) 的Tensorflow版

前言   之前我们已经介绍了贝叶斯个性化排序(Bayesian Personalized Ranking, BPR),并基于BPR矩阵分解进行推荐实战。同传统矩阵分解一样,BPRMF也有神经网络的版本。此方法在刘建平老师的博客上已有介绍,但其评价指标和数据集划分与本系列不同。因此,本文在其基础上进行修改,方便与本系列方法一同进行比较。目录前言核心算法损失函数求解算法实验结果完整代码  如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门:  【推荐算法】从零开始做推荐(一)——认识推荐、认识数

2020-05-31 09:40:46 1933 1

原创 【推荐算法】从零开始做推荐(五)——贝叶斯个性化排序矩阵分解 (BPRMF) 推荐实战

前言   之前我们已经陆续完成了数据集、评价指标和经典算法MF推荐的实战,接下来本章将介绍另一种应用也非常广泛的推荐技术:贝叶斯个性化排序(Bayesian Personalized Ranking, BPR)。将基于BPR矩阵分解进行推荐实战。目录前言什么是BPR?  如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门:  【推荐算法】从零开始做推荐(一)——认识推荐、认识数据  【推荐算法】从零开始做推荐(二)——推荐系统的评价指标,计算原理与实现样例  【推荐算法】从零开始做推荐(

2020-05-18 17:17:21 4495 3

原创 【推荐算法】从零开始做推荐(三)——传统矩阵分解的TopK推荐实战

前言  在前两章,我们已对本系列的数据集、评价指标做了相应的介绍,从本章开始将进行推荐实战,算法上从最经典的矩阵分解讲起。目录前言矩阵分解核心算法ML100K实现完整的矩阵分解TopK推荐构造矩阵训练测试结果分析进阶!灵魂拷问完整代码  如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门:  【推荐算法】从零开始做推荐(一)——认识推荐、认识数据  【推荐算法】从零开始做推荐(二...

2020-04-10 21:03:35 3660 13

原创 【推荐算法】从零开始做推荐(二)——TopK推荐的评价指标,计算原理与样例

前言  推荐系统挺有趣的,但对做研究的人来讲上手有很多坑。相比于图像领域数据集、代码公开透明,评价指标高度统一,推荐系统仍处在整合阶段,龙蛇混杂。  在撰写论文的时候,难点不仅在于自己的方法,还在于实现他人的算法进行对比。如果代码不公开,自己实现他人的方法一方面费时费力,另一方面还不知道有没有复现准确。  本系列打算在推荐系统公开数据集上一步步实现完整推荐,并实现多个经典的推荐算法。由于本人...

2020-03-25 20:15:27 11509 11

原创 【推荐算法】从零开始做推荐(一)——认识推荐,认识数据

前言  推荐系统挺有趣的,但对做研究的人来讲上手有很多坑。相比于图像领域数据集、评价指标等高度统一,代码公开透明,推荐系统仍处在整合阶段,龙蛇混杂。在撰写论文的时候,难点不仅在于自己的方法,还在于实现他人的算法进行对比。如果代码不公开,自己实现他人的方法一方面费时费力,另一方面还不知道有没有复现准确。  本系列打算在推荐系统公开数据集上一步步实现完整推荐,实现多个经典算法(这一章是矩阵分解)并...

2020-03-19 19:00:45 2542 2

原创 【经验总结】“读”——如何阅读外文文献

前言  已经下载好了一篇文献,通常是英文的,接下来的难点在于如何读懂它。这里假设论文内容是没有看过的,不能确定是否是真正所需要的文章。  此时你有几个选项:    1. 快速获得全文翻译——文档翻译     2. 快速获得指定区域内的翻译——知云翻译    3. 精读精翻——手动翻译1. 文档翻译适用推荐:  准确度:★★★☆☆  费时度:★★☆☆☆  是否免费:预览前4...

2020-03-09 16:56:56 687

原创 【经验总结】“找”——如何找相关领域的文献

前言  本人专业计算机科学与技术,方向是推荐系统,故总结以我方向的为例。有通用方法和非通用方法,皆可一试。  所有领域通用方法包括:    1. 谷歌学术(GIGOO)     2. 百度学术    3. sci-hub  计算机领域方法包括:    1. CCF推荐期刊、会议    2. DBLP通用方法1. 谷歌学术(GIGOO)适用推荐:  外文文献:★★★...

2020-03-08 17:27:08 6424 3

原创 【数据处理】 python 极速极简画图——折线图

说明  画图总结,同系列其他文章请浏览:【数据处理】 python 极速极简画图(黑白)——简单条形图、多维并列条形图【数据处理】 python 极速极简画图——频数(率)分布直方图【数据处理】 python 极速极简画图——二维连线、散点图代码from matplotlib import pyplotimport matplotlib.pyplot as pltfrom py...

2020-01-13 16:19:33 1073

原创 【深度学习】用Keras实现word2vec的CBOW模型

前言  尽管gensim里的word2vec已经非常好用,但用别人的模型始终难以直接解决自己的问题,于是去搜有没有直接能用的Keras版,找到了两版,分别为:版本1:keras训练word2vec代码版本2:【不可思议的Word2Vec】6. Keras版的Word2Vec  两位写的都很好,版本1代码上可以直接上手,版本2框架更清晰,但两位大佬的数据集都是基于多篇文章的,版本1是从微...

2020-01-04 17:26:29 2864 1

原创 【数据处理】 python 极速极简画图(黑白)——简单条形图、多维并列条形图

说明  一般做完实验就是画图,实验结果多采用条形图,这里整理下自己的画图模板。图是否丰富是由数据的维度来支撑的,这里按数据维度的大小画出简单条形图与多维并列条形图,注释很详细,直接上代码。  论文画图一般要求:全英,标题首字母大写,实词大写一般不为彩印,因此要以黑白填充为主简单条形图  此模板X和Y都是1维的,适用于在横坐标的数据集下,单个方法在单个问题上的表现。import n...

2019-12-25 12:16:01 2501 1

原创 【数据处理】 python 极速极简画图——频数(率)分布直方图

说明  当我们拿到数据的时候,第一时间就是想知道数据的特点,然鹅单个的数值如平均数、中位数仍不够直观,我们更想得到数据的分布,以便后续的工作,此时就可以采用频数(率)分布直方图。这里以我的一个实际问题为例,一步步讲如何得到想要的图,分为极简版、完整版和进阶版。方法  用python实现直方图画法有很多种:   1. 纯python自己编写   2. matplotlib.pyplot,调...

2019-12-13 15:05:44 30992 4

原创 【深度学习】 基于Keras的Attention机制代码实现及剖析——LSTM+Attention

说明大部分代码来源于网上,但网上的代码一下子可能难以入门或因版本原因报错,此处整理后进行详细分析。  参考的代码来源1:Attention mechanism Implementation for Keras.网上大部分代码都源于此,直接使用时注意Keras版本,若版本不对应,在merge处会报错,解决办法为:导入Multiply层并将attention_dense.py第17行的:att...

2019-12-11 11:01:56 49387 112

原创 【深度学习】 基于Keras的Attention机制代码实现及剖析——Dense+Attention

说明大部分代码来源于网上,但网上的代码一下子可能难以入门或因版本原因报错,此处整理后进行详细分析。  参考的代码来源1:Attention mechanism Implementation for Keras.网上大部分代码都源于此,直接使用时注意Keras版本,若版本不对应,在merge处会报错,解决办法为:导入Multiply层并将attention_dense.py第17行的:att...

2019-12-09 19:26:24 20955 32

原创 【数据处理】 python 极速极简画图——二维连线、散点图

python 极速极简画图——二维连线、散点图说明  在一些作业或建模中经常要画图,自己百度的时候总要看好几个才画出来,后面有非专业的人找我画图,这里自己总结一个简单又快速的,适合萌新和非专业的人使用。数据  其实就两列。代码  直接上代码,注释很详细。# -*- coding: utf-8 -*-"""Created on Fri Nov 8 11:46:41 2019...

2019-11-30 14:45:04 8421 1

原创 【文献阅读】2019-SIGKDD-Dual Sequential Prediction Models Linking Sequential Recommendation and Informatio

说明原文链接。 此处翻译不全,仅到其主要思想部分。标题题目:Dual Sequential Prediction Models Linking Sequential Recommendation and Information Dissemination 作者: Qitian Wu1, Yirui Gao1, Xiaofeng Gao1∗, Paul Weng2, Guihai C...

2019-11-30 13:47:17 951 3

原创 【数据处理】 python 常用操作整理

这是本人在数据分析中,记不住,反复查询的一些命令汇总,在此做个归纳汇总,并不定期更新。

2019-11-05 17:27:00 772 1

原创 【文献阅读】 2018-SIGKDD-STAMP:Short-Term Attention/Memory Priority Model for Session-based Recommendation

说明原文链接。 此处将Session-based Recommendation直译为会话推荐,有地方意译为短序列推荐。 此处将external memory译为外部记忆,直译话为外部存储器(外存),short-term memory译为短期记忆,直译的话为短期存储器。标题题目:STMAP:基于会话推荐的短期注意/记忆优先模型 作者: Qiao Liu University of ...

2019-10-07 15:30:44 11078 10

原创 【文献阅读】 2019-IJCAI-Sequential Recommender Systems Challenges, Progress and Prospects

说明  1.原文链接。  2.此处将Sequential Recommender Systems 翻译为序列推荐系统,具体定义参见下文的形式化定义。  3.本篇为顶会IJCAI上的文章,给出关于此会议其他推荐系统的文章参考。  4. 此处将dependencies译为相关性。标题  序列推荐系统的挑战、进展和前景  作者:ShoujinWang1,LiangHu2,YanWang1,...

2019-10-05 15:57:25 8289 3

原创 【数据处理】 python 基于Folium地理信息可视化

数据  在某些建模比赛中,经常碰见一些地理信息的数据,它们大多都是车辆在驾驶过程中随时间产生的经纬度序列,并伴随着车辆的各种参数。由于GPS信号并不是一直都很好(如过隧道或偏远地区),无论建模的问题是安全驾驶、驾驶工况或频繁路径挖掘等,都绕不过数据预处理,而地理信息可视化可以较为直观地帮助发现问题和评估效果。  本篇为可视化第二篇,关于所用的数据集见姊妹篇 python 基于Basemap地理...

2019-09-28 12:30:30 2729 3

原创 【数据处理】 python 基于Basemap地理信息可视化

数据  在某些建模比赛中,经常碰见一些地理信息的数据,它们大多都是车辆在驾驶过程中随时间产生的经纬度序列,并伴随着车辆的各种参数。由于GPS信号并不是一直都很好(如过隧道或偏远地区),无论建模的问题是安全驾驶、驾驶工况或频繁路径挖掘等,都绕不过数据预处理,而地理信息可视化可以较为直观地帮助发现问题和评估效果。  下面以一辆车地行驶数据为例,对其行驶轨迹进行可视化处理。数据和代码下载可见我的Gi...

2019-09-28 12:00:48 1894 10

原创 【机器学习】 python 多种方法实验比较 文本情感二分类

实验目的及要求实验源于“2019大数据挑战赛-预选赛”。本预选赛要求选手建立文本情感分类模型,选手用训练好的模型对测试集中的文本情感进行预测,判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测,达到或超过规定的分数线即通过预选赛。数据样本格式:其中,训练集的样本规模为6328,测试集的样本规模为2712。为保证比赛结果的真实性...

2019-09-09 15:30:58 2358 2

原创 【深度学习】 Keras 实现Minst数据集上经典网络结构(DeepDense、LeNet、AlexNet、ZFNet)分类

实验简介  本次实验一方面是熟悉Keras 序列式(Sequential)模型的使用,另一方面是复现早期的经典网络结构来学习神经网络搭建的技巧。数据集采用的是熟知的Minst手写识别,框架采用的是tensorflow、Keras,数据集和框架的导入和安装请点击这里。经典的网络结构已有大量博客进行理论分析,这里只给出代码仅供参考,关于神经网络结构的发展,推荐大家看这篇文章。DeepDense ...

2019-09-06 14:24:40 670

原创 【推荐算法】从零开始做推荐(四)——python Keras框架 利用Embedding实现矩阵分解TopK推荐

基于矩阵分解的推荐原理  矩阵分解是推荐系统里最常用的方法之一,其泛指一类算法,由最初数学中的SVD分解衍变而来,已有众多个版本,通常而言推荐系统里的矩阵分解算法指得是FunkSVD分解,可参照这里(多说一句,这位老师在NLP与推荐系统很多博客紧跟潮流,都值得一看)。关于矩阵分解算法的发展历史可以参照这里。  众多优秀博客珠玉在前,我就不详谈矩阵分解的前世今身了,下面对矩阵分解的思想做个简单地...

2019-09-04 17:57:05 3587 2

原创 【推荐系统】 Matlab 实现 基于HMM 与 personalRank 的推荐算法

写在之前  这是本人的统计学习方法作业之一,老师要求一定要用Matlab编程,本人在此之前未曾大量使用Matlab,因此某些算法可能因为不知道函数或者包而走了弯路。代码高亮查了一下,没找到Matlab的所以用了C的。部分算法参考了某些算法的python算法,如有建议或者错误欢迎指出,谢谢!数据集  所提供的movie.txt为MovieLens电影评论推荐网站上的用户打分数据,每一行的字段为...

2019-08-16 15:42:52 1773

原创 【机器学习】 Matlab 实现多种分类器(感知机、KNN、Logistic、最大熵、决策树、朴素贝叶斯)的二分类

写在之前  这是本人的统计学习方法作业之一,老师要求一定要用Matlab编程,本人在此之前未曾大量使用Matlab,因此某些算法可能因为不知道函数或者包而走了弯路。代码高亮查了一下,没找到Matlab的所以用了C的。部分算法参考了某些算法的python算法,如有建议或者错误欢迎指出,谢谢!数据集  提供的flower.txt文件为鸢尾花数据集,共分为3类花(前50个样本为一类,中间50个样本...

2019-08-16 14:39:20 4490 10

原创 【优化理论】 共轭梯度下降算法实现

实验目的实验步骤  此次实验要求采用共轭梯度下降来解决二次优化问题,在解决此问题前,首先分析下什么是共轭梯度法,共轭梯度法能解决什么问题。  我们来看一个线性方程组Ax=b,求解此方程组的过程可以看成是形如公式(1)的优化问题:arg⁡min⁡x∥Ax−b∥2…………………………………………(1)\mathop{\arg\min_{x}} \parallel Ax-b\parallel^...

2019-08-13 11:19:24 904

原创 【优化理论】 梯度下降算法及其python实现——以Logistic回归为例

写在之前  这是本人第一次编写博客,技术不是很娴熟,若造成阅读困扰十分抱歉。其次,编写博客的内容是基于研究生第一年所学课程作业而言的,部分时间已经比较久远,引用和转载上可能找不到当初借鉴的原文了,十分抱歉!编写博客的目的一方面是对自己所学有个总结和归处,另一方面在完成某些作业时受很多博客的影响,向他们学习、致敬!最后就是代码的正确性在当时是可以得到保证的,但不一定适用于所有场景,且效率上可能存在...

2019-07-02 15:55:45 1316 3

ml-100k Basic MF.rar

如果你对本系列(未写完,持续更新中)感兴趣,可接以下传送门(CSDN搜索):   【推荐算法】从零开始做推荐(一)——认识推荐、认识数据   【推荐算法】从零开始做推荐(二)——推荐系统的评价指标,计算原理与实现样例   【推荐算法】从零开始做推荐(三)——传统矩阵分解的TopK推荐

2020-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除