lechuan_dafo-CSDN博客

原创【开发杂记】如何用pyintaller打包出体积较小的exe文件

用程序解决一些业务上的重复劳动，由于内网环境且没有开发环境，常常需要做成.exe文件到其他电脑上执行。因为本人接触python多些，就用python解决，流程总结如下。

2022-09-07 10:13:18 972 1

原创【开发杂记】基于Python和TK的exe应用程序开发

0 前言一开始也没想到要做这个，人力的领导嫌用Excel太烦了想把一些机械重复劳动以程序替换，所以产生了这个需求。由于是面向个人需求开发的产品，所以做成单机的，一套做下来感觉事倍功半，以后还是B/S架构做成网页好点，这里避免工作浪费在这里总结一下全过程。目录0 前言1 数据2 需求3 GUI工具TK（tkinter）4 功能实现4.1 整体框架4.11主界面4.12 主界面配件4.2 上传功能实现4.3 查询功能实现4.31 查询条件交互功能实现4.32 查询算法实现4.33 查询结果展示功能实现

2022-01-16 15:49:29 962

原创【经验总结】“投”——如何寻找适合投递的期刊或者会议

前言文章写好了就要投稿，对于大部分的投稿，一般是由导师替你把握。但若没有了前人经验，靠自己如何去挑选哪些期刊或者会议适合自己呢？本期的经验总结就是讨论这一点。本系列主要总结一些工具和方法论，感兴趣可继续阅读以下文章：【经验总结】“找”——如何找相关领域的文献【经验总结】“读”——如何阅读外文文献【经验总结】“投”——如何寻找适合投递的期刊或者会议1. 国内——小木虫这是一个功能非常多的网站，我们在这里主要使用它的社区板块。期刊会议评价其优点在于它的社交论坛是“

2020-10-24 09:57:03 2547 1

原创【文献阅读】2020-SIGIR-Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group

说明1.原文链接。2.本人及翻译软件的翻译水平有限，粗读即可，精读请看原文。标题1.题目：面向序列组推荐的群感知长、短期图表示学习 Group-Aware Long- and Short-Term Graph Representation Learning for Sequential Group Recommendation2.作者：华东师范大学、微信搜索应用部门、乔治亚理工学院摘要顺序推荐和群推荐是推荐系统中的两个重要分支。虽然我们已经对这两个分支进行了大量独立的研究，

2020-09-20 17:05:13 992

原创【数据处理】数据集划分、打乱(shuffle)、以及keras里K-折交叉验证

前言在进行机器学习的时候，本质上都是在训练模型，而训练模型都离不开对数据集的处理。往往在模型表现不佳或难以再提升的情况下，进行一定的处理，科学的训练会使模型再更进一步。目录前言1 数据集划分1.1 常规理解1.2 自己理解2 打乱(shuffle)2.1 numpy里的shuffle2.2 keras里的shuffle2.3 sklearn里的shuffle ★2.4 代码(2.1和2.3两种)3 keras里进行K-折交叉验证3.1 K-折交叉验证3.2 keras模型实现K折交叉验证3.3 完整

2020-06-27 16:11:16 19434 4

原创【深度学习】卷积神经网络CNN以及池化层的理解与运用

前言目录前言1 卷积神经网络 CNN1.1 理论理解1.2 实践理解1.2.1 tensorflow 上CNN使用样例1.2.2 keras 上CNN使用样例2 池化层2.1 理论理解2.2 实践理解2.2.1 tensorflow 上池化层使用样例2.2.2 keras 上池化层使用样例3 基于Keras的分类问题实践3.1 数据集及问题描述3.2 核心代码3.3 实验结果3.4 完整代码1 卷积神经网络 CNN1.1 理论理解 CNN出现已有非常长的历史了，直接拿已有的解释性文章来进行参考，这

2020-06-24 16:47:57 1395

原创【深度学习】 Attention机制的几种实现方法总结(基于Keras框架)

说明在讲解了Dense+Attention以及LSTM+Attention时，还是使用了别人的代码，因此很多同学对一些地方仍有不够清晰的认识，在这里分享下自己的经验，并基于实践重新设计了实验。这是本人在Attention实践后的经验之谈，所讲不一定完全正确，欢迎讨论。目录说明1 前情提要1.1 参数设定1.2 数据集生成2 模型构建2.1 总体构建2.1.1 搭建模型2.1.2 获取注意力2.1.3 训练模型并可视化注意力3 注意力机制实现3.1 Baseline3.2 第一种Attention机制

2020-06-09 18:27:43 11366 13

原创【文献阅读】 Fair Sequential Group Recommendations

说明1.原文链接。2.本人及翻译软件的翻译水平有限，粗读即可，精读请看原文。标题1.题目：公平的群组序列推荐 Fair Sequential Group Recommendations2.作者：摘要推荐系统已经融入到我们的日常生活中，从音乐到健康推荐，推荐系统提升了用户的体验。与此同时，随着社交媒体的扩张，现在比以往任何时候都更容易形成群体。因此，团体推荐人变得更受欢迎。通常，我们认为组和推荐系统之间的交互是一个独立的过程；组向系统请求一些建议，系统回答，而不考虑过去的交互。更现实的情况

2020-06-09 08:19:08 483

原创【文献阅读】 2020-WWW-Attentive Sequential Models of Latent Intent for Next Item Recommendation

说明1.原文链接。2.WWW2020其他推荐系统文章。3.本人及翻译软件的翻译水平有限，粗读即可，精读请看原文。标题1.题目：基于潜在意图的注意力序列模型给下一个项目推荐 Attentive Sequential Models of Latent Intent for Next Item Recommendation2.作者：摘要用户在电子商务服务中表现出不同的意图（如发现商品、购买礼品等），这促使他们以多种方式（如单击、添加到购物车、添加到收藏夹、购买）与各种商品进行交互。

2020-06-01 11:41:00 1462 2

原创【推荐算法】从零开始做推荐（六）——贝叶斯性化排序 (BPRMF) 的Tensorflow版

前言之前我们已经介绍了贝叶斯个性化排序（Bayesian Personalized Ranking, BPR），并基于BPR矩阵分解进行推荐实战。同传统矩阵分解一样，BPRMF也有神经网络的版本。此方法在刘建平老师的博客上已有介绍，但其评价指标和数据集划分与本系列不同。因此，本文在其基础上进行修改，方便与本系列方法一同进行比较。目录前言核心算法损失函数求解算法实验结果完整代码如果你对本系列(未写完，持续更新中)感兴趣，可接以下传送门：【推荐算法】从零开始做推荐（一）——认识推荐、认识数

2020-05-31 09:40:46 1933 1

原创【推荐算法】从零开始做推荐（五）——贝叶斯个性化排序矩阵分解 (BPRMF) 推荐实战

前言之前我们已经陆续完成了数据集、评价指标和经典算法MF推荐的实战，接下来本章将介绍另一种应用也非常广泛的推荐技术：贝叶斯个性化排序（Bayesian Personalized Ranking, BPR）。将基于BPR矩阵分解进行推荐实战。目录前言什么是BPR？如果你对本系列(未写完，持续更新中)感兴趣，可接以下传送门：【推荐算法】从零开始做推荐（一）——认识推荐、认识数据【推荐算法】从零开始做推荐（二）——推荐系统的评价指标，计算原理与实现样例【推荐算法】从零开始做推荐（

2020-05-18 17:17:21 4495 3

原创【推荐算法】从零开始做推荐（三）——传统矩阵分解的TopK推荐实战

前言在前两章，我们已对本系列的数据集、评价指标做了相应的介绍，从本章开始将进行推荐实战，算法上从最经典的矩阵分解讲起。目录前言矩阵分解核心算法ML100K实现完整的矩阵分解TopK推荐构造矩阵训练测试结果分析进阶！灵魂拷问完整代码如果你对本系列(未写完，持续更新中)感兴趣，可接以下传送门：【推荐算法】从零开始做推荐（一）——认识推荐、认识数据【推荐算法】从零开始做推荐（二...

2020-04-10 21:03:35 3660 13

原创【推荐算法】从零开始做推荐（二）——TopK推荐的评价指标，计算原理与样例

前言推荐系统挺有趣的，但对做研究的人来讲上手有很多坑。相比于图像领域数据集、代码公开透明，评价指标高度统一，推荐系统仍处在整合阶段，龙蛇混杂。在撰写论文的时候，难点不仅在于自己的方法，还在于实现他人的算法进行对比。如果代码不公开，自己实现他人的方法一方面费时费力，另一方面还不知道有没有复现准确。本系列打算在推荐系统公开数据集上一步步实现完整推荐，并实现多个经典的推荐算法。由于本人...

2020-03-25 20:15:27 11509 11

原创【推荐算法】从零开始做推荐（一）——认识推荐，认识数据

前言推荐系统挺有趣的，但对做研究的人来讲上手有很多坑。相比于图像领域数据集、评价指标等高度统一，代码公开透明，推荐系统仍处在整合阶段，龙蛇混杂。在撰写论文的时候，难点不仅在于自己的方法，还在于实现他人的算法进行对比。如果代码不公开，自己实现他人的方法一方面费时费力，另一方面还不知道有没有复现准确。本系列打算在推荐系统公开数据集上一步步实现完整推荐，实现多个经典算法（这一章是矩阵分解）并...

2020-03-19 19:00:45 2542 2

原创【经验总结】“读”——如何阅读外文文献

前言已经下载好了一篇文献，通常是英文的，接下来的难点在于如何读懂它。这里假设论文内容是没有看过的，不能确定是否是真正所需要的文章。此时你有几个选项： 1. 快速获得全文翻译——文档翻译 2. 快速获得指定区域内的翻译——知云翻译 3. 精读精翻——手动翻译1. 文档翻译适用推荐：准确度：★★★☆☆ 费时度：★★☆☆☆ 是否免费：预览前4...

2020-03-09 16:56:56 687

原创【经验总结】“找”——如何找相关领域的文献

前言本人专业计算机科学与技术，方向是推荐系统，故总结以我方向的为例。有通用方法和非通用方法，皆可一试。所有领域通用方法包括： 1. 谷歌学术(GIGOO) 2. 百度学术 3. sci-hub 计算机领域方法包括： 1. CCF推荐期刊、会议 2. DBLP通用方法1. 谷歌学术(GIGOO)适用推荐：外文文献：★★★...

2020-03-08 17:27:08 6424 3

原创【数据处理】 python 极速极简画图——折线图

说明画图总结，同系列其他文章请浏览：【数据处理】 python 极速极简画图(黑白)——简单条形图、多维并列条形图【数据处理】 python 极速极简画图——频数(率)分布直方图【数据处理】 python 极速极简画图——二维连线、散点图代码from matplotlib import pyplotimport matplotlib.pyplot as pltfrom py...

2020-01-13 16:19:33 1073

原创【深度学习】用Keras实现word2vec的CBOW模型

前言尽管gensim里的word2vec已经非常好用，但用别人的模型始终难以直接解决自己的问题，于是去搜有没有直接能用的Keras版，找到了两版，分别为：版本1：keras训练word2vec代码版本2：【不可思议的Word2Vec】6. Keras版的Word2Vec 两位写的都很好，版本1代码上可以直接上手，版本2框架更清晰，但两位大佬的数据集都是基于多篇文章的，版本1是从微...

2020-01-04 17:26:29 2864 1

原创【数据处理】 python 极速极简画图(黑白)——简单条形图、多维并列条形图

说明一般做完实验就是画图，实验结果多采用条形图，这里整理下自己的画图模板。图是否丰富是由数据的维度来支撑的，这里按数据维度的大小画出简单条形图与多维并列条形图，注释很详细，直接上代码。论文画图一般要求：全英，标题首字母大写，实词大写一般不为彩印，因此要以黑白填充为主简单条形图此模板X和Y都是1维的，适用于在横坐标的数据集下，单个方法在单个问题上的表现。import n...

2019-12-25 12:16:01 2501 1

原创【数据处理】 python 极速极简画图——频数(率)分布直方图

说明当我们拿到数据的时候，第一时间就是想知道数据的特点，然鹅单个的数值如平均数、中位数仍不够直观，我们更想得到数据的分布，以便后续的工作，此时就可以采用频数(率)分布直方图。这里以我的一个实际问题为例，一步步讲如何得到想要的图，分为极简版、完整版和进阶版。方法用python实现直方图画法有很多种： 1. 纯python自己编写 2. matplotlib.pyplot，调...

2019-12-13 15:05:44 30992 4

原创【深度学习】基于Keras的Attention机制代码实现及剖析——LSTM+Attention

说明大部分代码来源于网上，但网上的代码一下子可能难以入门或因版本原因报错，此处整理后进行详细分析。参考的代码来源1：Attention mechanism Implementation for Keras.网上大部分代码都源于此，直接使用时注意Keras版本，若版本不对应，在merge处会报错，解决办法为：导入Multiply层并将attention_dense.py第17行的：att...

2019-12-11 11:01:56 49387 112

原创【深度学习】基于Keras的Attention机制代码实现及剖析——Dense+Attention

说明大部分代码来源于网上，但网上的代码一下子可能难以入门或因版本原因报错，此处整理后进行详细分析。参考的代码来源1：Attention mechanism Implementation for Keras.网上大部分代码都源于此，直接使用时注意Keras版本，若版本不对应，在merge处会报错，解决办法为：导入Multiply层并将attention_dense.py第17行的：att...

2019-12-09 19:26:24 20955 32

原创【数据处理】 python 极速极简画图——二维连线、散点图

python 极速极简画图——二维连线、散点图说明在一些作业或建模中经常要画图，自己百度的时候总要看好几个才画出来，后面有非专业的人找我画图，这里自己总结一个简单又快速的，适合萌新和非专业的人使用。数据其实就两列。代码直接上代码，注释很详细。# -*- coding: utf-8 -*-"""Created on Fri Nov 8 11:46:41 2019...

2019-11-30 14:45:04 8421 1

原创【文献阅读】2019-SIGKDD-Dual Sequential Prediction Models Linking Sequential Recommendation and Informatio

说明原文链接。此处翻译不全，仅到其主要思想部分。标题题目：Dual Sequential Prediction Models Linking Sequential Recommendation and Information Dissemination 作者： Qitian Wu1, Yirui Gao1, Xiaofeng Gao1∗, Paul Weng2, Guihai C...

2019-11-30 13:47:17 951 3

原创【数据处理】 python 常用操作整理

这是本人在数据分析中，记不住，反复查询的一些命令汇总，在此做个归纳汇总，并不定期更新。

2019-11-05 17:27:00 772 1

原创【文献阅读】 2018-SIGKDD-STAMP:Short-Term Attention/Memory Priority Model for Session-based Recommendation

说明原文链接。此处将Session-based Recommendation直译为会话推荐，有地方意译为短序列推荐。此处将external memory译为外部记忆，直译话为外部存储器(外存)，short-term memory译为短期记忆，直译的话为短期存储器。标题题目：STMAP:基于会话推荐的短期注意/记忆优先模型作者： Qiao Liu University of ...

2019-10-07 15:30:44 11078 10

原创【文献阅读】 2019-IJCAI-Sequential Recommender Systems Challenges, Progress and Prospects

说明 1.原文链接。 2.此处将Sequential Recommender Systems 翻译为序列推荐系统，具体定义参见下文的形式化定义。 3.本篇为顶会IJCAI上的文章，给出关于此会议其他推荐系统的文章参考。 4. 此处将dependencies译为相关性。标题序列推荐系统的挑战、进展和前景作者：ShoujinWang1,LiangHu2,YanWang1,...

2019-10-05 15:57:25 8289 3

原创【数据处理】 python 基于Folium地理信息可视化

数据在某些建模比赛中，经常碰见一些地理信息的数据，它们大多都是车辆在驾驶过程中随时间产生的经纬度序列，并伴随着车辆的各种参数。由于GPS信号并不是一直都很好（如过隧道或偏远地区），无论建模的问题是安全驾驶、驾驶工况或频繁路径挖掘等，都绕不过数据预处理，而地理信息可视化可以较为直观地帮助发现问题和评估效果。本篇为可视化第二篇，关于所用的数据集见姊妹篇 python 基于Basemap地理...

2019-09-28 12:30:30 2729 3

原创【数据处理】 python 基于Basemap地理信息可视化

数据在某些建模比赛中，经常碰见一些地理信息的数据，它们大多都是车辆在驾驶过程中随时间产生的经纬度序列，并伴随着车辆的各种参数。由于GPS信号并不是一直都很好（如过隧道或偏远地区），无论建模的问题是安全驾驶、驾驶工况或频繁路径挖掘等，都绕不过数据预处理，而地理信息可视化可以较为直观地帮助发现问题和评估效果。下面以一辆车地行驶数据为例，对其行驶轨迹进行可视化处理。数据和代码下载可见我的Gi...

2019-09-28 12:00:48 1894 10

原创【机器学习】 python 多种方法实验比较文本情感二分类

实验目的及要求实验源于“2019大数据挑战赛-预选赛”。本预选赛要求选手建立文本情感分类模型，选手用训练好的模型对测试集中的文本情感进行预测，判断其情感为「Negative」或者「Positive」。所提交的结果按照指定的评价指标使用在线评测数据进行评测，达到或超过规定的分数线即通过预选赛。数据样本格式：其中，训练集的样本规模为6328，测试集的样本规模为2712。为保证比赛结果的真实性...

2019-09-09 15:30:58 2358 2

原创【深度学习】 Keras 实现Minst数据集上经典网络结构(DeepDense、LeNet、AlexNet、ZFNet)分类

实验简介本次实验一方面是熟悉Keras 序列式(Sequential)模型的使用，另一方面是复现早期的经典网络结构来学习神经网络搭建的技巧。数据集采用的是熟知的Minst手写识别，框架采用的是tensorflow、Keras，数据集和框架的导入和安装请点击这里。经典的网络结构已有大量博客进行理论分析，这里只给出代码仅供参考，关于神经网络结构的发展，推荐大家看这篇文章。DeepDense ...

2019-09-06 14:24:40 670

原创【推荐算法】从零开始做推荐（四）——python Keras框架利用Embedding实现矩阵分解TopK推荐

基于矩阵分解的推荐原理矩阵分解是推荐系统里最常用的方法之一，其泛指一类算法，由最初数学中的SVD分解衍变而来，已有众多个版本，通常而言推荐系统里的矩阵分解算法指得是FunkSVD分解，可参照这里（多说一句，这位老师在NLP与推荐系统很多博客紧跟潮流，都值得一看）。关于矩阵分解算法的发展历史可以参照这里。众多优秀博客珠玉在前，我就不详谈矩阵分解的前世今身了，下面对矩阵分解的思想做个简单地...

2019-09-04 17:57:05 3587 2

原创【推荐系统】 Matlab 实现基于HMM 与 personalRank 的推荐算法

写在之前这是本人的统计学习方法作业之一，老师要求一定要用Matlab编程，本人在此之前未曾大量使用Matlab，因此某些算法可能因为不知道函数或者包而走了弯路。代码高亮查了一下，没找到Matlab的所以用了C的。部分算法参考了某些算法的python算法，如有建议或者错误欢迎指出，谢谢！数据集所提供的movie.txt为MovieLens电影评论推荐网站上的用户打分数据，每一行的字段为...

2019-08-16 15:42:52 1773

原创【机器学习】 Matlab 实现多种分类器(感知机、KNN、Logistic、最大熵、决策树、朴素贝叶斯)的二分类

写在之前这是本人的统计学习方法作业之一，老师要求一定要用Matlab编程，本人在此之前未曾大量使用Matlab，因此某些算法可能因为不知道函数或者包而走了弯路。代码高亮查了一下，没找到Matlab的所以用了C的。部分算法参考了某些算法的python算法，如有建议或者错误欢迎指出，谢谢！数据集提供的flower.txt文件为鸢尾花数据集，共分为3类花（前50个样本为一类，中间50个样本...

2019-08-16 14:39:20 4490 10

原创【优化理论】共轭梯度下降算法实现

实验目的实验步骤此次实验要求采用共轭梯度下降来解决二次优化问题，在解决此问题前，首先分析下什么是共轭梯度法，共轭梯度法能解决什么问题。我们来看一个线性方程组Ax=b，求解此方程组的过程可以看成是形如公式(1)的优化问题：arg⁡min⁡x∥Ax−b∥2…………………………………………(1)\mathop{\arg\min_{x}} \parallel Ax-b\parallel^...

2019-08-13 11:19:24 904

原创【优化理论】梯度下降算法及其python实现——以Logistic回归为例

写在之前这是本人第一次编写博客，技术不是很娴熟，若造成阅读困扰十分抱歉。其次，编写博客的内容是基于研究生第一年所学课程作业而言的，部分时间已经比较久远，引用和转载上可能找不到当初借鉴的原文了，十分抱歉！编写博客的目的一方面是对自己所学有个总结和归处，另一方面在完成某些作业时受很多博客的影响，向他们学习、致敬！最后就是代码的正确性在当时是可以得到保证的，但不一定适用于所有场景，且效率上可能存在...

2019-07-02 15:55:45 1316 3

乐川大佛的博客