自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ZSCDumin的博客

分享也是一种快乐

  • 博客(60)
  • 资源 (7)
  • 收藏
  • 关注

原创 Uplift 经典模型介绍

Uplift 经典模型介绍1. 元学习相关模型1.1 双模型(Two Model, T-Learner)1.2 单模型(Single Model, S-Learner)1.3 X-Learner模型2. Uplift树模型2.1 CTS算法2.2 因果森林2.3 广义随机森林(GRF)2.4 正交随机森林(ORF)3. 剪枝方法3.1 重采样(resampling)3.2 单调约束3.3 最小增益...

2022-06-19 20:00:27 2776

原创 Double Machine Learning(DML) 原理及其应用

Double Machine Learning(DML) 原理及其应用1. 为什么需要DML?2. DML原理2.1 符号定义2.2 DML训练过程2.3 为什么残差正交化可得到无偏差因果效应?2.4 使用DML估计ATE2.5 使用DML估计CATE2.6 直接预测反事实的Y3. Econml DML应用实战1. 为什么需要DML? 用来做因果推断 优势 减少函数形式的假设可以对高维数据进行建模...

2022-06-19 19:59:02 2984 2

原创 IDEA同时打开多个分支

IDEA 同时打开多个分支进行开发

2022-06-02 16:25:45 4065 1

原创 华为笔试题——去除重复的数字

华为笔试题题目描述给定一个包含重复数字的数组,数组中的数字范围(0,9],要求删除重复数字后得到的数组组成的整数最大,且数字的相对位置不变。数组的长度小于7。输入样例[1,2,9,1,2,1]输出样例[9,2,1]解题思路s = input()s = s[1:-1].replace(',', '')if not s: print('[]')else: res = s[0] for i in range(1, len(s)): if

2021-11-18 15:31:27 998 2

原创 Mac Book HomeBrew 一键快速安装脚本

Mac Book HomeBrew 一键快速安装脚本转载自原文:https://zhuanlan.zhihu.com/p/1110144481. 安装脚本完整版安装/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"精简版安装/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/mast

2021-07-03 16:45:21 471

原创 C++ 纯虚函数

C++ 纯虚函数#include<bits/stdc++.h>using namespace std;class A {public: virtual void add() = 0;};class B : public A {public: virtual void add() { printf("1\n"); }};int main() { B b; A *p = &b; p->add();

2020-09-23 17:19:38 285

原创 手撕代码高频考题代码详解

手撕代码高频考题代码详解1. 快速排序# Python最简版from random import randintdef quick_sort(arr): if len(arr) <= 1: return arr p = arr[randint(0, len(arr) - 1)] left = [x for x in arr if x < ...

2020-09-16 16:30:44 574

原创 湖南大学计算机考研复习资料

个人考研资料总结考研资料https://github.com/ZSCDumin/HunanUniversity

2020-07-19 10:47:16 365

原创 python 分组合并元素

python 分组合并元素问题描述:将用户点击过的物品进行合并,返回用户点击记录的字典数组.此处用到了python字典进行处理.1. 实例分析import pandas as pdres = {}data = [[0, 0, 1], [0, 1, 1], [0, 2, 1], [1, 1, 1], [1, 2, 1]] # [u_id, i_id, rating]for item in data: res.setdefault(item[0], []).append(item[1

2020-07-12 11:16:28 598

原创 推荐系统书籍推荐

1. 深度学习推荐系统2. 推荐系统实战

2020-06-05 12:07:08 491

原创 Python 多进程与多线程优化

Python 多进程与多线程优化Python 多线程代码from time import ctime, sleepimport threadingimport numpy as npimport collections loops = [1e6,1e7]class MyThread(threading.Thread): def __init__(self, func, args, name=''): threading.Thread.__init__(self)

2020-05-26 11:15:16 600

原创 spark 多次join操作带来的问题

scala sparkspark dataframe 聚合操作、join操作,多次引用导致字段解析错误的问题,可以重命名列解决。

2020-05-14 18:08:48 827

原创 or-tools工具使用教程

or-tools工具使用教程工具简介or-tools是用于解决组合优化问题的开源软件,旨在从众多的可能中寻找到最佳的解决方案,比如解决以下的问题:最优线路问题最佳计划问题装箱问题or-tools包括用于以下方面的求解器:约束优化问题线性和整数规划问题车辆路线问题图相关问题代码仓库https://github.com/google/or-tools安装pip install ortools使用示例线性优化问题from __future__ import

2020-05-12 17:08:19 8938 1

原创 参考文献查阅网站大全

陕西三百六信息科技有限公司:论文必备:史上最全文献检索、阅读及管理攻略 写论文如何找参考文献? 主流网站: Semantic scholar AMINER dblp arxiv google 学术 百度学术 知网 ...

2020-05-08 15:37:25 1805

原创 重新认识傅里叶变换

傅里叶变幻的基本思想:任意周期函数可以写成三角函数之和。 复数的作用:旋转。乘以i旋转90°,再乘以i旋转90°。 傅里叶变换通过欧拉公式变成指数函数形式: 参考资料 https://www.cnblogs.com/h2zZhou/p/8405717.html 如何理解傅里叶变换公式? 复数的物...

2020-05-08 05:49:43 222

原创 Multiple Treatment 相关文献资料

主要解决的问题是:针对不同的用户发放不同的优惠券之类的策略的活动,从而刺激用户增长,日活,提高收益等等。 相关论文: https://dl.acm.org/doi/10.1145/3308558.3313744 Estimation of causal effects with multiple treatments: a rev...

2020-05-08 04:48:44 407

原创 图神经网络开源框架DGL

图神经网络开源框架DGL还有另外一个开源框架PyTorch Geometric, 在这里不做详细介绍,有兴趣的同学自己去了解一下,个人推荐DGL,简单易用,扩展性好。1. 使用教程1.1 pip安装pip install dgl # For CPU Buildpip install dgl-cu90 # For CUDA 9.0 Buildpip in...

2020-04-06 10:29:17 1999 8

原创 图神经网络开源框架DGL学习

图神经网络开源框架DGL学习 还有另外一个开源框架PyTorch Geometric, 在这里不做详细介绍,有兴趣的同学自己去了解一下,个人推荐DGL,简单易用,扩展性好。 个人公众号 ...

2020-04-06 02:38:04 1505

原创 Hive 复制表结构和数据

Hive 复制表结构和数据1. 复制非分区表create table a as select * from b;2. 复制分区表create table a like b;insert overwrite table a partition (year, month, day) select * from b;...

2020-04-02 14:42:03 421

原创 causalml 使用介绍

causalml 使用介绍 1. 安装教程及官方文档 1.1 pip安装 pip install causalml 1.2 API文档 https://causalml.readth...

2020-03-30 07:44:55 3648

原创 Linux查找文件名和文件内容的命令

Linux查找文件名和文件内容的命令1. find 命令命令详解:https://man.linuxde.net/find查找文件名包含 abc的文件: find . -name "*abc*"2. grep 命令命令详解:https://man.linuxde.net/grep查找文件内容包含abc的文件: grep -rn "abc"...

2020-03-17 11:38:11 4901

原创 Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-Experiment Data

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SJyoawDB-1582873027451)(https://s2.ax1x.com/2020/02/28/3DVai6.jpg)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ItNO7B4X-1582873027452)(https://s2.ax1x.com/2020/02/28...

2020-02-28 14:58:41 32879 1

原创 CUPED算法

CUPED算法是一个通用的方法,主要利用实验前的无偏数据,(一般选取实验前的同一指标)对实验核心指标进行修正,使得新指标的方差更低,得到更敏感的新指标,放大treatment的影响;同时该方法还可以在减少样本量或实验周期,减少前期实验成本,降低实验风险。 https://blog.csdn.net/qq_20001941/article/details/104556748...

2020-02-28 07:22:16 1643

原创 python append和extend的区别

python append和extend的区别1. appendappend可以添加单个元素,也可以添加可迭代对象2. extendextend只能添加可迭代对象3. 代码示例:arr_ap = [1,2,3,4]item = [5,6,7]arr_ap.append(item)In [160]:arr_apOut[160]:[1, 2, 3, 4, [5, 6, 7]]...

2020-01-08 19:41:22 4761

原创 常见面试题汇总

SpringBoot 面试题集锦https://www.cnblogs.com/3xmq/p/springboot.htmlhttps://blog.csdn.net/panhaigang123/article/details/79587612https://segmentfault.com/a/1190000016686735https://juejin.im/post/5ccaa56...

2019-06-02 15:02:55 4529

原创 推荐系统热门研究方向

推荐系统热门研究方向1. 大方向个性化推荐群组推荐2. 近期热门研究方向利用图神经网络来提供可解释性利用评论来提供可解释性利用多模态(文本、图像)信息进行融合利用多个算法进行综合推荐利用强化学习解决在线推荐问题利用强化学习构建虚拟环境进行模拟测试利用树结构挖掘更高阶的显式信息利用知识图谱提供可解释性利用时序循环网络解决长短期依赖问题...

2019-05-12 11:02:22 33419

原创 Github + Hexo搭建博客源代码

Github + Hexo搭建博客源代码1. 代码参考地址2. 简易教程1. 代码参考地址https://github.com/ZSCDumin/BlogSystems2. 简易教程https://zscdumin.github.io/2018/01/30/hexo-githubpage/...

2019-04-29 10:46:41 4924 2

原创 MovieLens 数据集补充版爬虫代码解析

MovieLens 数据集补充版爬虫代码解析import requestsfrom pyquery import PyQuery as pqimport pandas as pddef get_response(url): try: response = requests.get(url, timeout=30) return response.t...

2019-04-08 17:30:46 5212 2

原创 The Personal Health Technology Design Space

个人健康技术 PPT

2019-04-06 15:07:57 4553

原创 2019未来杯高校AI挑战赛之图像-发现超新星

1. 参赛网址https://ai.futurelab.tv/contest_detail/12. 背景知识介绍http://psp.china-vo.org/article/sysaquiz1intro3. 数据分析(未经允许不得转载)...

2019-03-22 11:28:01 5375 1

原创 2019 未来杯高校 AI 挑战赛 > 图像-发现超新星

2019 未来杯高校 AI 挑战赛 > 图像-发现超新星 1. 任务目标 设计一个目标检测模型,从天文望远镜拍摄到的影像中发现疑似新星、超新星。 2. 规则说明 参赛选手需要基于给定的数据集,设计并训练模型,用于检测PSP项目中天文望远镜拍摄到的影...

2019-03-22 03:35:37 483

原创 Graph Neural Networks for Social Recommendation

Graph Neural Networks for Social Recommendation1. 摘要构建基于图神经网络的推荐系统的三大挑战the user-item graph encodes both interactions and their associated opinionssocial relations have heterogeneous strengthsus...

2019-03-13 17:27:43 6701

原创 DataFound 2019用户画像竞赛分析

DataFound 2019用户画像竞赛分析1. 数据解释列的含义['用户编码', '用户实名制是否通过核实', '用户年龄', '是否大学生客户', '是否黑名单客户', '是否4G不健康客户','用户网龄(月)', '用户最近一次缴费距今时长(月)', '缴费用户最近一次缴费金额(元)', '用户近6个月平均消费值(元)','用户账单当月总费用(元)', '用户当月账户余额(元)',...

2019-03-07 17:24:59 5264 1

原创 Explainable Reasoning over Knowledge Graphs for Recommendation

Explainable Reasoning over Knowledge Graphs for Recommendation1. 摘要 近年来,将知识图结合到推荐系统中已引起越来越多的关注。通过探索知识图中的互连链接,可以将用户和项之间的连接发现为路径,从而为用户项交互提供丰富且互补的信息。这种连接不仅揭示了实体和关系的语义,而且有助于理解用户的兴趣。然而,现有的努力尚未充分探索用于推断用...

2019-03-01 16:45:29 32305

原创 NDCG

NDCG 详解1. CG累积增益(CG)是DCG的前身,并且在考虑结果集的有用性时不包括结果的位置。以这种方式,它是搜索结果列表中所有结果的分级相关值的总和。特定等级位置p的CG定义为:2. DCGDCG的前提是在搜索结果列表中出现较低的高度相关文档应该受到惩罚,因为分级相关值与结果的位置成对比地减小。DCG的传统公式累积在特定的等级位置p的定义为:另一种表述...

2019-03-01 16:36:42 5686

原创 图神经网络相关综述论文推荐

图神经网络相关综述论文推荐1.1 Relational inductive biases, deep learning, and graph networks1.2 论文链接论文链接视频链接2.1 Graph Neural Networks: A Review of Methods and Applications2.2 论文链接论文链接视频链接...

2019-02-18 21:23:13 6371

原创 英语翻译作业

第一单元 英翻中 德.汤说过,一切进步,一切发展均来自挑战及由此引起的反应。没有挑战就没有反应,没有发展,没有自由。所以,我们首先应该在我们孩子的能力允许的范围内为他们开设最严格最富有挑战性的课程。 我们可以向我们的孩子提供第二个机会是允许他们有失败的权力。德.纽伊写道:“不仅是一种特权,也是一种考验。”如果没有人可以失败,那它算什么考验,...

2019-01-06 06:33:33 375

原创 爬虫

1.创建项目 scrapy startproject p1 2.文件说明: scrapy.cfg 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py 设置数据存储模板,用于结构化数据,如:Django的Model pipe...

2019-01-06 06:32:35 228

原创 手写数字识别之卷积神经网络版

参考代码如下: import numpyfrom keras.datasets import mnistfrom keras.models import Sequentialfrom keras.layers import Densefrom keras.layers import Dropoutfrom keras.layers ...

2019-01-06 06:31:55 179

原创 Hexo+GithubPage制作自己的博客

具体步骤如下: 1. 创建一个文件夹(如Blog) 2. 开始安装Hexo,在Bolg文件夹里面打开git bash,输入如下命令 $ npm install hexo -g 3. 初始化Hexo $ hexo init 4...

2019-01-06 06:30:44 138

slide of cuped.pdf

该方法是一个通用的方法,主要利用实验前的无偏数据,(一般选取实验前的同一指标)对实验核心指标进行修正,使得新指标的方差更低,得到更敏感的新指标,放大treatment的影响;同时该方法还可以在减少样本量或实验周期,减少前期实验成本,降低实验风险。

2020-02-28

复旦大学——机器学习与深度学习

近年来,以机器学习、知识图谱为代表的人工智能技术逐渐变得普及。从车牌识别、人脸识别、语音识别、智能问答、推荐系统到自动驾驶,人们在日常生活中都可能有意无意地使用到了人工智能技术。这些技术的背后都离不开人工智能领域研究者们的长期努力。特别是最近这几年,得益于数据的增多、计算能力的增强、学习算法的成熟以及应用场景的丰富,越来越多的人开始关注这一个“崭新”的研究领域:深度学习。深度学习以神经网络为主要模型,一开始用来解决机器学习中的表示学习问题。但是由于其强大的能力,深度学习越来越多地用来解决一些通用人工智能问题,比如推理、决策等。目前,深度学习技术在学术界和工业界取得了广泛的成功,受到高度重视,并掀起新一轮的人工智能热潮。 本课程主要介绍神经网络与深度学习中的基础知识、主要模型(卷积神经网络、循环神经网络等)以及在计算机视觉、自然语言处理等领域的应用。 要获取更新提醒,请关注https://github.com/nndl/nndl.github.io 示例代码,见https://github.com/nndl/nndl-codes 课程练习,见https://github.com/nndl/exercise

2019-04-21

图卷积神经网络的变种与挑战

图神经网络的相关论文ppt

2019-02-20

大数据Spark企业级实战版

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

2018-04-05

循序渐进学Docker

Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。

2018-04-05

商业级文件下载项目

Android文件商业级下载项目

2016-10-08

ACM 模板 函数

ACM 模板 函数

2016-03-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除