自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

瑶子的博客

不积跬步无以至千里

  • 博客(122)
  • 收藏
  • 关注

原创 机器学习流程总结概括

在这里插入图片描述

2018-09-22 01:01:38 377

原创 python使用pyinstaller打包exe结果太大解决

本人pycharm中的Python均为Anaconda安装环境,待打包的文件import的库为numpy/pandas/xlwt,初始用pyinstaller打包程序后exe文件大约为380M,尝试了以下办法:1、新建了一个新的anaconda环境,仅安装相关库,打包后文件为240M2、使用pipenv创建虚拟环境,但是安装库文件时lock一直20多分钟都没结果3、不使用acnconda ,...

2019-11-01 12:38:08 7977

转载 二叉树创建、输出

# #-*- coding:utf-8 -*-# # @Author:zhangy# # @Time:2019-09-27 11:25# # reference:https://github.com/EchoLLLiu/DataStructure/tree/master/ch04tree#class TreeNode: '''二叉搜索树节点的定义''' def __ini...

2019-09-27 17:30:36 984

转载 binary_search_tree

reference:https://github.com/EchoLLLiu/DataStructure/blob/master/ch04tree/BinarySearchTree.py#-*- coding:utf-8 -*-# @Author:zhangy# @Time:2019-09-27 16:16#reference:https://github.com/EchoLLLiu/Da...

2019-09-27 17:27:49 279

原创 编辑距离算法理解(动态规划的思想)

假设两个字符串长度分别为i、j,从简单的情况进行分析:一、当两个字符串都为空串,那么编辑距离为0;二、当其中一个字符串为空串时,那么编辑距离为另一个费控字符串的长度;三、当两个字符串均为非空时,取以下三种情况的最小值即可:1、长度分别为i-1和j的字符串的编辑距离已知,则加1即可2、长度分别为i和j-1的字符串编辑距离已知,则加1即可3、长度分别为i-1和j-1的字符串的编辑距离已知,...

2019-09-24 11:25:06 769

原创 conda channels 配置

1、在anaconda prompt查看已配置conda channelsconda config --get channels2、删除某条channelconda config --remove channels https://----------------------------------------3、增加channelconda config --add channel...

2019-07-17 09:18:28 6000

原创 基于TED(en-zh)数据集进行实现Seq2Seq模型

博客文章基于Google Tensorflow实战深度学习框架第九章部分内容,手写一遍代码加强模型理解。1、获取词汇表# -*- coding:utf-8 -*-'''@Author:zhangy@Modify:2019.7.5'''import codecsimport collectionsfrom operator import itemgetter#设置中英文类型,得...

2019-07-08 15:20:14 856

原创 Python数值运算各函数性能分析

数据分析中的常见任务是在大量数字上计算发杂的数学表达式,Python本身提供了所有必须的功能,不同库实现的效率差别很大:1、loops = 25000000from math import *a = range(1,loops)def f(x): return 3 * log(x) + cos(x) ** 2%timeit r = [f(x) for x in a]18....

2019-04-22 11:22:37 779

原创 整数转化为任意进制字符串-python

递归的方式:def toStr(n,base): convertString = '0123456789ABCDEF' if n < base: return convertString[n] else: return toStr(n//base,base) + convertString[n%base]测试:1、print(...

2019-04-08 17:50:41 800

原创 leetcode25--k个一组翻转链表 python

给出一个链表,每 k 个节点一组进行翻转,并返回翻转后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么将最后剩余节点保持原有顺序。示例 :给定这个链表:1-&gt;2-&gt;3-&gt;4-&gt;5当 k = 2 时,应当返回: 2-&gt;1-&gt;4-&gt;3-&gt;5当 k = 3 时,应当返回: 3-&gt;2-&gt;1-&g...

2019-01-15 16:10:26 499

原创 numpy.array 相关常用操作

1.np.array构造函数用法:np.array([1,2,3,4,5])1.1 numpy array 和 python list 有什么区别?标准Python的列表(list)中,元素本质是对象。如:L = [1, 2, 3],需要3个指针和三个整数对象,对于数值运算比较浪费内存和CPU。因此,Numpy提供了ndarray(N-dimensional array object)对象:...

2019-01-15 10:35:40 594

转载 XGBoost参数说明

转自:https://blog.csdn.net/han_xiaoyang/article/details/52665396本文仅收集模型参数定义,具体代码示例请参考上述链接。1、简介XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这...

2018-12-30 10:42:23 2623

原创 二分查找_python

1、循环非递归方法:def binarySearch(c,k): l=0 r=len(c)-1 while l&lt;=r: mid = (l+r)//2 if k &lt; c[mid]: r = mid - 1 elif k &gt; c[mid]: l = mid + 1...

2018-12-26 17:27:43 140

原创 推荐系统5---多目标排序

一、多目标排序1.1为什么要有多目标排序?⼯业界推荐系统多基于隐式反馈•Global bias:不同⽬标表达不同的偏好程度•Item bias:单个⽬标衡量不全⾯(标题党)•User bias:⽤户表达满意度的⽅式不同•综合⽬标收益最⼤化多⽬标排序的难点多⽬标 vs CTR预估**•**部分⽬标数据稀疏,模型准确率低**•**在线服务计算量⼤**•**多个⽬标间重要性难以量...

2018-12-21 15:49:10 4126

转载 Sklearn-GBDT(GradientBoostingDecisionTree)梯度提升树

https://blog.csdn.net/CherDW/article/details/54982805一、GBDT概念描述GBDT是集成学习Boosting家族的成员,但是却和传统的Adaboost有很大的不同。回顾下Adaboost,是利用前一轮迭代弱学习器的误差率来更新训练集的权重,这样一轮轮的迭代下去。GBDT也是迭代,使用了前向分布算法,但是弱学习器限定了只能使用CART回归树模型...

2018-12-17 09:17:03 11026

原创 推荐系统二---召回算法和业界最佳实践(一)

业界通用推荐系统框架结构如下:Match &amp;amp;amp;amp; Rank定义:Match基于当前user(profile、history)和context,快速在全库里找到TopN最相关的item,给Rank来做小范围综合多目标最大化通常做法:用各种算法做召回,比如user/item/model-based CF,Content-based,Demographic-based,DNN-Embeddi...

2018-12-16 01:31:07 17209 1

转载 转:SKlarn-RandmForest 随机森林学习总结

本文转自:https://blog.csdn.net/cherdw/article/details/54971771scikit-learn中,RandomForest的分类类是RandomForestClassifier,回归类是RandomForestRegressor,需要调参的参数包括两部分,第一部分是Bagging框架的参数,第二部分是CART决策树的参数。sklearn随机森林官网...

2018-12-13 01:00:55 314

原创 推荐系统第四课(用户建模----召回排序都会用到)wide and deep Practice

1 learning to rank 回顾Learning to Rank for Information Retrieval,Tie-Yan :Liuhttps://www.cda.cn/uploadfile/image/20151220/20151220115436_46293.pdf2、点击预估模型模型:

2018-12-09 16:36:30 4609

原创 leetcde94 二叉树的中序遍历 python

给定一个二叉树,返回它的中序 遍历。示例:输入: [1,null,2,3]12/3输出: [1,3,2]方法1:递归# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = No...

2018-12-09 15:46:53 141 1

原创 leetcode145二叉树的后序遍历

给定一个二叉树,返回它的 后序 遍历。示例:输入: [1,null,2,3]12/3输出: [3,2,1]方法1:递归# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = N...

2018-12-09 15:23:34 140

原创 leetcode144 二叉树的前序遍历

给定一个二叉树,返回它的 前序 遍历。示例:输入: [1,null,2,3]12/3输出: [1,2,3]方法1:递归# Definition for a binary tree node.# class TreeNode:# def __init__(self, x):# self.val = x# self.left = N...

2018-12-09 11:39:21 158

原创 leetcode102 层次遍历

给定一个二叉树,返回其按层次遍历的节点值。 (即逐层地,从左到右访问所有节点)。例如:给定二叉树: [3,9,20,null,null,15,7],3/ 9 20/ 15 7返回其层次遍历结果:[[3],[9,20],[15,7]]方法1:递归# Definition for a binary tree node.# class TreeNode:# ...

2018-12-09 11:10:16 217

转载 python实现二叉树和七种遍历

转载:https://blog.csdn.net/Bone_ACE/article/details/46718683介绍:树是数据结构中非常重要的一种,主要的用途是用来提高查找效率,对于要重复查找的情况效果更佳,如二叉排序树、FP-树。另外可以用来提高编码效率,如哈弗曼树。利用Python实现树的构造和几种遍历算法:&gt;树的构造&gt;递归实现先序遍历、中序遍历、后序遍历&gt;...

2018-12-09 00:06:42 385

原创 机器学习分类器性能指标总结(附类别不平衡问题研究)

一、ROC曲线(1)定义ROC: 接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。常用于二分类问题中的模型比较,主要表现为一种真正例率 (TPR) 和假正例率 (FPR) 的权衡。横轴:负正类率(false postive rate FPR)特异度,划分实例中所有负例占所有负例的比例;(1-Specifici...

2018-12-08 16:59:46 2265

原创 练习总结 +sklearn参数选择调优

kaggle 自行车比赛相关部分练习总结df_train = pd.read_csv('C:/Users/zhangy/Desktop/kaggle_competition_feature_engineering/kaggle_bike_competition_train.csv')# print(train.shape)# print(train.apply(lambda x:sum(x....

2018-12-08 14:48:23 8614

原创 leetcode 78 子集python

给定一组不含重复元素的整数数组 nums,返回该数组所有可能的子集(幂集)。说明:解集不能包含重复的子集。示例:输入: nums = [1,2,3]输出:[[3],[1],[2],[1,2,3],[1,3],[2,3],[1,2],[]]class Solution: def subsets(self, nums): """ :...

2018-12-08 12:29:21 869

转载 letcode 322零钱兑换 python

给定不同面额的硬币 coins 和一个总金额 amount。编写一个函数来计算可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额,返回 -1。示例 1:输入: coins = [1, 2, 5], amount = 11输出: 3解释: 11 = 5 + 5 + 1示例 2:输入: coins = [2], amount = 3输出: -1解法1:DPcla...

2018-12-08 11:15:10 641

原创 leetcode198打家劫舍----python

class Solution:def rob(self, nums):“”&quot;:type nums: List[int]:rtype: int“”&quot;n = len(nums)dp=[0]*len(nums)if n == 0:return 0if n == 1:return max(nums)dp[0] = nums[0]dp[1]= max(nums[0],nums[1]...

2018-12-07 13:00:33 243 1

原创 leetcode 64最小路径和 python

给定一个包含非负整数的 m x n 网格,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。说明:每次只能向下或者向右移动一步。示例:输入:[[1,3,1],[1,5,1],[4,2,1]]输出: 7解释: 因为路径 1→3→1→1→1 的总和最小。思路:使用动态规划方法1:class Solution: def minPathSum(self, gr...

2018-12-06 23:17:05 200

转载 Tensorflow官方文档word2vec_basic.py中文注释

# Copyright 2015 The TensorFlow Authors. All Rights Reserved.## Licensed under the Apache License, Version 2.0 (the &amp;quot;License&amp;quot;);# you may not use this file except in compliance with the License.# Y...

2018-12-04 00:25:36 550

转载 leetcode40组合总数 Python

给定一个数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。candidates 中的每个数字在每个组合中只能使用一次。说明:所有数字(包括目标数)都是正整数。解集不能包含重复的组合。示例 1:输入: candidates = [10,1,2,7,6,1,5], target = 8,所求解集为:[[1...

2018-12-03 23:34:08 731

转载 leetcode 39组合总数 python

给定一个无重复元素的数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。candidates 中的数字可以无限制重复被选取。说明:所有数字(包括 target)都是正整数。解集不能包含重复的组合。示例 1:输入: candidates = [2,3,6,7], target = 7,所求解集为:[[7]...

2018-12-03 23:25:37 608 1

原创 leetcoe 35 搜索插入位置

给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。你可以假设数组中无重复元素。示例 1:输入: [1,3,5,6], 5输出: 2示例 2:输入: [1,3,5,6], 2输出: 1示例 3:输入: [1,3,5,6], 7输出: 4示例 4:输入: [1,3,5,6], 0输出: 0class So...

2018-12-03 22:42:41 90

原创 leetcode 34在排序数组中查找元素的第一个和最后一个位置 python

给定一个按照升序排列的整数数组 nums,和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。你的算法时间复杂度必须是 O(log n) 级别。如果数组中不存在目标值,返回 [-1, -1]。示例 1:输入: nums = [5,7,7,8,8,10], target = 8输出: [3,4]示例 2:输入: nums = [5,7,7,8,8,10], targ...

2018-12-03 00:18:54 171

原创 推荐系统第三课

1、导入库文件from __future__ import print_functionimport collectionsimport mathimport numpy as npimport osimport randomimport tensorflow as tfimport zipfilefrom matplotlib import pylabfrom six.mov...

2018-12-02 23:55:36 484

原创 推荐系统第一课---bandits

import numpy as npimport matplotlib.pyplot as pltimport math#老虎机个数number_of_bandits=10#老虎机的臂数number_of_arms=10#尝试数number_of_pulls=10000#epsepsilon=0.3#最小的decaymin_temp = 0.1#衰减率decay_rat...

2018-12-02 23:47:58 813 1

原创 leetcode 559 N叉树的最大深度 python

给定一个 N 叉树,找到其最大深度。最大深度是指从根节点到最远叶子节点的最长路径上的节点总数。例如,给定一个 3叉树 :我们应返回其最大深度,3。说明:树的深度不会超过 1000。树的节点总不会超过 5000。class Solution(object): def maxDepth(self, root): &amp;quot;&amp;quot;&amp;quot; :type root: N...

2018-12-01 12:02:46 393

原创 leetcode111 二叉树的最大深度 python

给定一个二叉树,找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明: 叶子节点是指没有子节点的节点。示例:给定二叉树 [3,9,20,null,null,15,7],3/ 9 20/ 15 7返回它的最小深度 2.# Definition for a binary tree node.# class TreeNode:# de...

2018-12-01 11:37:48 197

原创 leetcode 33 搜索旋转排序数组 python

假设按照升序排序的数组在预先未知的某个点上进行了旋转。( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。你可以假设数组中不存在重复的元素。你的算法时间复杂度必须是 O(log n) 级别。示例 1:输入: nums = [4,5,6,7,0,1,2], targ...

2018-12-01 10:58:37 130

原创 leetcode28实现strStr() python

实现 strStr() 函数。给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回 -1。示例 1:输入: haystack = “hello”, needle = “ll”输出: 2示例 2:输入: haystack = “aaaaa”, needle = “bba...

2018-11-27 22:02:13 93

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除