自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 收藏
  • 关注

原创 如何在Windows上配置Python开发环境?

这篇博客会不断汇总配置Python开发环境的相关知识。1、工具PycharmJupyter NotebookAnaconda2、命令pipconda3、安装Anaconda,配置环境变量,将D:\Anaconda\Scripts添加至环境变量,这个文件下有conda、pip命令。过程中不小心将pip删掉了,可以使用该文件夹下的easy_install重新安装。4、配置虚拟环境,网上有很多教程,这个是个人认为Anaconda最大的优势,具体教程可参见:https://www

2020-09-29 12:39:40 319

原创 Git安装及使用可能需要的参考资料

第一次使用Git上传本地项目到github上github修改密码后,需要重新设置以下sshkeygit更新本地项目至githubidea解除git项目idea 提交git常见操作idea中使用githubidea遇到如下错误,可能是配置最后一步没有选择tag。17:19 Push failed Invocation failed Server returned invalid ...

2019-12-04 20:17:26 1923

原创 MySql8.0忘记‘root’@'localhost'的密码如何修改?

步骤:1)管理员权限打开cmd,输入net stop mysql(如果提示服务名无效,可以参考这里cmd中输入net start mysql 提示:服务名无效或者MySQL正在启动 MySQL无法启动)2)修改C:\ProgramData\MySQL\MySQL Server 8.0\my.ini在[mysqld]之后,加上skip-grant-tables(最后要将my.ini的编码格...

2019-12-02 18:17:18 913

原创 sysmon

官网:https://docs.microsoft.com/en-us/sysinternals/downloads/sysmonGithub:https://github.com/search?utf8=%E2%9C%93&q=sysmon&type=

2019-11-25 17:04:46 344

转载 复杂网络分析总结网址

[Network Analysis] 复杂网络分析总结

2019-11-25 15:50:52 527

原创 学习Keras可以参考的网址

基于sklearn和keras的数据切分与交叉验证基于Keras的ResNet实现Keras实现DenseNet结构keras搬砖系列-VGG19Keras入门教程06——CapsNet胶囊神经网络详解及Keras实现Keras lstm 文本分类示例keras实现常用深度学习模型LeNet,AlexNet,ZFNet,VGGNet,GoogleNet,Resnet...

2019-11-25 15:46:32 171

原创 x86反汇编

对《恶意代码分析实战》第4章的总结。1、恶意代码分析时的三种编码层次:恶意代码作者高级编程语言——>CPU机器码——>恶意代码分析师低级汇编语言。通常,计算机系统被描述为以下六个抽象层次:1)硬件2)微指令 又称固件,通常是为特定的计算机硬件设计的。3)机器码 由操作码opcode组成,是一些十六进制形式的数字。一般由多条微指令实现,由高级语言编写的计算机程序编译而来。4...

2019-11-01 11:51:22 599

原创 P问题、NP问题、NPC问题、NPH问题概述

P问题如果一个问题可以找到一个能在多项式的时间里解决该问题的算法,这个问题就属于P问题。NP问题可以在多项式的时间里验证一个解的问题。所有的P问题都是NP问题,即能在多项式时间内解决一个问题,必然能在多项式时间里验证一个问题的解。NPC问题首先必须是一个NP问题,然后所有的NP问题都可以约化到该问题。约化:问题A可以约化为问题B,即可以用问题B的解法解决问题A,解决问题B的时间复...

2019-10-19 16:57:43 678

原创 广度优先和深度优先算法实现LeetCode547朋友圈(Python)

针对本题,大部分题解是使用的深度优先算法实现的,本文提供了广度优先的解决方案。1、深度优先​class Solution: def findCircleNum(self, M): visited, ans = set(), 0 def dfs(i): for j in range(len(M[i])): ...

2019-08-21 11:29:29 1047

原创 LeetCode单链表相关题在本地执行的方法

步骤:1)创建ListNode类class ListNode: def __init__(self, x): self.val = x self.next = None2)创建单链表类可参考[python单链表](https://blog.csdn.net/qq_36512295/article/details/98514687)class Si...

2019-08-20 21:12:30 1240

原创 部分主流机器学习研究方向知识汇总

1、CNN(卷积神经网络)网络结构https://www.cnblogs.com/skyfsm/p/8451834.htmlLeNetAlexNetZFVGGGoogleLeNetResNetDenseNeCapsNet(胶囊网络)2、RNN(循环神经网络)网路结构one to one\one to many\many to one\many to many(2种)干货|深度...

2019-07-30 17:56:26 5714 1

原创 集群开发相关知识点

1、HadoopHDFS ; HIVE; MapReduce;YARN2、SparkSpark SQL ;Spark Streaming;MLib;GraphX3、kafka4、ELKLogstash+Elasticsearch+Kibnana;Filebeat5、Strom/Flink6、OpenSOC框架Flume;kafka;Strom7、SQL/NOSQL...

2019-07-09 15:05:04 379

原创 anaconda3激活

cmd命令行输入python会发现无法引入已经安装好的库,出现如下警告:Warning:This Python interpreter is in a conda environment, but the environment hasnot been activated. Libraries may fail to load. To activate this environment...

2019-06-24 00:11:01 17673 4

原创 机器学习相关笔记

https://www.jianshu.com/p/005a4e6ac775 梯度提升决策树 http://blog.csdn.net/gamer_gyt/article/details/78797667 梯度提升和梯度下降算法 http://blog.csdn.net/google19890102/article/details/51746402 梯度提升决策树 http://blog.c

2019-05-31 22:21:18 118

原创 以AdaBoost算法为例,详解集成学习的思想(二)

接下来介绍Boosting族算法中最著名的AdaBoost算法,其基本思想如下: 1、改变训练数据的权值或概率分布,提高前一轮弱分类器分错的样本的权值,降低分类正确的样本的权值(体现在什么地方?乘以exp())。举个例子,我们平时记单词,总是选择前一天没有记下来的单词进行强化训练。 2、如何将弱分类器组合成一个强分类器?加大分类错误率小的基分类器的权值,降低分类错误率大的基分类器的权值。 A...

2019-05-31 22:19:49 209

原创 以AdaBoost算法为例,详解集成学习的思想(一)

秉承在总结的过程中继续挖掘问题的心态,现在将学习到的知识做一个阶段性的总结。 本篇内容主要会讲到集成学习的思想,最后会将AdaBoost算法的思想进行简单的介绍,后期会介绍公式的推导。很多的博客都是参照的周志华教授的西瓜书和李航教授的《统计学习方法》以及相关的论文、大牛们的博客。我也不例外,但是会加入一些自己的思考,并且将里面内容的讲述顺序做一个修改。集成学习可以用“三个臭皮匠,顶个...

2019-05-31 22:16:31 526

原创 偏差-方差分解、损失函数和正则化

一、偏差-方差分解(以回归算法为例) 偏差-方差分解是解释学习算法泛化性能的一种重要工具。 误差是测量值与真实值之间的差值。 偏差度量了学习算法的期望预测与真实结果的偏离程度。 方差度量了同样大小的训练集的变动所导致的学习性能的变化,刻画了数据扰动所造成的影响。 噪声则表达了在当前任务上任何学习算法所能表达的期望泛化误差的下界。 因模型无法表示基本数据的复杂度而造成偏差 因模型对...

2019-05-31 22:15:07 953

原创 CART分类回归树

CART分类回归树1984年提出,ID3算法1986年提出,C4.5算法1993年提出CART由特征选择、树的生成及剪枝组成。CART假设决策树是二叉树,内部结点特征取值为是和否CART使用损失函数最小作为剪枝的标准。回归树的生成:使用平方误差最小化准则。对于任意划分特征A,对应的任意划分点s,两边划分成数据集D1和D2,求出使D1和D2各自集合的均方误差最小。分类树的生成...

2019-05-31 22:11:34 346

原创 决策树思想介绍

分类决策树的核心思想:在数据集D中找到一个最优特征(如何找?),然后从这个特征的选值中找一个最优候选值(怎么找?一般的二分类问题不需要)根据这个候选属性,将数据集D分成若干个子数据集,然后递归上述操作,直到满足指定条件为止。 1)最优特征怎么找?信息增益、信息增益率和基尼系数 其中,信息增益和信息增益率和熵有关,熵可以用来表示系统的不确定性。决策树的思想就是利用数据存在的一些规则,不断降低数据...

2019-05-31 22:09:31 3307

原创 决策树与集成学习

由于机器学习涉及的方法很广,对机器学习有了一个横向宏观的把握之后,需要纵向对某一类方法进行深入的学习。 因为要研究的课题内容是有监督学习,因此选择一类有监督的学习方法进行深入的研究 。 集成学习综述(2016年10月) http://blog.csdn.net/qq_28168421/article/details/53364718目前来说机器学习的研究主要分为四个大方向: a) 通过集...

2019-05-31 22:03:53 1091

原创 SVM算法进阶

1、SVM理解与参数选择(kernel和C)https://blog.csdn.net/ybdesire/article/details/53915093使用SVM时,有两个点要注意:1)若使用核函数,一定要对Feature做Feature Scaling(Normalization)2)若训练集m太小,但Feature数量n很大,则训练数据不足以拟合复杂的非线性模型,这种情况下只能用li...

2019-05-30 17:38:06 487

原创 python终止线程

def _async_raise(tid, exctype): """raises the exception, performs cleanup if needed""" tid = ctypes.c_long(tid) if not inspect.isclass(exctype): exctype = type(exctype) res = c...

2019-05-09 21:19:49 5246

原创 python计算相隔的天数并分割成每周

1、计算两个日期之间相隔的天数# 开始时间start_date = '2018-05-01'# 结束时间end_date = '2019-03-09'date_time1 = datetime.datetime.strptime(end_date, '%Y-%m-%d') # 结束时间 date_time0 = datetime.datetime.strptime(start...

2019-05-08 17:48:41 1783

原创 python实现互补累计概率分布、记忆性、阵发性和活跃度

import numpy as npdef grand_total(num_days): # 计算互补累积概率分布 num_days中存储的是所有的次数,总次数为sum(num_days) grand_total = [] for i in range(1, len(num_days)): a = num_days[i:] # 互补累积概率,单调递减...

2019-05-08 15:55:32 1153

原创 python对坐标轴进行调整

from pylab import *import matplotlib.pyplot as pltimport numpy as npfrom matplotlib.ticker import MultipleLocatorif __name__ == '__main__': x = np.linspace(-5, 5, 100) y1 = np.sin(x) ...

2019-05-08 15:50:38 6027 1

原创 python画对数与半对数坐标

import numpy as npimport matplotlib.pyplot as pltimport scipy.stats as stsif __name__ == '__main__': a = 0.031 / 10000 + 0.0337 / 10000 print(0.0336 * 100 / np.sqrt(a)) # 1320.95 r =...

2019-05-08 15:43:50 27671 1

原创 一些数学分布的python展示

1、beta分布import numpy as npimport matplotlib.pylab as pltfrom scipy.stats import betaif __name__ == '__main__': a = 0.5 b = 0.5 x = np.arange(0.01, 1, 0.01) y = beta.pdf(x, a, b) ...

2019-05-08 15:40:03 498

原创 python计算时间间隔

from datetime import datetimeif __name__ == '__main__': s = '2018-05-01 11:58:24.480819' s1 = '2018-05-02 09:13:33.145445' a = datetime.strptime(s, '%Y-%m-%d %H:%M:%S.%f') b = dateti...

2019-05-08 15:31:23 12105

原创 运行vbs弹出cmd窗口的避免方法

使用Cscript.exe运行vbs会弹出cmd窗口避免方法:管理员权限运行cmd,输入cscript.exe //H:WScript,将默认的脚本宿主改为 WScript.exe,即可解决。

2019-04-24 20:51:59 3701 1

原创 关于CNN(卷积神经网络)的不错的文章

1)https://blog.csdn.net/dss_dssssd/article/month/2018/09/2?CNN系列文章2)https://www.cnblogs.com/touch-skyer/p/9150039.html卷积神经网络(CNN)张量(图像)的尺寸和参数计算(深度学习)3)https://blog.csdn.net/cheneykl/article/detail...

2019-03-07 16:19:20 982

原创 RNN及LSTM的简单理解

由于还没有最终理解RNN和LSTM,因此只是做一下记录,后面完全理解后会将此博文进行修改,也希望各位大佬在留言区批评指正。RNN 单个时刻t的NNt-1,t,t+1时刻的NN,下标t表示时刻,x表示相应时刻下的输入,o表示相应时刻下的输出,s表示相应时刻下的状态,t时刻的输入会组合t-1时刻的状态以及t时刻的输入。 RNN会存在梯度弥散和梯度爆炸的问题,无法实现长期的记忆。因此提出

2018-01-24 21:54:21 510

原创 隐马尔可夫模型(HMM)简单总结

HMM是生成式模型,属于动态贝叶斯网络。 HMM是一个五元组 S表示状态值集合 O表示观测值集合 π表示状态值对应的概率 A表示状态转移矩阵 B表示发射矩阵 1、评估问题 已知:S O 模型λ=(π,A,B) 求:观测序列1-2-3-4出现的概率; 求:输入部分观测序列预测概率最大的下一个值 2、解码问题 已知:S O 模型λ=(π,A,B) 求:观测序列1-2-3-4对

2018-01-22 20:27:18 2758

原创 Python简单实现KNN算法及绘图练习

# encoding:utf-8# 导入模块,具体情况详见http://blog.csdn.net/zhili8866/article/details/52980924#以下注释部分是rcParams.py中的代码,由于同时下载了PyQt4和PyQt5,运行时默认使用的是PyQt5,sip库的版本未达到要求,因此使用PyQt4# import matplotlib# sip库用于自动生成Py

2018-01-13 15:33:03 3986

原创 博弈论入门

基本概念:参与人、行为、信息、战略、支付函数、结果、均衡。 参与人:选择行动以最大化自身利益的决策主体。 行动:参与人的决策变量。 结果:参与人感兴趣的要素的集合。均衡:参与人的最优战略或行动组合。战略:参与人选择行动的规则,决定参与人在什么时候选择何种行动。 信息:参与人在博弈中的知识。 支付函数:参与人战略或行动的函数。参与人、行动和结果统称为博弈规则。博弈分析的目的是使用博弈规则决定

2017-12-26 20:50:27 1668

原创 WebShell概述

WebShell是以PHP等网页文件形式存在的一种命令行执行环境,也可以将其称为一种网页后门。黑客入侵一个网站后,会将PHP后门文件与网站服务器Web目录下的 网页文件混在一起,就可以使用浏览器访问PHP后门,得到一个命令执行环境,达到控制网站服务器的目的。 shell的含义是取得服务器某种程度上的操作权限。WebShell大多以动态脚本的形式出现。黑客可以通过WebShell进一步渗透。 一旦

2017-12-21 21:17:24 507

原创 几个美国娱乐业公司

漫威MARVEL:创建于1939年,旗下拥有蜘蛛侠、金刚狼、美国队长、钢铁侠、绿巨人、等超级英雄,和复仇者联盟、X战警、神奇四侠、银河护卫队等超级英雄团队。2008年被迪士尼收购。HBO Home Box Office:有线电视网络媒体公司,母公司时代华纳。好莱坞八大影业公司主要包括:华纳兄弟公司、米高梅电影公司(猫和老鼠)、派拉蒙影业公司、哥伦比亚影业公司、环球影片公司、联美电影公司、20世纪福克

2017-12-11 10:59:43 4441

原创 关于JS和浏览器的一些总结

JS动态语言特性: JS是解释性语言,不能被编译成二进制文件 JS闭包: 变量可以是全局变量或局部变量,私有变量可以使用闭包 JS内嵌函数 所有函数都能访问它们上一层的作用域 闭包例子: var add = (function () { var counter = 0; return function () {return counter += 1;} })();

2017-12-09 11:47:43 183

原创 Pandas基础学习

# encoding:utf-8import pandas as pdimport numpy as np# s=pd.Series([1,3,5,np.NaN,6,8])# print sdates = pd.date_range('20130101', periods=6)# print dates# 生成随机数,randn()从正态分布中返回一个或多个样本,rand(),随机样本位于[0

2017-11-10 16:39:42 159

原创 Pandas对数据做简单的处理

使用Pandas将读取到的csv文件列表中的True和False修改为1和0,但是只能赋值给字符串类型的‘1’和‘0’,最后使用的话还需要转换类型。# encoding:utf-8import pandas as pddf = pd.read_csv('./t_login.csv')# print df# print df.dtypesprint df['is_scan']df.at[df[

2017-11-09 22:14:00 354

原创 Python爬取Alexa.cn上Top500的网址

在原来只能一次获取20条数据的基础上,和@阿尔法猫一起进行了修改。# encoding:utf-8import requestsfrom bs4 import BeautifulSoupdef excuteSpider(url,headers,session,): req = session.get(url, headers=headers) bsObj = BeautifulS

2017-11-07 17:19:57 1752 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除