自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 资源 (6)
  • 收藏
  • 关注

原创 漏洞挖掘之XSS

XSS介绍XSS即跨站脚本攻击,是OWASP TOP10之一。它的全称为Cross-site scripting,之所以缩写为XSS是因为CSS这个简称已经被占用了。XSS攻击的原理为,浏览器将用户输入的恶意内容当做脚本去执行,从而导致了恶意功能的执行,这种针对用户浏览器的攻击即跨站脚本攻击。它的攻击方式可以分为三种类型:反射型、存储型和DOM型。1 反射型当应用程序将收到的用户输入,直接作为HTML输出的一部分时,并且未经验证或转义,攻击者就可以输入一些JavaScript脚本,使得受害者的浏览器

2022-03-01 10:33:20 5551 1

原创 transformers的原理及其在CV中的应用

本文分两个部分,第一部分讲解transformers的网络架构和原理,第二部分讲解如何将其应用到CV领域;1,transformers的网络架构《Attention Is All You Need》是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型,叫 Transformer,抛弃了以往深度学习任务里面使用到的 CNN 和 RNN。目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本摘要和语音识别等

2021-10-17 20:26:57 901

原创 textCNN原理简介与工程实现

textCNN原理简介与工程实现textCNN是启发于图像处理领域的CNN,将其改造应用于文本领域。原论文是纽约大学Yoon Kim发表于EMNLP 2014的Neural Networks for Sentence Classification;论文显示,只是简单的在word2vector加入textcnn层,在很多公开数据集的任务上性能都得到了很好的提升。下面从textcnn的原理介绍和代码实现两个方面来具体介绍。1,textCNN原理介绍textCNN网络结构很清晰,基本下面这张图就说清楚该模型

2021-09-29 16:41:00 957

转载 在网络安全领域应用机器学习的困难和对策

转载于安全狗,freebuf; 原文地址:https://www.freebuf.com/articles/neopoints/234939.html网络安全领域的独特对抗属性给人工智能应用落地带来了重重困难,但我们并不认为这最终会阻碍人工智能成为网络安全利器。我们尝试分析了人工智能在网络安全应用里的潜在困难,并试着解决它们。基于机器学习、深度学习的网络安全应用研究是近年来网络安全领域里的一个热门研究方向。从可见的资料上来看,安全专家已经在异常进程行为检测、恶意代码检测、网络入侵检测等方面进行了广泛的学

2021-09-18 10:08:27 477

原创 四大主流WebShell管理工具分析 | 防守方攻略

先知社区上发表的一篇关于webshell工具介绍的文章,写得非常棒,转载一下:https://xz.aliyun.com/t/9397其他相关资料:中国菜刀:http://www.jzpc.com.cn/jc/30421.html冰蝎:https://www.jianshu.com/p/aba8fc663ad7https://www.yuque.com/antswordproject/antsword通过实际使用体验,冰蝎,蚁剑比较好使;...

2021-09-18 09:52:42 293

原创 加拿大网安局公布数据

记录一下找到的一份网络安全领域的一份数据集;数据集由加拿大网安局提供,同时 kaggle比赛也采用了这份数据,记录一下,后续如果有需要方便查找。网安局网站:https://www.unb.ca/cic/datasets/ids-2018.htmlkaggle比赛地址:https://www.kaggle.com/solarmainframe/ids-intrusion-csv...

2021-09-18 09:34:12 138

原创 数据加密/转换的方法

现实生活中,有时候需要传递一些敏感信息给他人,然而又担心数据被泄漏。所以就用到一些加密的方式。1,数据转换成图像今天看到一篇文章,讲到是将设备的运行数据转换成图像,然后将图像输入模型进行检测。这样既能共享数据,又不用暴露源数据。感觉是一种很好的方式,数据的表示方式很多,只要能表现出的这个数据的本质就行,这样避免了敏感信息直接暴露,是一种不错的方式。2,二维码现在大街小巷全是二维码,某种意义上,二维码是一种表示信息的方式,这也避免源信息直接暴露的风险,也是一种很好的方式。...

2021-07-30 10:51:44 886

原创 词嵌入word embedding经典模型

学习词向量时,看到一篇脉络清晰地文章,这里直接引用了word embedding后续如果有补充我再加吧

2021-07-03 14:51:03 218

原创 记录服务器跑程序常用的tricks

记录一下服务器跑程序用到的技术1,后台执行程序训练模型常常需要跑很长时间,前台执行时一旦断开,程序就终止了,所以需要在后台执行。示例:nohup python -u test.py > test.log 2>&1 &nohup //不挂起的意思python test.py //python运行test.py文件-u 代表程序不启用缓存,也就是把输出直接放到log中,没这个参数的话,log文件的生成会有延迟“> t

2021-06-09 09:34:10 244 2

原创 webshell是什么?

webshell是什么?百度百科的定义:webshell就是以asp、php、jsp或者cgi等网页文件形式存在的一种代码执行环境,也可以将其称做为一种网页后门。黑客在入侵了一个网站后,通常会将asp或php后门文件与网站服务器WEB目录下正常的网页文件混在一起,然后就可以使用浏览器来访问asp或者php后门,得到一个命令执行环境,以达到控制网站服务器的目的。通俗来讲,Webshell是黑客经常使用的一种恶意脚本,其目的是获得对服务器的执行操作权限,比如执行系统命令、窃取用户数据、删除web页面、修改主

2021-04-13 11:18:16 7218 1

原创 transformer模型的工作原理和语言模型BERT

transformer模型的工作原理和语言模型BERT1,概述《Attention Is All You Need》是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型,叫 Transformer,抛弃了以往深度学习任务里面使用到的 CNN 和 RNN。目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本摘要和语音识别等等方向。以下是论文引用:“Transformer 是第一个完全依赖自注意力(

2021-04-08 15:58:13 2177

原创 计算机网络---运输层

计算机网络—运输层运输层是整个网络体系的关键层次之一,为相互通信的应用进程提供逻辑通信,包含面向连接的TCP协议和面向无连接的UDP协议。1 运输层协议概述网络中的两台主机进行端到端通信时,只有主机的协议栈才有运输层,而网络核心部分中的路由器在转发分组时都只用到下三层的功能。从运输层的角度来看,通信的真正端点并不是主机而是主机中的进程。运输层有一个重要的功能—复用(multipuexing)和分用(demultiplexing)。这里的“复用”是指发送方不同的应用进程都可以使用同一个运输层协议来传送数

2021-03-31 09:34:18 776

原创 计算机网络笔记(二)---物理层

1,物理层的基本概念物理层考虑的是怎样才能在连接各种计算机的传输媒体上传输数据比特流,而不是指具体的传输媒体。物理层的主要任务描述为确定与传输媒体的接口有关的一些特性,即:机械特性、电气特性、功能特性、过程特性。2,数据通信的基础知识2.1 数据通信系统的模型数据通信系统可以划分为三大部分:源系统(发送端)、传输系统(传输网络)和目的系统(接收端)。根据信号中代表消息的参数的取值方式不同可以分为两大类:1,模拟信号或连续信号;2,数字信号或离散信号;2.2 信道信道(channel)有三种

2021-02-09 16:57:24 344

原创 计算机网络笔记(一)---概述

计算机网络笔记(一)—概述1,计算机网络在信息时代的作用三大类网络:电信网络、有线电视网络、和计算机网络按照服务分工,电信网络想用户提供电话、电报及传真等服务;有线电视网络向用户传送各种电视节目;计算机网络则使用户能够在计算机之间传送数据文件。其中计算机网络发展最快并起到核心作用,随着技术发展,服务范围有扩大交叉,有“三网融合”的趋势。互联网具有两个重要的基本特点:连通性和共享2,互联网概述1,网络计算机网络(简称网络)由若干结点(node)和连接这些结点的链路(link)组成。网络中的结点可

2021-02-07 11:23:48 274 1

原创 大文件读取首行末行

文件太大时,一般不能直接打开,用程序读取时也不能直接读取到内存,否则导致内存不足,只能部分读取。def read_big_file(filepath): with open(filepath,mode='rb') as f: # 打开文件 first_line = f.readline() # 读第一行 off = -50 # 设置偏移量 while True: f.seek(off, 2) # seek(off, 2

2021-01-22 15:23:01 236 1

原创 输入流写入持久化卷

输入流写入持久化卷有一个简单的需求:有一个输入流InputStream,要将其写入持久化卷;写了几版,总是报coverity有内存泄露;写下解决过程第一版: private static void writeUserImportFile(InputStream is) throws IOException{ BufferedInputStream in=null; BufferedOutputStream out=null; File targetfil

2020-12-23 20:58:19 1601

原创 非常好用的API---Java8之Stream

java8之streamJava从8开始,引入了一个全新的流式API:Stream API。它位于java.util.stream包中。划重点:这个Stream不同于java.io的InputStream和OutputStream,它代表的是任意Java对象的序列。这个Stream和List也不一样,List存储的每个元素都是已经存储在内存中的某个Java对象,而Stream输出的元素可能并没有预先存储在内存中,而是实时计算出来的。换句话说,List的用途是操作一组已存在的Java对象,而Strea

2020-09-02 15:29:05 230

原创 Python解析json文件

日常编程工作中,JSON是接口传递数据的默认格式,对json文件的解析是很常见的步骤。Python的第三方库JSON让解析json文件变得很简单。1,读取json文件json文件内容本质上字符串,当我们拿到json文件后只有转换成字典才方便使用,方便获取需要的字段;import json# json示例{ "version": "1.0", "modelinfo": [ { "versionid": "V1", "netypes": ["ITBBU"],

2020-08-20 20:28:22 390

原创 Java项目依赖包管理:maven简介

maven简介只是简单的了解一下maven的功能。Maven的核心功能便是合理叙述项目间的依赖关系,通俗点讲,就是通过pom.xml文件的配置获取jar包,而不用手动去添加jar包。Maven就是是专门为Java项目打造的管理和构建工具,它的主要功能有:提供了一套标准化的项目结构;提供了一套标准化的构建流程(编译,测试,打包,发布……);提供了一套依赖管理机制。一个使用Maven管理的普通的Java项目,它的目录结构默认如下:a-maven-project├── pom.xml├── s

2020-08-18 19:30:33 674

原创 搭建神经网络八股功能增强

资料来源:北京大学 曹建教授的课程 人工智能实践:TensorFlow笔记使用八股搭建神经网络参考:https://blog.csdn.net/Anakin6174/article/details/108046166这次是增强版。其中二三四五步是大家调试模型常用的步骤。代码示例:import tensorflow as tfimport osimport numpy as npfrom matplotlib import pyplot as pltnp.set_printopti

2020-08-17 23:19:32 315 1

原创 Java基础:异常的抛出,多线程

学习笔记,资料来源:廖雪峰的官方网站一、异常的抛出1、定义 : 一个方法不处理这个异常,而是调用层次向上传递,谁调用这个方法,这个异常就由谁来处理。2、throw : 将产生的异常抛出(强调的是动作),抛出的既可以是异常的引用,也可以是异常对象。(位置: 方法体内)3、throws : 如果一个方法可能会出现异常,但没有能力处理这种异常,可以在方法声明处用throws子句来声明抛出异常。用它修饰的方法向调用者表明该方法可能会抛出异常(可以是一种类型,也可以是多种类型,用逗号隔开)(位置: 写在方法名

2020-08-17 20:21:11 1425

原创 用tensorflow.keras模块化搭建神经网络模型

资料来源:北京大学 曹建教授的课程 人工智能实践:TensorFlow笔记使用八股搭建神经网络其中第三步使用Sequential只能搭建简易的全连接模型,如果是有跳转的卷积网络或者其他复杂设计的网络需要自己创建一个类来设计;利用鸢尾花数据集来搭建网络举例:# 用sequential或自己搭建model类import tensorflow as tffrom sklearn import datasetsimport numpy as npx_train = datasets.lo

2020-08-16 23:19:00 625

原创 Java基础学习笔记

学习廖大神的Java基础教程:https://www.liaoxuefeng.com/wiki/1252599548343744好记性不如烂笔头,记下要点java笔记:推荐书籍:Java编程思想;effective java;1 Java规定,某个类定义的public static void main(String[] args) 是Java程序的固定入口方法,因此,Java程序总是从main方法开始执行。Java入口程序规定的方法必须是静态方法,方法名必须为main,括号内的参数必须是Strin

2020-08-08 16:06:28 196

原创 神经网络优化器

参考:https://blog.csdn.net/weixin_42863507/article/details/106169386

2020-08-06 22:54:08 210

转载 K-means算法的原理、优缺点

文章内容转载自:http://blog.csdn.net/sinat_35512245/article/details/55051306 K-means方法是一种非监督学习的算法,它解决的是聚类问题1、算法简介:K-means方法是聚类中的经典算法,数据挖掘十大经典算法之一;算法接受参数k,然后将事先输入的n个数据对象划分为k个聚类以便使得所获得的聚类满足聚类中的对象相似度较高

2020-07-31 23:31:59 9187

转载 python中self的简明介绍

在Python的类的实例方法第一个参数都是self,下面的文章对此有一个深入简明的介绍:https://www.programiz.com/article/python-self-why

2020-07-23 19:13:37 115

原创 查看日志常用命令

1.查看日志常用命令tail:-n 是显示行号;相当于nl命令;例子如下:tail -100f test.log 实时监控100行日志tail -n 10 test.log 查询日志尾部最后10行的日志; tail -n +10 test.log 查询10行之后的所有日志;head: 跟tail是相反的,tail是看后多少行日志;例子如下: head -n 10 test.log 查询日志文件中的头10行日志;

2020-07-21 17:04:40 1521

原创 Linux学习笔记

工作中经常在Linux系统上操作,只知道一些基本的命令,用到的时候才去查,没有系统的学习过,用过容易忘记;这次系统的看了文档,列出常用的基本操作,共后续参考使用。1,学会使用帮助命令1.1 概述在linux终端,面对命令不知道怎么用,或不记得命令的拼写及参数时,我们需要求助于系统的帮助文档; linux系统内置的帮助文档很详细,通常能解决我们的问题,我们需要掌握如何正确的去使用它们;在只记得部分命令关键字的场合,我们可通过man -k来搜索;需要知道某个命令的简要说明,可以使用whatis;而更详

2020-07-18 16:11:51 310

原创 list与string转换

list与string是常用的数据类型,有时候需要相互转换;一个常见的操作:ls3 = [3,47,5]st = str(ls3)print(st)new_list = list(st)print(type(new_list))print(new_list)#输出"""[3, 47, 5]<class 'list'>['[', '3', ',', ' ', '4', '7', ',', ' ', '5', ']']"""可见,将list转成string很容易,反过

2020-07-06 20:03:14 2638

原创 python多线程编程笔记

多线程编程多线程编程对于具有如下特点的编程任务而言是非常理想的:本质上是异步的;需要多个并发活动;每个活动的处理顺序可能是不确定的,或者说随机的、不可预测的。这种编程任务可以被组织或划分成多个执行流,其中每个执行流都有一个指定要完成的任务。根据应用的不同,这些子任务可能需要计算出中间结果,然后合并为最终的输出结果。计算密集型的任务可以比较容易地划分成多个子任务,然后按顺序执行或按照多线程方式执行。而那种使用单线程处理多个外部输入源的任务就不那么简单了。如果不使用多线程,要实现这种编程任务就需要为串行程序

2020-07-06 19:49:10 152

原创 学习小笔记---机器学习

看书的时候做点笔记,偶尔翻出来看看才能真正掌握;否则很快就遗忘了(艾宾浩斯遗忘曲线)。** 1 集成学习**集成学习 (ensemble learning)通过构建并结合多个学习器来完成学习任务。根据个体学习器的生成方式 ,集成学习方法大致可分为两大类:即个体学习器问存在强依赖关系、必须串行生成的序列化方法?以及个体学习器间不存在强依赖关系、可同时生成的并行化方法;前者的代表是 Boosting,后者的代表是 Bagging 和"随机森林" (Random Forest) 。Boosting 是一族

2020-06-09 19:28:26 313

原创 【转载】Deep Learning(深度学习)学习笔记整理

看到很早的介绍深度学习的系列文章:深度学习介绍下面是一点摘抄:机器学习(Machine Learning)是一门专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能的学科。从原始信号摄入开始(瞳孔摄入像素 Pixels),接着做初步处理(大脑皮层某些细胞发现边缘和方向),然后抽象(大脑判定,眼前的物体的形状,是圆形的),然后进一步抽象...

2020-05-07 20:20:48 912

原创 car-price-deeplearning-0411

import pandas as pdimport numpy as npfrom sklearn.preprocessing import MinMaxScalerfrom sklearn.model_selection import train_test_splitfrom tensorflow import kerasfrom sklearn.metrics import mean...

2020-04-11 16:57:14 475

原创 Python实现定时任务

看到的一个例子,亲测有效from threading import Timerimport psutilimport timeimport datetimedef MonitorSystem(logfile = None): cpuper = psutil.cpu_percent() mem = psutil.virtual_memory() memper ...

2020-04-08 17:14:16 203

原创 sklearn数据预处理

sklearn.preprocessing包提供了一些常用的工具函数来对数据进行预处理。一般来说,机器学习算法在经过预处理的数据上能够取得更好的效果。1, 标准化数据集的标准化是许多在scikit-learn中实现的机器学习估计器的普遍要求。如果各个特征看上去或多或少不像标准正态分布数据,则它们的性能可能会很差:平均值和单位方差为零的高斯。在实践中,我们经常忽略分布的形状,而只是通过删除每个...

2020-03-20 16:45:55 372

原创 浅识微服务架构

最近两年,微服务架构越来越流行,自己参与的项目也是采用微服务架构,只是平时专注于微服务本身,对整个技术架构也需要多了解了解。基于微服务架构和Docker容器技术的PaaS云平台建设目标是给我们的开发人员提供一套服务快速开发、部署、运维管理、持续开发持续集成的流程。平台提供基础设施、中间件、数据服务、云服务器等资源,开发人员只需要开发业务代码并提交到平台代码库,做一些必要的配置,系统会自动构建、部...

2020-03-12 19:47:35 166

原创 python中函数传递参数是值传递还是引用传递?

python中函数传递参数是值传递还是引用传递?严格来说,应该都不是;正确的叫法应该是传对象,或者说传对象的引用。Python 函数中,参数的传递本质上是一种赋值操作,而赋值操作是一种名字到对象的绑定过程。函数参数在传递的过程中将整个对象传入,对可变对象的修改在函数外部以及内部都可见,调用者和被调用者之间共享这个对象,而对于不可变对象,由于并不能真正被修改,因此,修改往往通过生成一个新对象然后...

2020-02-25 10:40:10 452

原创 更改Jupyter Notebook默认打开目录

Jupyter notebook是anaconda下面的一个交互式的编辑器,非常方便好用。在默认情况下,打开的目录是user目录下,很多其他文件也存储在此目录下,比较混乱,我们可以自己单独设置一个目录。在之前使用anaconda2版本的时候,直接修改配置文件即可:C:\Users*用户名*.jupyter目录下有jupyter_notebook_config.py文件,编辑此文件中的c.No...

2020-02-06 10:09:50 365

原创 Python编程惯用法

1,数据交换值的时候不推荐使用中间变量一般交换两个值是借助中间变量来实现,不过Python有更简单的实现方式:X, Y = Y, X这种方式耗时少,代码也更加简洁。之所以能这样,因为一般情况下Python的表达式的计算顺序是从左到右,但是遇到表达式赋值的时候,表达式右边的操作会先于左边的操作数计算,因此表达式 exp3, exp4 = exp1, exp2 的计算顺序是exp1,exp2–...

2020-02-03 11:00:43 214

原创 pandas采坑记录

记录工作中使用pandas遇到的小坑------吃一堑,长一智1,pandas中merge两个df,若有重复数据,会造成输出项多了(笛卡尔乘积式增长),话不多说,举例如下:import pandas as pdimport numpy as npdf1 = pd.DataFrame()df1['A'] = [1,1,1,2,2]df1['B'] = [3,3,3,4,5]# 输出d...

2019-12-24 10:56:03 299

二手车价格预测数据备份.zip

人工智能 / 机器学习数据

2020-03-28

素贞之91建议——进阶读书笔记.pdf

Python进阶的读书笔记,实际是编写高质量代码:改善Python的九十一个建议; 对于入门后的童鞋来说,读完此书又可以上升一个层次了!

2020-01-20

ppd拍拍贷风控大赛数据集.7z

风控数据

2019-11-04

neo_信用卡欺诈预测模型.pdf

风控模型,主要是介绍预测信用卡用户的潜在欺诈风险。

2019-10-23

xw-risk-prediction.zip

算法大赛脱密信贷数据

2019-10-14

Scikit-learn使用手册中文版

Scikit-learn使用手册中文版,适合刚入门的来进行参照学习

2018-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除