自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(105)
  • 资源 (4)
  • 收藏
  • 关注

原创 pyspark入门 中文官方文档

pyspark入门

2022-10-26 16:02:32 2129 1

原创 【python智能办公】处理excel 复制sheet模板带样式 并插入修改数据

from pandas import DataFramedf1 = DataFrame({'a':[1,3,5,7,4,5,6,4,7,8,9], 'b':[3,5,6,2,4,6,7,8,7,8,9]})df2 = DataFrame({'a':[1,3], 'b':[3,5]})# df1.values.tolist()# df2.values.tolist()import openpyxl# 读取表头.

2022-05-05 11:42:30 1586

转载 Locust性能测试-分布式执行的方法(ok)

Locust性能测试-分布式执行的方法(ok)来源:https://www.cnblogs.com/yoyoketang/p/11681370.htmlhttps://www.cnblogs.com/kaibindirver/p/11773334.html前言使用Locust进行性能测试时,当一台单机不足以模拟所需的用户数量的时候,可以在多台机器上分布式的执行性能测试。locust分布式启动场景有2种,一种是单机设置master和slave模式,另外一种是有多个机器,其中一个机器设置mas

2020-09-23 18:28:54 966

转载 L1,L2正则化为什么能解决过拟合

转自:https://www.cnblogs.com/zongfa/p/9774315.html 避免过拟合的方法有很多:early stopping、数据集扩增(Data augmentation)、正则化(Regularization)包括L1、L2(L2 regularization也叫weight decay),dropout。 L1正则化的解具有稀疏性,可用于特征选择。L2正则化的解都比较小,抗扰动能力强。在求解过程中,L2通常倾向让权值尽可能小,最后构造一个所...

2020-07-17 19:52:29 1359

原创 python 爬取图片 并保存至docx

#!/usr/bin/evn python# -*- coding: utf-8 -*-import osimport timeimport requestsfrom docx import Documentfrom docx.shared import Inchesclass MyObject(object): def __init__(self): self.doc = Document() def get_url(self, id): .

2020-06-19 10:10:47 1267

转载 破解 语序点选验证码

转自:https://blog.csdn.net/diegen8187/article/details/85265113设计思路前言国家企业信用信息公示系统中的验证码是按语序点击汉字,如下图所示:即,如果依次点击:‘无’,‘意’,‘中’,‘发’,‘现’,就会通过验证。本项目的破解思路主要分为以下步骤:使用目标探测网络YOLOV2进行汉...

2020-03-17 19:19:47 5003 2

原创 吴恩达深度学习笔记-卷积神经网络

04.卷积神经网络第一周 卷积神经网络1.1 计算机视觉1.2 边缘检测示例垂直边缘检测vertical1.3 更多边缘检测内容边缘过渡水平边缘检测horizontal1.4 padding问题:卷积后图片缩小; 边缘信息丢失过滤器(卷积核)一般都为奇数(原因:1、可以对称填充...

2020-01-25 17:19:07 566

转载 mac 终端 配置代理

即使打开代理,mac终端默认不走,需要配置一、复制终端代理命令export http_proxy=http://127.0.0.1:1089;export https_proxy=http://127.0.0.1:1089;二、添加环境变量打开终端,执行vi ~/.bash_profile添加#proxyalias proxy='export http_pr...

2019-07-30 16:43:49 2474

原创 pycharm mac 配置代理

一、Shadowsocket用默认端口即可不需要改二、mac网络三、Pycharm配置代理检测成功四、然而执行代码还是没走代理最后方式 直接request加代理#!/usr/bin/evn python# -*- coding: utf-8 -*-import requestsproxy = { "http"...

2019-07-29 16:51:05 4560

转载 火狐+selenium3+录屏自动生成代码

打开火狐浏览器“工具”,选择“附加组件”2.选择“查看更多组件”3.搜索插件4.安装这个插件5.验证是否成功(判断右上角是否有这个绿色的图标)6.点击上图中右上角的绿色插件,开始录制自动化测试,点击“Record”便可进行操作过程录制7.录制结束后点击“stop”后结束录制,点击“Export”便可...

2019-06-04 11:44:40 656

转载 Windows环境下maven 安装与环境变量配置

Maven是一个项目管理的Java 工具,在JavaEE中,我们可以使用Maven方便地管理团队合作的项目,现在我们在学习JavaEE框架,使用Maven可以管理类库,有效方便地供团队中的其他人员使用。一、下载Maven 。请访问Maven的下载页面:http://maven.apache.org/download.html,其中包含针对不同平台的各种版本的Maven下载文件。...

2019-05-15 20:34:21 165

转载 Pycharm配置——解释器(interpreter)

Python的解释器就是Python.exe看到这个选项没有,这里说是虚拟环境,也就是说这是一个虚拟解释器,它是建立在D盘里面的Python解释器(第二个圆圈)基础之上的,这里的虚拟解释器在我理解来看,其实和缓存差不多,将要用到的东西放到项目文件夹中,用到的时候,直接调用邻近的,这样速度快,如果没有了,再去原解释器(D盘中),寻找需要的东西。上面提到这种虚拟环境,其实是起到...

2019-05-15 20:05:58 11357

转载 离线下载pip包进行安装

Host-A 不能上网,但是需要在上面安装python-package通过另外一台能上网的Host-B主机1. 下载需要离线安装的Packages在Host-B上执行如下命令:安装单个Packagepip install <package> --download /tmp/offline_packages最新方法 pip download ~pip d...

2019-05-15 19:22:36 4365

转载 Mac电脑使用:桌面底部莫名出现白色输入框解决的解决办法

转自:https://blog.csdn.net/CC1991_/article/details/82965981关闭Finder快速搜索输入框的方法:用鼠标单击输入框,点击进去,然后按电脑键盘的“Esc”键,即可关闭这个输入框。...

2019-05-08 11:00:38 7519 1

转载 mac安装软件允许任何来源(sudo spctl --master-disable) “通用”里有时没有“任何来源”这个选项: 显示"任何来源"选项在控制台中执行:

转自:https://blog.csdn.net/chinawangfei/article/details/82385539安装破解汉化版,有时会提示“~~已损坏,打不开。”原因:软件有经过了汉化或者破解,所以可能被Mac认为「已损坏」解决方式:系统偏好设置 -> 安全性与隐私 -> 通用 -> 选择“任何来源” “通用”里有时没有“任何来源...

2019-05-07 18:43:54 3337

转载 brew安装gradle,配置IntelliJ IDEA本地gradle

转自:https://www.jianshu.com/p/8e2c9297f873包管理工具(像brew, yum,apt-get)安装,所以踩了一波坑。方便依赖包管理-- 检查更新:brew outdated -- 一键升级:brew upgrade -- 卸载旧版本:brew cleanup -- 查看已安装的依赖:brew list 不容易被误删 --brew ...

2019-05-07 17:47:39 1448

转载 Python绘图:Turtle库

Turtle库是Python语言中一个很流行的绘制图像的函数库,想象一个小乌龟,在一个横轴为x、纵轴为y的坐标系原点,(0,0)位置开始,它根据一组函数指令的控制,在这个平面坐标系中移动,从而在它爬行的路径上绘制了图形。turtle绘图的基础知识:1. 画布(canvas)        画布就是turtle为我们展开用于绘图区域,我们可以设置它的大小和初始位置。        设...

2019-01-24 18:49:42 762

转载 Python-turtle库知识小结(python绘图工具)

   turtle:海龟(海龟库)  Turtle库是Python语言中一个很流行的绘制图像的函数库  使用之前需要导入库:import turtle • turtle.setup(width,height,startx,starty)  -setup() 设置窗体的位置和大小  相对于桌面的起始点的坐标以及窗口的宽度高度,若不写窗口的起始点,则默认在桌面的正中心  窗体...

2019-01-24 17:36:10 1126

转载 Mac上写C++

转自:https://www.cnblogs.com/weixuqin/p/6440252.html 用惯Windows的同学可能刚开始用Mac的时候并不知道如何写C++,我刚开始在Mac上写C++的时候也遇到过这个困扰,Mac上并没有Windows上自己用习惯的Visual C++,下面我分享一下个人在写C++的时候所用的两个方法:      1.使用Xcode, 直接App Sto...

2018-12-27 14:29:17 6995 2

原创 pycharm执行代码后 查看变量

在pycharm运行程序后,继续在console对程序中数据进行操作,可以通过以下方式:1、在菜单栏中,选择项目的下拉菜单里的Edit Configuration2、选择对应项目,勾选 Show command line afterwards3、程序运行之后,就会继续保持python shell的状态,可以对数据进行操作调试。4、调试后记得关闭...

2018-12-06 17:20:46 5664

翻译 what if 使用demo

假设工具从头开始 - 从CSV到经过培训的二进制分类模型到假设工具使用这个笔记本显示了从CSV加载数据集的过程,训练一个非常简单的分类器,预测其中一列,然后使用假设工具(WIT)分析训练数据集和训练数据model。这个笔记本使用了UCI Census数据集和学习问题,详情请参阅https://archive.ics.uci.edu/ml/datasets/census+income,...

2018-12-04 19:37:57 514 1

转载 CNN(卷积层convolutional layer,激励层activating layer,池化层pooling,全连接层fully connected)

CNN产生的原因:当使用全连接的神经网络时,因为相邻两层之间的神经元都是有边相连的,当输入层的特征纬度非常高时(譬如图片),全连接网络需要被训练的参数就会非常多(参数太多,训练缓慢),CNN可以通过训练少量的参数从而进行特征提取。上图每一个边就代表一个需要训练的参数,可以直观的感受到需要训练的参数太多了。CNN的优点:1.相邻两层神经元部分相连。2.且同一层神经元的w(权重)和b(偏移)...

2018-11-22 11:46:23 1551

转载 MNIST数据集scikit-learn实践

原文:https://blog.csdn.net/zouxy09/article/details/48903179参考:https://www.cnblogs.com/upright/p/4191757.html一、概述       分类算法为例,大致可以分为线性和非线性两大派别。线性算法有著名的逻辑回归、朴素贝叶斯、最大熵等,非线性算法有随机森林、决策树、神经网络、核机器等等。线性算...

2018-11-05 17:44:35 2069

转载 Python:seaborn的散点图矩阵(Pairs Plots)可视化数据

 散点图矩阵让我们看到了两个变量之间的关系,分析趋势。在本文中,我们将通过使用seaborn可视化库在Python中进行对图的绘制和运行。我们将看到如何创建默认配对图以快速检查我们的数据,以及如何自定义可视化以获取更深入的洞察力。该项目的代码在GitHub上以Jupyter Notebook的形式提供。在这个项目中,我们将探索一个真实世界的数据集,由GapMinder收集的国家级社会经济数...

2018-10-12 14:58:09 3776

转载 Python数据可视化—seaborn

Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图。这里实例采用的数据集都是seaborn提供的几个经典数据集,dataset文件可见于Github。1  set_style( )  set( )set_style( )是用来设置主题的,Seaborn有五个预设好的主题: darkgri...

2018-10-12 14:36:31 277

转载 文本分类/聚类

预处理删除标点符号python进行删除标点符号 text=u'''职位描述 乐视招聘android自动化测试工程师 岗位职责:1、负责android超级电视TV设备的自动化方案设计、自动化测试与工具开发; 2、根据项目特点研究稳定性测试技术,完成相关工具的开发以及测试; 技能要求:1、有移动终端自动化工具架构设计与开发者优先,熟悉Android自动化工具Uiautomator、Mo...

2018-10-11 11:29:19 1977

转载 机器学习十大算法

         本文介绍了机器学习新手需要了解的 10 大算法,包括线性回归、Logistic 回归、朴素贝叶斯、K 近邻算法等。        在机器学习中,没有任何一种算法对所有问题都有效,在监督学习(即预测建模)中尤其如此。例如,你不能说神经网络总是比决策树好,反之亦然。有很多因素在起作用,例如数据集的大小和结构。因此,你应该针对具体问题尝试多种不同算法,并留出一个数据「测试集」来...

2018-10-09 14:53:33 378

转载 Junit4单元测试的基本用法

转自:https://www.cnblogs.com/qiyexue/p/6822791.html环境搭建这里使用的开发工具是MyEclipse,首先新建一个Java工程,将Junit4的jar包引入,eclipse和MyEclipse都集成了Junit的jar包,详细操作如下图。1、新增一个Junit的jar包,版本选择Junit4 Junit使用1、Junit最...

2018-09-30 19:28:21 166

转载 sklearn训练/测试数据集划分

 原理介绍K折交叉验证:KFold,GroupKFold,StratifiedKFold,留一法:LeaveOneGroupOut,LeavePGroupsOut,LeaveOneOut,LeavePOut,随机划分法:ShuffleSplit,GroupShuffleSplit,StratifiedShuffleSplit,  代码实现流程...

2018-09-25 17:26:23 878

转载 cross validation:几种交叉验证方式的比较

模型评价的目的:通过模型评价,我们知道当前训练模型的好坏,泛化能力如何?从而知道是否可以应用在解决问题上,如果不行,那又是哪里出了问题?train_test_split在分类问题中,我们通常通过对训练集进行train_test_split,划分成train 和test 两部分,其中train用来训练模型,test用来评估模型,模型通过fit方法从train数据集中学习,然后调用scor...

2018-09-25 15:57:08 869

转载 Scikit-learn函数总结

       1 scikit-learn基础介绍1.1 估计器(Estimator)估计器,很多时候可以直接理解成分类器,主要包含两个函数:fit():训练算法,设置内部参数。接收训练集和类别两个参数。 predict():预测测试集类别,参数为测试集。 大多数scikit-learn估计器接收和输出的数据格式均为numpy数组或类似格式。1.2 转换器(Transform...

2018-09-21 18:23:12 1492

转载 scikit-learn:CountVectorizer提取词频

http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html#sklearn.feature_extraction.text.CountVectorizer sklearn.feature_extraction.text.CountVectorize...

2018-09-21 17:06:27 3347

转载 Scikit-learn学习

python机器学习实践与kaggle实战Sklearn快速入门官方文档官方文档中文翻译sklearn 把所有机器学习的模式整合统一起来了,学会了一个模式就可以通吃其他不同类型的学习模式 步骤一般分为导入模块-创建数据-建立模型-训练-预测特征工程:在机器学习中,很重要的一步是对特征的处理,我们参考下文,先给出一些常用的特征处理方法在sklearn中的用法使用skl...

2018-09-20 16:07:14 321

转载 Numpy/pandas/matplot 主要函数

一:numpynumpy中文教程官方文档Numpy是一个用于进行数组运算的库 Numpy中最重要的对象是称为ndarray的N维数组类型 一般使用如下语句导入:import numpy as np 创建数组:numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)...

2018-09-20 14:54:35 547

转载 搭建Zookeeper分布式集群

 转自:https://blog.csdn.net/xxssyyyyssxx/article/details/72152474可参考:https://www.cnblogs.com/biehongli/p/7650570.html 一、集群节点安装和配置1、 修改操作系统的/etc/hosts 文件,添加 IP 与主机名映射:# zookeeper cluster ...

2018-08-31 16:52:09 364

转载 docker容器/宿主机文件交互

1、从容器里面拷文件到宿主机?     答:在宿主机里面执行以下命令             docker cp 容器名:要拷贝的文件在容器里面的路径       要拷贝到宿主机的相应路径      示例: 假设容器名为testtomcat,要从容器里面拷贝的文件路为:/usr/local/tomcat/webapps/test/js/test.js,               ...

2018-08-30 16:45:22 821

转载 python-生成HTMLTestRunner测试报告

 转自:https://blog.csdn.net/galen2016/article/details/73251240一、安装HTMLTestRunnerHTMLTestRunner 是 Python 标准库的 unittest 模块的一个扩展,它可以生成 HTML的 测试报告。 首先要下 HTMLTestRunner.py 文件,将下载的文件放入…\python\Lib目...

2018-08-15 21:04:08 1682

转载 python sklearn ︱分类效果评估——acc、recall、F1、ROC、回归、距离

一、acc、recall、F1、混淆矩阵、分类综合报告1、准确率第一种方式:accuracy_score# 准确率import numpy as npfrom sklearn.metrics import accuracy_scorey_pred = [0, 2, 1, 3,9,9,8,5,8]y_true = [0, 1, 2, 3,2,6,3,5,9]accuracy...

2018-08-02 16:43:54 927

原创 Markdown 复杂表格

Markdown本身不提供单元格合并语法,可以使用html语法来实现。方法一:自己写html水平单元格的合并:colspan,即使一个单元格占多列的空间 纵向单元格的合并:rowspan,即使一个单元格占多行的空间&lt;html&gt;&lt;table&gt; &lt;tr&gt; &lt;td rowspan="2"&gt;真实情况&lt;/td&gt; ...

2018-08-01 14:47:53 2528

转载 python selenium打开新窗口,多窗口切换

# coding=utf-8from selenium import webdriverbrowser=webdriver.Firefox()browser.maximize_window() # 窗口最大化browser.get('https://www.baidu.com') # 在当前浏览器中访问百度# 新开一个窗口,通过执行js来新开一个窗口js='window.op...

2018-07-31 10:41:55 1772

数据分析_企业的贤内助.pdf

数据分析:企业的贤内助》章节逻辑清晰,从企业的一个个具化的需求出发,使读者对数据分析的了解循序渐进,将复杂的数据分析知识体系串成有机的整体;数据分析体系完整,从数据采集、数据清洗和加工,到战略数据分析、经营数据分析和投资数据分析等综合分析,最后到数据成果的精彩呈现均加以阐述,使读者完整了解到数据分析对企业各个环节的价值。书中的案例来源于企业经营的实际案例,实用性强,分析线索环环紧扣,分析方法细致严谨,数据展示简洁明了,难能可贵的是作者将自己多年在数据分析实际工作中的“解题”思路加以展现,为广大数据分析师们的实务工作提供了宝贵的借鉴。

2017-10-17

Python Cookbook(第3版)中文版.pdf

《Python Cookbook(第3版)中文版》介绍了Python应用在各个领域中的一些使用技巧和方法,其主题涵盖了数据结构和算法,字符串和文本,数字、日期和时间,迭代器和生成器,文件和I/O,数据编码与处理,函数,类与对象,元编程,模块和包,网络和Web编程,并发,实用脚本和系统管理,测试、调试以及异常,C语言扩展等。

2017-10-17

mysql必知必会.pdf

mysql必知必会(完整版)

2017-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除