自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据挖掘实战(三):特征工程-二手车交易价格预测

基本介绍重要性调参效果有限,特征工程的好坏决定最终的排名和成绩目的将数据转换为能更好地表示潜在问题的特征内容介绍(精华)说明:以下内容中,加粗的部分为实战中使用到的方法,有具体的实现代码,剩余的相关处理技术后续再补充上。常见的特征工程包括:异常处理:通过箱线图(或3-Sigma)分析删除异常值BOX-COX转换(处理有偏分布)长尾截断特征归一化/标准化:标准...

2020-03-27 20:40:03 838

原创 Task 2 数据挖掘实战-二手车交易价格预测-数据探索(EDA)

目录整体流程详细步骤1 载入库2 载入数据3 总览数据4 判断数据缺失值5 判断数据异常值6 了解预测值分布7 查看数据特征数字特征(连续)类别特征(离散)8 生成数据报告整体流程数据探索,Exploratory Data Analysis, EDA统计层面分析缺失值处理异常值处理Label分析特征分析详细步骤1 载入库warnings包,忽视警告使用missingn...

2020-03-24 18:17:45 501

转载 Task 1 天池赛 - 二手车交易价格预测

1 赛题概况1.1 概况赛题以预测二手车的交易价格为任务。1.2 数据概况该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取15万条作为训练集,5万条作为测试集A,5万条作为测试集B,同时会对name、model、brand和regionCode等信息进行脱敏。1.3 评估指标本赛题的评价标准为MAE(...

2020-03-21 15:48:01 529

原创 《Excel最强功能-数据透视表》 网课笔记

E011-1 数据透视表的作用快速统计汇总拆分表格动态排序(切片器)表格中图形展示分组统计合并多个工作表数据

2020-02-02 22:26:43 1906

原创 window中osmnx包的详细安装过程

环境win10 64位python3.7安装使用pip安装到Python Extension下载下图所示的whl文件,网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/安装顺序pip install geospip install Shapely-1.6.4.post2-cp37-cp37m-win_amd64.whl...

2020-01-31 16:09:29 3340 4

原创 【教程】写CSDN博客时 调整图片大小,图片居中

复制下面的代码,将src参数后面的链接,替换成你自己的图片链接。其中:align参数:控制图片的位置width参数:控制图片缩放程度src参数:图片的网络链接(上传到CSDN生成网络链接)<div align=center><img src="https://img-blog.csdnimg.cn/20191230145513916.png" width="60%" ...

2019-12-30 15:41:10 303

原创 【学习笔记】吴恩达机器学习 WEEK2 线性回归 & Octave教程

Multivariate Linear RegressionMultiple FeaturesXj(i)X_j^{(i)}Xj(i)​ 表示第 i 个训练样本的的第 j 个值转换原来:hθ(x)=θ0+θ1x1+θ2x2+⋯+θnxnh_{\theta}(x)=\theta_{0}+\theta_{1} x_{1}+\theta_{2} x_{2}+\cdots+\theta_{n...

2019-12-30 15:37:19 155

原创 【学习笔记】吴恩达机器学习 WEEK1

Introduction机器学习算法分类监督学习 Supervised learning无监督学习 Unsupervised learning监督学习回归 regressionmap input variables to some continuous function分类 classificationmap input variables into discrete ...

2019-12-28 21:09:22 157

原创 【学习笔记】吴恩达机器学习 WEEK 0

资源地址课程地址:https://www.coursera.org/learn/machine-learning/home/welcomeGIthub上的Python代码:https://github.com/kaleko/CourseraMLAndrew建议阅读研究论文在机器学习领域开创事业...

2019-12-22 17:05:45 95

原创 PyTorch机器学习从入门到实战-CH2

PyTorch安装和快速上手基础安装和工具使用安装Anaconda3,内置python3.7启动Jupyter Notebook命令终端输入:jupyter notebook命令运行后,浏览器输入:http://loaclhost:8888Numpy基础知识numpy:对数组的快速操作numpy包核心对象是ndarrary,封装了相同数据类型的n维数组numpy中维度叫做轴...

2019-12-22 16:32:34 389

原创 【学习笔记】《数据挖掘:理论与算法》CH5 支持向量机

支持向量机 Support Vector Machines线性分类在原始空间做一个映射,在新的空间中进行分类(线性分类器,分类的时候保持margin最大)Margin间隔:能够偏离的距离值越大,容错能力越强求解:2/|w|Support Vector正好卡住分界面的点两者关系Support Vector决定移动的范围,范围的大小叫做Margin目标把样本分对yi(w⋅...

2019-12-22 15:41:48 210

原创 【学习笔记】贪心科技AI体验课

biji

2019-12-21 16:51:19 1108

原创 【教程】Jupyter notebook基本使用教程

运行安装好jupyter后,在终端输入jupter notebook回车后,会输出jupyter扩展的路径jupyter notebook的安装目录默认的文件夹运行的网络地址将网络地址复制,粘贴到浏览器中,即可使用jupyter notebook修改默认文件夹打开默认文件夹目录找到下述的两个文件夹打开jupyter_notebook_config.py,进行如下修改...

2019-12-20 18:39:02 620

原创 【学习笔记】《数据挖掘:理论与算法》CH4神经网络

神经网络:巨量并行,智慧无限神经元(感知机,Perceptrons),注意常数项w0,不然总是经过原点如何设置和调整感知机输入的权重?梯度下降法,知错就改法(Stochastic Learning)如何解决线性不可分问题?线性不可分:一根线无法分出来类别解决办法:多层感知机,把原始问题转化,将不可分转化为可分The Sigmoid Threshold Unitsigmoid函数...

2019-12-19 20:58:50 229

原创 【学习笔记】《数据挖掘:理论与算法》CH3 从贝叶斯到决策树

分类问题分类是一种有监督的学习贝叶斯定理:头痛和流感的关系朴素贝叶斯分类为何朴素?需要假设条件独立何为条件独立?肺癌和性别的关系,不能简单说男性得肺癌的概率大于女性,需要考虑得肺癌的条件:抽烟,在抽烟的情况下,得肺癌的概率大于不抽烟的情况。抛硬币问题,一枚正常硬币,一枚双面相同的硬币,抛硬币概率不同。独立不等于不相关避免出现概率为0?拉普拉斯平滑:样本加1应用...

2019-12-19 19:12:14 248

原创 PyTorch机器学习从入门到实践-CH1

深度学习介绍PyTorch:深度学习框架之一,以研究为核心的框架关系: 深度学习∈机器学习∈人工智能Kareas:一个深度学习接口,调用其他深度学习框架...

2019-12-04 08:35:23 276

原创 CentOS系统中使用yum快速安装python3

需求购买CentOS系统的云服务器后,发现系统内置的python版本为python2,而且目前多数Linux系统的云服务器中都内置的是python2,但是python2即将停止维护,又因为程序都是用python3写的,故有了在CentOS系统中安装python3的需求查阅资料一查在Linux系统中安装python3,很多都是源码安装,对我这样小白来说,看看了教程便直接放弃了……后来无意...

2019-08-24 07:17:25 1471

原创 录屏、直播中的鼠标键盘演示神器PointFocus

效果展示【文末有福利】需求使用OBS录屏的过程中,想要突出显示鼠标的位置,突出显示鼠标的点击解决方法一:设置简单、效果普通、功能单一点击“控制面板-鼠标-指针选项”,勾选“当按CTRL时显示指针的位置”,点击“应用-确定”设置完成后,按住键盘上的Ctrl键,便可以在鼠标的位置形成圆收缩的效果方法二:(推荐)使用PointFocus软件,设置简单、功能较多、效果较好具备的功能...

2019-08-23 15:16:53 13239

原创 pyinstaller打包python程序的常见问题

使用pyinstaller打包python程序时遇到的问题记录,问题已全部解决。解决方法详见 https://guangmujun.cn/archives/168shapely库相关问题:Unable to find "e:\github\forexe\venv\lib\site-packages\shapely\DLLs\geos.dll" when adding binary ...

2019-08-22 10:35:38 2690

原创 Markdown简明教程

Markdown教程文章目录Markdown教程介绍目录标题列表引用图片和链接粗体和斜体代码分割线表格公式介绍Markdown 是一种标记语言有很多编辑器支持Markdown语法这里推荐 Typora以下是常用MarkDown语法的整理目录在大标题下输入 [TOC] 然后按下回车即可自动生成目录标题#一级标题 ## 二级标题 以此类推列表-加空格生成无序列...

2019-08-14 11:33:56 480

原创 PicGo五分钟打造你的私人图床(稳定、快速、免费)

何为图床简单说,图床的输入是一张图片,输出是一个链接通过这个链接便可以随时随地的查看你输入的照片~为什么要使用图床呢?我个人的遇到的情况主要有两个(其实也就是一种情况):一个是项目文档上传到Github,项目文档中图片的显示;另一个是写博文时插入和显示图片如果不使用图床,那我就需要把图片上传到Github或者博客中,然后再到原文中,用上传得到的链接一个一个把原有的图片替换掉,十分麻烦…...

2019-07-23 08:57:35 1208

原创 快速使用GitBook以及二级标题的设置

快速使用GitBook以及二级标题的设置安装node -v查看是否安装node.js , 命令行输入上述命令,出现版本号则已安装,否则无https://nodejs.org/en/安装node.js,从官网下载安装npm install gitbook-cli -g安装GitBook, 命令行输入上述命令gitbook -V查看是否安装成功,命令行输入上述命令,出...

2019-07-12 15:23:07 452

原创 Pyinstaller将Python程序打包成EXE(多种模式的打包)

Pyinstaller将Python程序打包成EXE文章目录Pyinstaller将Python程序打包成EXE安装整体流程参数说明单一PY文件包含数据文件多个PY文件多进程打包问题记录参考安装pip install pyinstaller整体流程pyi-makespec xxx.py # 先生成spec文件pyinstaller xxx.spec # 再生成exe文件...

2019-07-06 10:49:15 698

原创 OBS显示器捕获黑屏的解决方法

OBS显示器捕获黑屏的解决方法(win10)问题描述打开OBS后,新建场景、新建显示器捕获后,黑屏没有显示,即使点击开始录制然后结束录制后,录制的视频仍然是黑屏。解决方法桌面右击,选中NVIDIA控制面板,跳出右面所示的界面,选择程序设置在选择要自定义的程序中选择OBS,在为此程序选择首选图形处理器中选择第二项或者第三项,建议自己尝试一下上述两个选项选择好后,记得点击应用,等待...

2019-06-12 15:59:17 33514 1

原创 GitHub的初次使用记录

GitHub使用学习第一次使用GitHub官网注册账号Git for Windows软件下载,使用命令行操作GitHub开源社交平台企业项目管理平台专有名词repositoty 项目仓库fork 复制别人的代码库GitHub的作用团队协作写一个文档搭建个人博客、网站协作翻译项目管理优质资源主要功能:版本控制本地版本控制与GitHub关联GitHub...

2019-03-22 17:50:03 114

原创 NoteExpress两分钟极速上手教程

使用目的:NoteExpress可方便的管理参考文献,在进行论文写作时,可快速插入文献阅读笔记和参考文献内容效果展示:使用步骤:S1: 打开软件,新建数据库,在题录下新建文件夹S2: 从知网导出NoteExpress格式的题录S3: 在NoteExpress中导入题录S4: 为题录添加下载好的文献作为附件S5: 在NoteExpress中阅读文献,做笔记S6: 在wo...

2019-03-01 17:17:16 14041

原创 从国内的源使用pip安装库,提高安装速度

使用命令参考如下pip install xxx -i https://xxxx例如使用清华大学的源(https://pypi.tuna.tsinghua.edu.cn/simple) 安装pandas库pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple国内的源:清华大学:https://pypi.tuna.ts...

2019-02-12 15:21:01 304

原创 Linux系统安装python3和创建python3虚拟环境

Python3安装参考https://www.cnblogs.com/kimyeee/p/7250560.html按照步骤安装完成后,进入虚拟环境,pip install xxx ,安装某个第三方库测试一下是否成功,如果报错与TLS/SSL相关,参考文章最后的操作。创建Python3虚拟环境使用python3解释器,创建虚拟环境virtualenv -p /usr/bin/pyth...

2019-02-07 12:08:19 1571

原创 python中os.listdir()的使用和文件批量重命名方法

作用返回指定文件夹路径下的文件名称列表用法path_name = './image' #文件夹路径files = os.listdir(path_name) #路径下的文件名称列表注意返回的files列表中,文件是乱序放置的排序在上述代码后,加上files.sort(key=lambda x:int(x[:-4]))上述代码意思是:对于文件名称,按照从右往左数第四...

2019-02-07 12:01:40 848

原创 Git/码云上多人协作,创建分支,上传修改

1.为项目创建分支可直接在网页上进行管理操作2.克隆一个项目git clone https://gitee.com/xxxxx/xxx.git3.创建本地分支cd 进入目录文件夹git checkout -b branch-name origin/branch-name(branch-name是第一步骤中创建的分支名称)4.上传修改git add .git commit -...

2018-12-12 14:39:32 1796

原创 git/码云上关于项目的一些操作:初始化、克隆、上传修改等

1.本地初始化一个项目git config --global user.name "your_name"git config --global user.email "your_email"git init git remote add origin https://gitee.com/xxxxx/xxx.git (项目的地址)git pull origin mastergit ad...

2018-12-01 15:40:26 339

原创 上传到GitHub或者码云中README文件无法显示图片

MarkDown语法插入图片的语法如下:![alt text](E://data./pic.jp)类似这样,[]中输入文本,当图片显示不出时显示此文本信息,()中输入存放图片的路径。无法显示原因本地插入图片时,图片的路径为本地的路径,如为E://data.pic.jpg或者./data/pic.ipg等,当README文件上传到网络中,无法读取如上述所示的路径。解决方法将图片...

2018-11-17 20:04:19 5054

原创 微信小程序中显示空格

如下:&lt;text decode="{{true}}"&gt;书名:&amp;ensp;&amp;ensp;&amp;ensp;&amp;ensp;&lt;/text&gt;注意:必须在&lt;text&gt;中&amp;ensp;表示空格,占中文字符一半的大小还可用&amp;emsp;和&amp;nbsp;表示不同大小的空格...

2018-11-12 09:31:35 1479

转载 按钮悬浮固定在微信小程序底部

 http://mydown.yesky.com/news/87296687.html本章节主要介绍了如何将操作按钮悬浮固定在微信小程序底部?操作起来也比较简单,还不会的朋友一起跟着小编学习一下吧,希望对你们有所帮助。  常见的有加入购物车按钮、结算按钮、收货列表添加地址按钮。  以收货地址为例,将添加地址按钮悬浮于最底部,这...

2018-11-12 09:25:23 2020

原创 微信小程序页面间传递json数据

1.页面跳转函数wx.navigateTo(Object object)保留当前页面,跳转到应用内的某个页面。但是不能跳到 tabbar 页面。使用 wx.navigateBack 可以返回到原页面。示例代码:wx.navigateTo({ url: 'test?id=1'})wx.navigateTo({ url: 'test?id='+value})其中test为要...

2018-11-12 09:22:35 3339

原创 ArcGIS快速裁剪栅格数据

所遇问题:从一张全球的栅格数据集中大致裁剪出亚洲区域的栅格数据集软件操作:在ArcMap中按如下顺序进行点击最后双击“裁剪”,在出现的界面中进行如下操作点击确定后,等待一小会,便得到裁剪后的栅格数据集...

2018-11-06 16:45:43 4820

原创 python中打印zip()函数结果和zip()函数的使用

在python 3.0中zip()是可迭代对象,使用时必须将其包含在一个list中,方便一次性显示出所有结果。&gt;&gt;&gt; t = ['a','b','c']&gt;&gt;&gt; m = [5,4,9]&gt;&gt;&gt; zip(t,m)&lt;zip object at 0x0000014A7734FB08&gt;&gt;&gt;&gt; list(zip(t,m

2018-11-01 21:54:31 7887

原创 sklearn中cross_validation包无法使用

情况描述:想要从sklean.cross_validation中引入train_test_split,代码运行后出现一下问题提示不存在sklean.cross_validation模块解决方法:从sklearn.model_selection引入train_test_split即可...

2018-11-01 21:45:51 34146 2

转载 python pandas.DataFrame选取、修改数据

文章转载自: https://blog.csdn.net/AlanGuoo/article/details/52331901 相信很多人像我一样在学习python,pandas过程中对数据的选取和修改有很大的困惑(也许是深受Matlab)的影响。。。到今天终于完全搞清楚了!!!先手工生出一个数据框吧import numpy as npimport pandas as pddf...

2018-11-01 14:05:00 6306

转载 pandas中to_csv()和read_csv()参数详解

pandas.read_csv参数整理&nbsp;读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer&nbsp;: str,pathlib。str, pathlib.Path, py._path.loc...

2018-11-01 13:59:20 4845

《Geoprocessing with python》第九章数据

《Geoprocessing with python》书籍的第九章部分数据 osgeopy-data-landsat-washington.zip

2018-11-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除