自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器不爱学习

机器不爱学习的艰苦学习历程

  • 博客(15)
  • 收藏
  • 关注

原创 win10 IPV6无法使用的解决方案

可能行的方法1:WIN+R 打开运行窗口,运行 services.msc 命令,在新开的窗口里面,找到 IP Helper 项,开启这个服务,问题就解决了。可能行的方法2:ipconfig /renew6

2021-06-22 11:13:00 3345

原创 Pytorch引发的Segmentation fault (core dumped)

调试一个用到 pytorch 的程序的时候发现一个问题,经过排查发现是如下原因导致,执行如下代码:import networkx as nx忘了之前在哪遇到过类似的问题,好像是 import 的先后顺序导致的。改为如下导入顺序问题解决:import torchimport netwokx as nx #放在torch的后面导入即可奇奇怪怪的毛病。...

2021-05-29 21:20:00 2064

原创 Colab中安装RDkit

方案一:!wget -c https://repo.anaconda.com/miniconda/Miniconda3-py38_4.9.2-Linux-x86_64.sh!chmod +x Miniconda3-py38_4.9.2-Linux-x86_64.sh!time bash ./Miniconda3-py38_4.9.2-Linux-x86_64.sh -b -f -p /usr/local!time conda install -q -y -c conda-forge rdkit==2

2021-05-26 13:42:26 435

原创 Python安装PyQt5解决“DLL load failed”问题

没想到装个PyQt5还这么费劲,在问题解决之前我的系统配置是Win7-64位,Anaconda(64bit)装的python36,PyQt5(64bit)是5.11版本。每次在执行导入库时出现如下错误:网上的给出的解决方案很多,流传最为广泛的就是下载原生的python36,安装,然后复制里面的python3.dll到Anaconda目录下,这个办法解决了很多人的问题,但是对于我来说,然并卵...

2019-03-12 09:46:19 3366

原创 持久化(保存)机器学习模型

保存模型的方法保存模型比较时髦的方式是使用python的一下两个包:Pickle(python对象序列化库,自带) Joblib(scikit-learn中实现的方法)本文只讲pickle.哪些东西可以Pickle化?能Pickle的:所有数字相关的数据类型,复数也行. 布尔型数据. Python中的字符,列表,元组和字典. 内置函数和类对象.不能Pickle的...

2019-03-04 19:38:59 635

原创 常用特征选择方法及python代码

特征选择数据集中存在大量冗余的变量时不仅有损模型性能,而且还会带来建模成本的提升,因此,进行特征选择还是很有必要的。进行特征选择最起码会带来一下三方面的好处:减少过拟合几率:冗余数据少了,基于噪音数据做决策的几率也就少了. 提升准确度: 烂数据少了,好数据拟合好模型那是当然了. 减少模型训练时长: 数据量少了,计算机吃的少了,跑的就快乐.机器学习中的特征选择下面介绍四种特征选...

2019-03-04 14:53:38 11519 3

原创 绘制sklearn分类结果图

想解决这样一个问题:怎样使用matplotlib画出scikit-learn的分类报告,也就是 classification_report的输出。例如下面这个report:print('\n*Classification Report:\n', classification_report(y_test, predictions), confusion_matrix_graph =...

2019-03-03 19:56:41 4276

原创 Pandas中类别型变量映射为数字或其它值

在机器学习中对于有序的类别型变量可以不采用onehot编码,直接使用有序数字代替即可,这个目的可以在pandas中使用map方法实现。import pandas as pd创建数据框raw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller',...

2019-03-03 17:07:37 5522

转载 分类问题中的混淆矩阵(confusion matrix)

sklearn输出的评价矩阵# algorithm1:LogisticRegressionfrom sklearn import metricsfrom sklearn.linear_model import LogisticRegressionmodel = LogisticRegression()model.fit(X, y)print(model)# make p...

2019-03-01 15:41:55 3843

原创 对数据集类别不平衡,重采样和权重的一些探讨

非平衡数据对算法的影响及应对措施。首先加载数据集,并拆分训练集和测试集。 数据集在这里下载:数据集下载.(信用卡欺诈比赛).import numpy as npimport pandas as pdfrom sklearn.preprocessing import RobustScalerfrom sklearn.model_selection import train_test_...

2019-03-01 14:06:40 4938 3

原创 本地访问Linux服务器上的jupyter notebook

使用工具:Xshell作为终端,Xmanager打开Linux图形浏览器. 首先服务器上要先装好Anaconda.1. 生成配置文件jupyter notebook --generate-config这样就生成了.jupyter/jupyter_notebook_config.py配置文件.2. 打开python,生成密钥:>>>from notebook...

2019-02-28 10:53:18 3144

原创 LightGBM综述

根据以往的经验梯度提升树(gradient boosted tree)可谓横扫Kaggle,不使用GBT感觉都没法再Kaggle混了。决策树相对深度学习来说可谓优点多多:好理解,易解释,对非平衡数据友好,训练起来快等等。在本文中我们主要来了解下LightGBM这个框架并用Kaggle的实战数据来操练下。数据集在这:credit card fraud detection.LightGBM...

2019-02-28 09:46:10 2049

原创 运行python脚本的方法汇总

作为Python开发人员构建所需的最重要技能之一是能够运行Python脚本和代码。这将是了解代码是否按计划运行的唯一方法。这甚至是了解代码是否正常工作的唯一方法!本文涉及如下四种运行python代码的方式:操作系统的命令行工具 Python的交互式模式 IDE或者你最喜欢的文本编辑器 系统的文件管理系统,通过双击脚本图标执行脚本 vs 模块脚本通常指代包含逻辑顺序序列或批处理的...

2019-02-24 16:44:58 1713

原创 使用super()加持python类

虽然Python是一种纯粹的面向对象的语言,但它足够灵活,功能强大,足以让我们使用面向对象的范例构建应用程序。 Python实现这一目标的方法之一是支持继承,它与super()一起联用。super()函数super()返回超类的临时对象,然后允许我们调用该超类的方法。你为什么要这样做呢?它的用处超出你的想象,最常见的用例是扩展先前构建的类的功能。使用super()调用以前构建的方法...

2019-02-23 22:01:41 281

翻译 数据科学库之Pandas

在我看来,对于Numpy以及Matplotlib,Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy(会在接下来的帖子中提及)当然是另一个主要的也十分出色的科学计算库,但是我认为前三者才是真正的Python科学计算的支柱。导入Pandas我们首先要导入我们的演出明星——Pandas。import pandas as pd # 标准导入格式Pandas的数...

2019-02-23 16:53:52 171

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除