PolyAI-CSDN博客

原创 win10 IPV6无法使用的解决方案

可能行的方法1：WIN+R 打开运行窗口，运行 services.msc 命令，在新开的窗口里面，找到 IP Helper 项，开启这个服务，问题就解决了。可能行的方法2：ipconfig /renew6

2021-06-22 11:13:00 3345

原创 Pytorch引发的Segmentation fault (core dumped)

调试一个用到 pytorch 的程序的时候发现一个问题，经过排查发现是如下原因导致，执行如下代码：import networkx as nx忘了之前在哪遇到过类似的问题，好像是 import 的先后顺序导致的。改为如下导入顺序问题解决：import torchimport netwokx as nx #放在torch的后面导入即可奇奇怪怪的毛病。...

2021-05-29 21:20:00 2064

方案一：!wget -c https://repo.anaconda.com/miniconda/Miniconda3-py38_4.9.2-Linux-x86_64.sh!chmod +x Miniconda3-py38_4.9.2-Linux-x86_64.sh!time bash ./Miniconda3-py38_4.9.2-Linux-x86_64.sh -b -f -p /usr/local!time conda install -q -y -c conda-forge rdkit==2

2021-05-26 13:42:26 435

原创 Python安装PyQt5解决“DLL load failed”问题

没想到装个PyQt5还这么费劲，在问题解决之前我的系统配置是Win7-64位，Anaconda（64bit）装的python36，PyQt5(64bit)是5.11版本。每次在执行导入库时出现如下错误：网上的给出的解决方案很多，流传最为广泛的就是下载原生的python36，安装，然后复制里面的python3.dll到Anaconda目录下,这个办法解决了很多人的问题，但是对于我来说，然并卵...

2019-03-12 09:46:19 3366

原创持久化（保存）机器学习模型

保存模型的方法保存模型比较时髦的方式是使用python的一下两个包：Pickle(python对象序列化库，自带) Joblib(scikit-learn中实现的方法)本文只讲pickle.哪些东西可以Pickle化？能Pickle的：所有数字相关的数据类型，复数也行. 布尔型数据. Python中的字符，列表，元组和字典. 内置函数和类对象.不能Pickle的...

2019-03-04 19:38:59 635

原创常用特征选择方法及python代码

特征选择数据集中存在大量冗余的变量时不仅有损模型性能，而且还会带来建模成本的提升，因此，进行特征选择还是很有必要的。进行特征选择最起码会带来一下三方面的好处:减少过拟合几率:冗余数据少了，基于噪音数据做决策的几率也就少了. 提升准确度: 烂数据少了，好数据拟合好模型那是当然了. 减少模型训练时长: 数据量少了，计算机吃的少了，跑的就快乐.机器学习中的特征选择下面介绍四种特征选...

2019-03-04 14:53:38 11519 3

原创绘制sklearn分类结果图

想解决这样一个问题：怎样使用matplotlib画出scikit-learn的分类报告，也就是 classification_report的输出。例如下面这个report：print('\n*Classification Report:\n', classification_report(y_test, predictions), confusion_matrix_graph =...

2019-03-03 19:56:41 4276

原创 Pandas中类别型变量映射为数字或其它值

在机器学习中对于有序的类别型变量可以不采用onehot编码，直接使用有序数字代替即可，这个目的可以在pandas中使用map方法实现。import pandas as pd创建数据框raw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller',...

2019-03-03 17:07:37 5522

转载分类问题中的混淆矩阵(confusion matrix)

sklearn输出的评价矩阵# algorithm1:LogisticRegressionfrom sklearn import metricsfrom sklearn.linear_model import LogisticRegressionmodel = LogisticRegression()model.fit(X, y)print(model)# make p...

2019-03-01 15:41:55 3843

原创对数据集类别不平衡，重采样和权重的一些探讨

非平衡数据对算法的影响及应对措施。首先加载数据集，并拆分训练集和测试集。数据集在这里下载：数据集下载.（信用卡欺诈比赛）.import numpy as npimport pandas as pdfrom sklearn.preprocessing import RobustScalerfrom sklearn.model_selection import train_test_...

2019-03-01 14:06:40 4938 3

原创本地访问Linux服务器上的jupyter notebook

使用工具：Xshell作为终端，Xmanager打开Linux图形浏览器. 首先服务器上要先装好Anaconda.1. 生成配置文件jupyter notebook --generate-config这样就生成了.jupyter/jupyter_notebook_config.py配置文件.2. 打开python,生成密钥:>>>from notebook...

2019-02-28 10:53:18 3144

原创 LightGBM综述

根据以往的经验梯度提升树（gradient boosted tree）可谓横扫Kaggle，不使用GBT感觉都没法再Kaggle混了。决策树相对深度学习来说可谓优点多多：好理解，易解释，对非平衡数据友好，训练起来快等等。在本文中我们主要来了解下LightGBM这个框架并用Kaggle的实战数据来操练下。数据集在这：credit card fraud detection.LightGBM...

2019-02-28 09:46:10 2049

原创运行python脚本的方法汇总

作为Python开发人员构建所需的最重要技能之一是能够运行Python脚本和代码。这将是了解代码是否按计划运行的唯一方法。这甚至是了解代码是否正常工作的唯一方法！本文涉及如下四种运行python代码的方式:操作系统的命令行工具 Python的交互式模式 IDE或者你最喜欢的文本编辑器系统的文件管理系统，通过双击脚本图标执行脚本 vs 模块脚本通常指代包含逻辑顺序序列或批处理的...

2019-02-24 16:44:58 1713

原创使用super()加持python类

虽然Python是一种纯粹的面向对象的语言，但它足够灵活，功能强大，足以让我们使用面向对象的范例构建应用程序。 Python实现这一目标的方法之一是支持继承，它与super()一起联用。super()函数super()返回超类的临时对象，然后允许我们调用该超类的方法。你为什么要这样做呢？它的用处超出你的想象，最常见的用例是扩展先前构建的类的功能。使用super()调用以前构建的方法...

2019-02-23 22:01:41 281

翻译数据科学库之Pandas

在我看来，对于Numpy以及Matplotlib，Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy（会在接下来的帖子中提及）当然是另一个主要的也十分出色的科学计算库，但是我认为前三者才是真正的Python科学计算的支柱。导入Pandas我们首先要导入我们的演出明星——Pandas。import pandas as pd # 标准导入格式Pandas的数...

2019-02-23 16:53:52 171

机器不爱学习