- 博客(15)
- 收藏
- 关注
原创 win10 IPV6无法使用的解决方案
可能行的方法1:WIN+R 打开运行窗口,运行 services.msc 命令,在新开的窗口里面,找到 IP Helper 项,开启这个服务,问题就解决了。可能行的方法2:ipconfig /renew6
2021-06-22 11:13:00 3345
原创 Pytorch引发的Segmentation fault (core dumped)
调试一个用到 pytorch 的程序的时候发现一个问题,经过排查发现是如下原因导致,执行如下代码:import networkx as nx忘了之前在哪遇到过类似的问题,好像是 import 的先后顺序导致的。改为如下导入顺序问题解决:import torchimport netwokx as nx #放在torch的后面导入即可奇奇怪怪的毛病。...
2021-05-29 21:20:00 2064
原创 Colab中安装RDkit
方案一:!wget -c https://repo.anaconda.com/miniconda/Miniconda3-py38_4.9.2-Linux-x86_64.sh!chmod +x Miniconda3-py38_4.9.2-Linux-x86_64.sh!time bash ./Miniconda3-py38_4.9.2-Linux-x86_64.sh -b -f -p /usr/local!time conda install -q -y -c conda-forge rdkit==2
2021-05-26 13:42:26 435
原创 Python安装PyQt5解决“DLL load failed”问题
没想到装个PyQt5还这么费劲,在问题解决之前我的系统配置是Win7-64位,Anaconda(64bit)装的python36,PyQt5(64bit)是5.11版本。每次在执行导入库时出现如下错误:网上的给出的解决方案很多,流传最为广泛的就是下载原生的python36,安装,然后复制里面的python3.dll到Anaconda目录下,这个办法解决了很多人的问题,但是对于我来说,然并卵...
2019-03-12 09:46:19 3366
原创 持久化(保存)机器学习模型
保存模型的方法保存模型比较时髦的方式是使用python的一下两个包:Pickle(python对象序列化库,自带) Joblib(scikit-learn中实现的方法)本文只讲pickle.哪些东西可以Pickle化?能Pickle的:所有数字相关的数据类型,复数也行. 布尔型数据. Python中的字符,列表,元组和字典. 内置函数和类对象.不能Pickle的...
2019-03-04 19:38:59 635
原创 常用特征选择方法及python代码
特征选择数据集中存在大量冗余的变量时不仅有损模型性能,而且还会带来建模成本的提升,因此,进行特征选择还是很有必要的。进行特征选择最起码会带来一下三方面的好处:减少过拟合几率:冗余数据少了,基于噪音数据做决策的几率也就少了. 提升准确度: 烂数据少了,好数据拟合好模型那是当然了. 减少模型训练时长: 数据量少了,计算机吃的少了,跑的就快乐.机器学习中的特征选择下面介绍四种特征选...
2019-03-04 14:53:38 11519 3
原创 绘制sklearn分类结果图
想解决这样一个问题:怎样使用matplotlib画出scikit-learn的分类报告,也就是 classification_report的输出。例如下面这个report:print('\n*Classification Report:\n', classification_report(y_test, predictions), confusion_matrix_graph =...
2019-03-03 19:56:41 4276
原创 Pandas中类别型变量映射为数字或其它值
在机器学习中对于有序的类别型变量可以不采用onehot编码,直接使用有序数字代替即可,这个目的可以在pandas中使用map方法实现。import pandas as pd创建数据框raw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'], 'last_name': ['Miller',...
2019-03-03 17:07:37 5522
转载 分类问题中的混淆矩阵(confusion matrix)
sklearn输出的评价矩阵# algorithm1:LogisticRegressionfrom sklearn import metricsfrom sklearn.linear_model import LogisticRegressionmodel = LogisticRegression()model.fit(X, y)print(model)# make p...
2019-03-01 15:41:55 3843
原创 对数据集类别不平衡,重采样和权重的一些探讨
非平衡数据对算法的影响及应对措施。首先加载数据集,并拆分训练集和测试集。 数据集在这里下载:数据集下载.(信用卡欺诈比赛).import numpy as npimport pandas as pdfrom sklearn.preprocessing import RobustScalerfrom sklearn.model_selection import train_test_...
2019-03-01 14:06:40 4938 3
原创 本地访问Linux服务器上的jupyter notebook
使用工具:Xshell作为终端,Xmanager打开Linux图形浏览器. 首先服务器上要先装好Anaconda.1. 生成配置文件jupyter notebook --generate-config这样就生成了.jupyter/jupyter_notebook_config.py配置文件.2. 打开python,生成密钥:>>>from notebook...
2019-02-28 10:53:18 3144
原创 LightGBM综述
根据以往的经验梯度提升树(gradient boosted tree)可谓横扫Kaggle,不使用GBT感觉都没法再Kaggle混了。决策树相对深度学习来说可谓优点多多:好理解,易解释,对非平衡数据友好,训练起来快等等。在本文中我们主要来了解下LightGBM这个框架并用Kaggle的实战数据来操练下。数据集在这:credit card fraud detection.LightGBM...
2019-02-28 09:46:10 2049
原创 运行python脚本的方法汇总
作为Python开发人员构建所需的最重要技能之一是能够运行Python脚本和代码。这将是了解代码是否按计划运行的唯一方法。这甚至是了解代码是否正常工作的唯一方法!本文涉及如下四种运行python代码的方式:操作系统的命令行工具 Python的交互式模式 IDE或者你最喜欢的文本编辑器 系统的文件管理系统,通过双击脚本图标执行脚本 vs 模块脚本通常指代包含逻辑顺序序列或批处理的...
2019-02-24 16:44:58 1713
原创 使用super()加持python类
虽然Python是一种纯粹的面向对象的语言,但它足够灵活,功能强大,足以让我们使用面向对象的范例构建应用程序。 Python实现这一目标的方法之一是支持继承,它与super()一起联用。super()函数super()返回超类的临时对象,然后允许我们调用该超类的方法。你为什么要这样做呢?它的用处超出你的想象,最常见的用例是扩展先前构建的类的功能。使用super()调用以前构建的方法...
2019-02-23 22:01:41 281
翻译 数据科学库之Pandas
在我看来,对于Numpy以及Matplotlib,Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy(会在接下来的帖子中提及)当然是另一个主要的也十分出色的科学计算库,但是我认为前三者才是真正的Python科学计算的支柱。导入Pandas我们首先要导入我们的演出明星——Pandas。import pandas as pd # 标准导入格式Pandas的数...
2019-02-23 16:53:52 171
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人