自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一起学习机器学习第一章

实时记载我每一天的进步,愿你我一起进步

  • 博客(29)
  • 资源 (17)
  • 收藏
  • 关注

原创 Windows下某度翻译接口加密问题

问题:1.本人在使用翻译时存在sign不一致问题2.整理了两天,最后发现是execjs包计算方法与js计算方法不同导致。3.不问博主说是需要使用nodejs去解决,奈何对nodejs不是很熟,所以尝试了半天发现做了点无用功。在此写下此文章,赠与有缘人,希望早日脱离我遇到的苦海。(如果有所帮忙谢谢点赞)1.安装nodejs。安装网址:Node.js1.安装步骤请结合Node.js 安装配置 | 菜鸟教程2.安装测试完js运行无误以后,开始下述步骤2.设置js文本(sign加密算

2022-02-09 18:14:18 897

原创 Selenium如何让启动的浏览器和手动启动的浏览器信息一致

最近在做爬虫,主要使用过了selenium包,但是发现selenium包直接调用本地浏览器,启动的是一个全新的(与手动打开的不一致),很多网站可以检测到,为了避免这个坑,给碰到相同问题的同伴提供思路,写下此文,希望对大家有所帮助。1.打开谷歌浏览器;2.在搜索框直接输入chrome://version/,找到“个人资料路径”;注意:不要复制Default。3.代码from selenium import webdriveroption = webdriver.ChromeOpt

2021-03-31 20:34:53 3759 4

原创 Word中MathType不能正常使用解决方法

本人使用的是word2010+MathType,可以正常使用了。首先介绍下,本人首先使用的word2007,然后装mathtype6.9,装上以后发现,公式编号啥的都不能使用(灰色的),然后自己鼓捣半天,废了半天劲,网上找各种解决方法,说把几个文件复制到word的SETUP中,尝试了半天还不行。后来卸了2007,装了2010,发现还是不行,有点奔溃,折腾了半天,后来发现还是不行。后来无意中...

2018-10-21 11:08:54 34060 81

原创 利用鸢尾花数据,解释并不是特征越多越好

#首先导入我们需要的包from sklearn import datasetsimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import Perceptro...

2018-05-21 18:29:24 1601 2

原创 Linux常用命令

1.Linux中用户切换命令:su 用户名 回车以后输入用户名对应的密码即可如果先要切换到Root用户可以使用:su - 然后回车即可(需要输入root密码)由root用户到其他用户可以直接su 用户名即可(无需输入密码)2.常用命令:...

2018-04-11 14:47:37 150

原创 Python机器学习小案例源码 -- 骨科疾病预测

#内容为实现小象学院的相关代码#数据连接https://www.kaggle.com/uciml/biomechanical-features-of-orthopedic-patientsimport pandas as pdimport numpy as npimport seaborn as snsimport matplotlibimport matplotlib.pyplot as plt...

2018-04-03 16:30:10 1180 2

原创 Anaconda如何安装包

如果安装Anaconda,大家会发现很多包已经安装好了,但是如果我们想要安装新包,我们会发现pip install 包名无法安装,或者安装以后无法使用。接下来,跟上脚步,本人自己亲测:1.找到如图所示的                                 2.打开Anaconda Prompt,然后在里面输入conda install 包名即可安装。安装完你需要的包以后

2018-01-10 11:01:08 35282 1

原创 python 3.x 结巴(jieba)分词基础知识

# -*- coding: utf-8 -*-from __future__ import unicode_literalsimport syssys.path.append("../")import jiebaimport jieba.possegimport jieba.analyse#分词seg_list = jieba.cut

2017-12-19 15:59:05 1151

原创 python3.x正则表达式的含义及使用

import reimport nltk#正则表达式wordlist = [w for w in nltk.corpus.words.words('en') if w.islower()]print(wordlist)#查找ed结尾的词汇print([w for w in wordlist if re.search('ed$', w)])#匹配:8个字母,第3个

2017-12-13 16:52:51 403 1

原创 python3.x如何从互联网获取想要的文章,及转化为nltk可以处理的文本

from urllib.request import urlopenfrom bs4 import BeautifulSoupfrom nltk import word_tokenizeimport nltk#2种方式解析HTML中的文本url = "http://news.bbc.co.uk/2/hi/health/2284783.stm"html = urlopen(u

2017-12-13 11:12:31 539

原创 python3.X 自然语言处理基础知识

import nltknltk.download()#下载nltk语料库如果没有安装nltk,请在cmd下用批 pip install nltk进行安装from nltk.book import  *###搜索文本#搜索单词text1.concordance("monstrous")text2.concordance("affection")text3.

2017-11-22 14:14:57 1191

原创 使用原始的Titanic数据,通过特征筛选,一步步提升性能(特征如何提取)

# coding=gbk#使用Titanic数据集,通过特征筛选的方法一步步提升决策树的预测性能import pandas as pdfrom sklearn.cross_validation import train_test_split , cross_val_scorefrom sklearn.feature_extraction import DictVectorizer 

2017-11-09 17:35:18 506

原创 使用CountVectorizer和TfidfVectorizer对fetch_20newsgroups数据进行分类,并对是否使用停用词进行对比(精确度)

from sklearn.datasets import fetch_20newsgroupsfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mul

2017-11-09 10:27:07 1468

原创 K-means算法--“肘部”观察法用于粗略的估计合理的类簇个数

'''K-means聚类模型所采用的迭代算法,直观易懂,并且非常实用,但是有俩大缺陷。1,容易收敛到局部最优。2需要预先设定簇的数量(因为开始无法准确的确定簇的数量,可以采用“肘部“观察法去大致估计簇的数量)'''import numpy as npfrom sklearn.cluster import KMeansfrom scipy.spatial.distance imp

2017-11-07 11:19:11 4139

原创 K-Means算法过程及代码实现,并对结果使用ARI进行评估

'''K-means算法过程及代码实现1.首先,随机布置K个特征空间内的点作为初始的聚类中心2.然后,对于根据每个数据的特征向量,从K个聚类中心中寻找距离最近的一个,并且把该数据标记为从属这个聚类中心3.接着,在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心做计算4.如果一轮下来,所有的数据点从属的聚类中心与上一次的分配的类簇没有变化,那么可以迭代停

2017-11-03 11:24:06 3817

原创 集成模型(回归)对Boston数据进行训练并对数据做出预测

from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.ensemble import RandomForestRegressor,Ex

2017-11-02 16:23:23 2058

原创 利用回归树对Boston房价进行预测,并对结果进行评估

from sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.metrics import mean_squared_error,

2017-11-02 10:56:40 4298 1

原创 K近邻回归模型对Boston房价进行预测,同时对性能进行评估(1.使用普通的算术平均法2.考虑距离差异进行加权平均)

from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsRegressorfr

2017-11-02 10:24:07 1114

原创 使用三种不同的核函数(回归)对Boston房价进行预测,同时对测试数据做出预测

from sklearn.datasets import load_bostonfrom sklearn.svm import SVRfrom sklearn.cross_validation import train_test_splitfrom sklearn.metrics import r2_score,mean_squared_error,mean_absolute_erro

2017-11-01 08:48:26 3904

原创 使用线性回归模型LinearRegression和SGDRegression分别对美国波士地区房价进行预测

from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitimport numpy as npfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import

2017-10-30 17:26:18 1928

原创 利用随机森林和梯度替身决策树对titanic数据进行分类,并对结果进行分析

import pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.ensembl

2017-10-30 15:45:07 891

原创 集成分类模型简介

集成分类器主要分为俩种:1.利用相同的训练数据同时搭建多个独立的模型,然后通过投票的方式,以少数服从多数的原则作出最终的分类决策。具有代表性的模型有随机森林分类器(Random Forest Classifier),它是在相同的数据上同时搭建多棵决策树(Decision Tree),与普通的决策树不同的是,普通的决策树会根据每个维度对预测结果的影响程度进行排序(通过采用信息熵),进而决定不同特

2017-10-30 10:00:23 1984

原创 利用DecisionTree对titanic数据进行分类

import pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.metrics

2017-10-26 19:45:38 474

原创 利用KNC对iris数据进行分裂及预测

from sklearn.datasets import load_irisfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierfro

2017-10-26 14:30:33 278

原创 利用贝叶斯分类器对fetch_20newsgroups数据集进行分类

from sklearn.datasets import fetch_20newsgroupsfrom sklearn.cross_validation import train_test_splitfrom  sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mu

2017-10-26 08:54:44 3263

原创 利用SVC(Support Vector Classifier)对digits数据进行分类

from sklearn.datasets import load_digitsfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.svm import LinearSVCfrom sklearn.metri

2017-10-25 14:29:03 1298

原创 使用LogisticRegression和SGDClassifier对良/恶性肿瘤进行分类,并计算出准确率召回率和F1的值

# -*- coding: utf-8 -*-"""Created on Tue Oct 24 10:08:40 2017@author: liuyajun"""import pandas as pdimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom

2017-10-24 16:55:01 1567

原创 对良/恶性肿瘤的预测python代码实现

import pandas as pdimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.linear_model import LogisticRegressiondf_train = pd.read_csv(r'E:\BaiduNetdiskDownload\Datasets\Breast-Canc

2017-10-23 17:20:58 3376 7

原创 如何在去掉空数据及如何在matplotlib中显示数据线性拟合

自己自学机器学习用Python实现,希望志同道合的朋友加入我们一起学习一起进步。

2017-10-11 09:04:20 1965

Python自然语言处理书籍大全

内容为自然语言处理书籍,包括6本书,有Python自认语言处理,Python核心编程,统计自然语言处理等,需要的自己下载。如果有需要自然语言处理相关视频的,可以留言,免费分享,希望对你学习有帮助。

2018-06-03

利用Python进行数据分析(高清书籍+代码+数据)

内容包含数据分析书籍,数据和代码,其中代码是用Jupyter notebook所写,所以直接用Python无法打开,请自行安装相关软件,然后熟悉软件运行以后,上传代码,即可显示。祝进步

2018-05-15

机器学习实战(高清书籍,代码+数据)

内容为及其学习实战的高清书籍,还有配套的代码和数据,自己在用,感觉不错。如果有需要,自取,谢谢给个好评

2018-05-12

PyDev安装视频

该内容为PyDev的安装及调试的过程,一步一步实现,为Python基础内容的一部分,如果需要全部(内容太大,所以在网盘内),好评了和我联系,我会把剩下的分享给你

2017-11-08

机器学习书籍一大波

包含机器学习导论,Python机器学习,Python机器学习笔记,矩阵分析,机器学习实践指南,机器学习实战,神经网络与机器学习等书籍,若果你在学习机器学习,相信书籍值得你下载。。。别忘记给个好评

2017-11-07

机器学习的R实现.pdf

该内容为机器学习基础教程的书籍,高清完整,如果觉得不错给个好评,谢谢

2017-11-07

机器学习实战(高清书籍中英文俩本+配套代码及数据)

该内容包含机器实战中文英文书籍俩本,同时含有机器学习实战的源代码和数据,希望下载觉得有用给个好评,把好资源分享给更多人。

2017-11-02

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路数据

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路与书同步的数据,太大无法上传所以只能保存到网盘中,下载后里面有链接可以自己下载

2017-10-20

Deep Learning Book Chinese Translation

第一章、前言 第二章、线性代数 第三章、概率与信息 第四章 、数值计算 第五章、机器学习基础 第六章、深度前馈网络 第七章、深度学习的正则化 第八章、深度模型中的优化 第九章、卷积神经网络 第十章、序列建模:循环和递归网络 第十一章、实用方法 第十二章、应用 第十三章、linear factor 第十四章、自动编码 第十五章、表征学习 第十六章、结构概率模型 第十七章、monte carlo 方法 第十八章、面对区分函数 第十九章、近似推断 内容是分开的,在每个文件夹下面需要用notepad++或者浏览器打开

2017-10-17

Python机器学习

该书完整,一遍讲解理论后面紧跟代码,适合初学者,欢迎大家下载

2017-10-14

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路.pdf

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路.pdf 该书清晰完整,欢迎大家下载

2017-10-14

图解机器学习--完整版

图解机器学习完整版,内容清晰,完整,欢迎大家下载。。。

2017-10-14

机器学习-Mitchell-中文-清晰版

机器学习算法讲解,完整版,内容清晰,讲解清楚,值得学习..................................................................................................................................................................................................................

2017-09-21

GA工具箱,遗传算法

2017-04-20

MATLAB智能算法30个案例分析 源代码.rar

2017-04-20

Deep learning

2017-04-19

基于神经网络的数据挖掘方法研究

基于神经网络的数据挖掘方法研究

2017-04-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除