459817216-CSDN博客

原创 Windows下某度翻译接口加密问题

问题：1.本人在使用翻译时存在sign不一致问题2.整理了两天，最后发现是execjs包计算方法与js计算方法不同导致。3.不问博主说是需要使用nodejs去解决，奈何对nodejs不是很熟，所以尝试了半天发现做了点无用功。在此写下此文章，赠与有缘人，希望早日脱离我遇到的苦海。（如果有所帮忙谢谢点赞）1.安装nodejs。安装网址：Node.js1.安装步骤请结合Node.js 安装配置 | 菜鸟教程2.安装测试完js运行无误以后，开始下述步骤2.设置js文本（sign加密算

2022-02-09 18:14:18 897

原创 Selenium如何让启动的浏览器和手动启动的浏览器信息一致

最近在做爬虫，主要使用过了selenium包，但是发现selenium包直接调用本地浏览器，启动的是一个全新的（与手动打开的不一致），很多网站可以检测到，为了避免这个坑，给碰到相同问题的同伴提供思路，写下此文，希望对大家有所帮助。1.打开谷歌浏览器；2.在搜索框直接输入chrome://version/，找到“个人资料路径”；注意：不要复制Default。3.代码from selenium import webdriveroption = webdriver.ChromeOpt

2021-03-31 20:34:53 3759 4

原创 Word中MathType不能正常使用解决方法

本人使用的是word2010+MathType,可以正常使用了。首先介绍下，本人首先使用的word2007，然后装mathtype6.9,装上以后发现，公式编号啥的都不能使用（灰色的），然后自己鼓捣半天，废了半天劲，网上找各种解决方法，说把几个文件复制到word的SETUP中，尝试了半天还不行。后来卸了2007，装了2010，发现还是不行，有点奔溃，折腾了半天，后来发现还是不行。后来无意中...

2018-10-21 11:08:54 34060 81

原创利用鸢尾花数据，解释并不是特征越多越好

#首先导入我们需要的包from sklearn import datasetsimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import Perceptro...

2018-05-21 18:29:24 1601 2

原创 Linux常用命令

1.Linux中用户切换命令：su 用户名回车以后输入用户名对应的密码即可如果先要切换到Root用户可以使用：su - 然后回车即可（需要输入root密码）由root用户到其他用户可以直接su 用户名即可（无需输入密码）2.常用命令：...

2018-04-11 14:47:37 150

原创 Python机器学习小案例源码 -- 骨科疾病预测

#内容为实现小象学院的相关代码#数据连接https://www.kaggle.com/uciml/biomechanical-features-of-orthopedic-patientsimport pandas as pdimport numpy as npimport seaborn as snsimport matplotlibimport matplotlib.pyplot as plt...

2018-04-03 16:30:10 1180 2

原创 Anaconda如何安装包

如果安装Anaconda，大家会发现很多包已经安装好了，但是如果我们想要安装新包，我们会发现pip install 包名无法安装，或者安装以后无法使用。接下来，跟上脚步，本人自己亲测：1.找到如图所示的 2.打开Anaconda Prompt,然后在里面输入conda install 包名即可安装。安装完你需要的包以后

2018-01-10 11:01:08 35282 1

原创 python 3.x 结巴（jieba）分词基础知识

# -*- coding: utf-8 -*-from __future__ import unicode_literalsimport syssys.path.append("../")import jiebaimport jieba.possegimport jieba.analyse#分词seg_list = jieba.cut

2017-12-19 15:59:05 1151

原创 python3.x正则表达式的含义及使用

import reimport nltk#正则表达式wordlist = [w for w in nltk.corpus.words.words('en') if w.islower()]print(wordlist)#查找ed结尾的词汇print([w for w in wordlist if re.search('ed$', w)])#匹配：8个字母，第3个

2017-12-13 16:52:51 403 1

原创 python3.x如何从互联网获取想要的文章，及转化为nltk可以处理的文本

from urllib.request import urlopenfrom bs4 import BeautifulSoupfrom nltk import word_tokenizeimport nltk#2种方式解析HTML中的文本url = "http://news.bbc.co.uk/2/hi/health/2284783.stm"html = urlopen(u

2017-12-13 11:12:31 539

原创 python3.X 自然语言处理基础知识

import nltknltk.download()#下载nltk语料库如果没有安装nltk,请在cmd下用批 pip install nltk进行安装from nltk.book import *###搜索文本#搜索单词text1.concordance("monstrous")text2.concordance("affection")text3.

2017-11-22 14:14:57 1191

原创使用原始的Titanic数据，通过特征筛选，一步步提升性能（特征如何提取）

# coding=gbk#使用Titanic数据集，通过特征筛选的方法一步步提升决策树的预测性能import pandas as pdfrom sklearn.cross_validation import train_test_split , cross_val_scorefrom sklearn.feature_extraction import DictVectorizer

2017-11-09 17:35:18 506

原创使用CountVectorizer和TfidfVectorizer对fetch_20newsgroups数据进行分类，并对是否使用停用词进行对比（精确度）

from sklearn.datasets import fetch_20newsgroupsfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mul

2017-11-09 10:27:07 1468

原创 K-means算法--“肘部”观察法用于粗略的估计合理的类簇个数

'''K-means聚类模型所采用的迭代算法，直观易懂，并且非常实用，但是有俩大缺陷。1，容易收敛到局部最优。2需要预先设定簇的数量（因为开始无法准确的确定簇的数量，可以采用“肘部“观察法去大致估计簇的数量）'''import numpy as npfrom sklearn.cluster import KMeansfrom scipy.spatial.distance imp

2017-11-07 11:19:11 4139

原创 K-Means算法过程及代码实现，并对结果使用ARI进行评估

'''K-means算法过程及代码实现1.首先，随机布置K个特征空间内的点作为初始的聚类中心2.然后，对于根据每个数据的特征向量，从K个聚类中心中寻找距离最近的一个，并且把该数据标记为从属这个聚类中心3.接着，在所有的数据都被标记过聚类中心之后，根据这些数据新分配的类簇，重新对K个聚类中心做计算4.如果一轮下来，所有的数据点从属的聚类中心与上一次的分配的类簇没有变化，那么可以迭代停

2017-11-03 11:24:06 3817

原创集成模型（回归）对Boston数据进行训练并对数据做出预测

from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.ensemble import RandomForestRegressor,Ex

2017-11-02 16:23:23 2058

原创利用回归树对Boston房价进行预测，并对结果进行评估

from sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.tree import DecisionTreeRegressorfrom sklearn.metrics import mean_squared_error,

2017-11-02 10:56:40 4298 1

原创 K近邻回归模型对Boston房价进行预测，同时对性能进行评估（1.使用普通的算术平均法2.考虑距离差异进行加权平均）

from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsRegressorfr

2017-11-02 10:24:07 1114

原创使用三种不同的核函数（回归）对Boston房价进行预测，同时对测试数据做出预测

from sklearn.datasets import load_bostonfrom sklearn.svm import SVRfrom sklearn.cross_validation import train_test_splitfrom sklearn.metrics import r2_score,mean_squared_error,mean_absolute_erro

2017-11-01 08:48:26 3904

原创使用线性回归模型LinearRegression和SGDRegression分别对美国波士地区房价进行预测

from sklearn.datasets import load_bostonfrom sklearn.cross_validation import train_test_splitimport numpy as npfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import

2017-10-30 17:26:18 1928

原创利用随机森林和梯度替身决策树对titanic数据进行分类，并对结果进行分析

import pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.ensembl

2017-10-30 15:45:07 891

原创集成分类模型简介

集成分类器主要分为俩种：1.利用相同的训练数据同时搭建多个独立的模型，然后通过投票的方式，以少数服从多数的原则作出最终的分类决策。具有代表性的模型有随机森林分类器（Random Forest Classifier），它是在相同的数据上同时搭建多棵决策树（Decision Tree），与普通的决策树不同的是，普通的决策树会根据每个维度对预测结果的影响程度进行排序（通过采用信息熵），进而决定不同特

2017-10-30 10:00:23 1984

原创利用DecisionTree对titanic数据进行分类

import pandas as pdfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.metrics

2017-10-26 19:45:38 474

原创利用KNC对iris数据进行分裂及预测

from sklearn.datasets import load_irisfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifierfro

2017-10-26 14:30:33 278

原创利用贝叶斯分类器对fetch_20newsgroups数据集进行分类

from sklearn.datasets import fetch_20newsgroupsfrom sklearn.cross_validation import train_test_splitfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mu

2017-10-26 08:54:44 3263

原创利用SVC(Support Vector Classifier)对digits数据进行分类

from sklearn.datasets import load_digitsfrom sklearn.cross_validation import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.svm import LinearSVCfrom sklearn.metri

2017-10-25 14:29:03 1298

原创使用LogisticRegression和SGDClassifier对良/恶性肿瘤进行分类，并计算出准确率召回率和F1的值

# -*- coding: utf-8 -*-"""Created on Tue Oct 24 10:08:40 2017@author: liuyajun"""import pandas as pdimport numpy as npfrom sklearn.cross_validation import train_test_splitfrom

2017-10-24 16:55:01 1567

原创对良/恶性肿瘤的预测python代码实现

import pandas as pdimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.linear_model import LogisticRegressiondf_train = pd.read_csv(r'E:\BaiduNetdiskDownload\Datasets\Breast-Canc

2017-10-23 17:20:58 3376 7

原创如何在去掉空数据及如何在matplotlib中显示数据线性拟合

自己自学机器学习用Python实现，希望志同道合的朋友加入我们一起学习一起进步。

2017-10-11 09:04:20 1965

Python自然语言处理书籍大全

内容为自然语言处理书籍，包括6本书，有Python自认语言处理，Python核心编程，统计自然语言处理等，需要的自己下载。如果有需要自然语言处理相关视频的，可以留言，免费分享，希望对你学习有帮助。

2018-06-03

利用Python进行数据分析（高清书籍+代码+数据）

内容包含数据分析书籍，数据和代码，其中代码是用Jupyter notebook所写，所以直接用Python无法打开，请自行安装相关软件，然后熟悉软件运行以后，上传代码，即可显示。祝进步

2018-05-15

机器学习实战（高清书籍，代码+数据）

内容为及其学习实战的高清书籍，还有配套的代码和数据，自己在用，感觉不错。如果有需要，自取，谢谢给个好评

2018-05-12

PyDev安装视频

该内容为PyDev的安装及调试的过程，一步一步实现，为Python基础内容的一部分，如果需要全部（内容太大，所以在网盘内），好评了和我联系，我会把剩下的分享给你

2017-11-08

机器学习书籍一大波

包含机器学习导论，Python机器学习，Python机器学习笔记，矩阵分析，机器学习实践指南，机器学习实战，神经网络与机器学习等书籍，若果你在学习机器学习，相信书籍值得你下载。。。别忘记给个好评

2017-11-07

机器学习的R实现.pdf

该内容为机器学习基础教程的书籍，高清完整，如果觉得不错给个好评，谢谢

2017-11-07

机器学习实战（高清书籍中英文俩本+配套代码及数据）

该内容包含机器实战中文英文书籍俩本，同时含有机器学习实战的源代码和数据，希望下载觉得有用给个好评，把好资源分享给更多人。

2017-11-02

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路数据

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路与书同步的数据，太大无法上传所以只能保存到网盘中，下载后里面有链接可以自己下载

2017-10-20

Deep Learning Book Chinese Translation

第一章、前言第二章、线性代数第三章、概率与信息第四章、数值计算第五章、机器学习基础第六章、深度前馈网络第七章、深度学习的正则化第八章、深度模型中的优化第九章、卷积神经网络第十章、序列建模：循环和递归网络第十一章、实用方法第十二章、应用第十三章、linear factor 第十四章、自动编码第十五章、表征学习第十六章、结构概率模型第十七章、monte carlo 方法第十八章、面对区分函数第十九章、近似推断内容是分开的，在每个文件夹下面需要用notepad++或者浏览器打开

2017-10-17

Python机器学习

该书完整，一遍讲解理论后面紧跟代码，适合初学者，欢迎大家下载

2017-10-14

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路.pdf

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路.pdf 该书清晰完整，欢迎大家下载

2017-10-14

图解机器学习--完整版

图解机器学习完整版，内容清晰，完整，欢迎大家下载。。。

2017-10-14

机器学习-Mitchell-中文-清晰版

机器学习算法讲解，完整版，内容清晰，讲解清楚，值得学习..................................................................................................................................................................................................................

2017-09-21

GA工具箱，遗传算法

2017-04-20

MATLAB智能算法30个案例分析源代码.rar

2017-04-20

Deep learning

2017-04-19

基于神经网络的数据挖掘方法研究

2017-04-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Python自然语言处理书籍大全

利用Python进行数据分析（高清书籍+代码+数据）

机器学习实战（高清书籍，代码+数据）

PyDev安装视频

机器学习书籍一大波

机器学习的R实现.pdf

机器学习实战（高清书籍中英文俩本+配套代码及数据）

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路数据

Deep Learning Book Chinese Translation

Python机器学习

PYTHON机器学习及实践_从零开始通往KAGGLE竞赛之路.pdf

图解机器学习--完整版

机器学习-Mitchell-中文-清晰版

GA工具箱，遗传算法

MATLAB智能算法30个案例分析 源代码.rar

Deep learning

基于神经网络的数据挖掘方法研究

空空如也

MATLAB智能算法30个案例分析源代码.rar