自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 利用scikit-learn做特征选择

特征选择特征选择是一个过程,自动选择数据中对预测变量输出贡献最大的特征。数据中不相关的特征会降低许多模型的精度,特别是线性算法和逻辑回归等线性算法。在对数据建模之前执行特征选择的三个好处是: 1. 减少过度配合:减少冗余数据意味着根据噪音作出决定的机会减少。 2. 提高准确性:更少的误导数据意味着建模精度提高。 3. 减少训练时间:更少的数据意味着算法训练更快。 下面介绍Python中

2017-12-26 20:32:20 1676

翻译 Spark Tutorial Lab2

伯克利CS190.1x Course Spark Lab2

2017-12-20 09:36:22 840

原创 网格寻优SVM

import pandas as pdimport numpy as npfrom time import timefrom sklearn.model_selection import GridSearchCVfrom sklearn.cross_validation import train_test_splitfrom sklearn.metrics import classific

2017-12-19 11:30:16 5465

转载 利用LSTM预测股票日最高价

借用研究了这两个大神的代码 定义LSTM时候注意修改:cell=tf.contrib.rnn.BasicLSTMCell(rnn_unit,reuse=tf.get_variable_scope().reuse) 注意保存的路径 http://blog.csdn.net/mylove0414/article/details/55805974 https://github.com/lyshel

2017-12-19 11:24:48 1640 1

原创 利用LSTM对股票的收盘价进行回归预测

基于机器学习的股票分析三、利用神经网络对股票的日收盘价进行回归预测import tushare as tsimport pandas as pd import numpy as npfrom datetime import datetimefrom pandas import read_csvfrom pandas import DataFramefrom pandas import c

2017-12-13 11:41:32 7547 8

原创 用SVM预测股票涨跌

基于机器学习的股票分析二、 对股票数据涨跌进行SVM训练和预测上一次爬取了股票数据并进行标签分类,这次进行SVM分类import pandas as pd from sklearn import svm,preprocessing#获取中国银行历史数据df_CB=pd.read_csv(r'G:\\Project\\data\\CB.csv',encoding='gbk')#将日期作为inde

2017-12-13 11:21:45 15432 19

原创 python爬取股票数据

pip install tushare,爬取银行股票数据对数据进行初步进行整理,用今日的收盘减去昨天的收盘值定义value表示涨跌,并绘图直观表示最近的股票走势图。其实也可以直接根据pchange>0来标签分类的 -_-import tushare as tsimport pandas as pd import pandas as pd#获取中国银行历史数据df_CB=ts.get_hist

2017-12-13 11:10:48 6455 3

原创 Introduction To Apache Spark(1)

spark入门一、简介Apache spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势。首先,Spark为我们提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据

2017-11-21 18:57:05 350

原创 socket基础

Socket编程 Winsock是一个基于Socket模型的API,在Windows系统中广泛使用 需要包含头文件Winsock2.h,需要使用库ws2_32.lib,包含办法可以用语句来告诉编译时调用该库   #pragma comment(lib,”ws2_32.lib”); 如果使用Visual C++ 6.0,可以通过“工程” > “设置”>“工程设置”>“链接”>“对

2017-11-21 18:16:16 226

原创 旋转数组求最小值

旋转数组求最小值把一个数组最开始的若干个元素搬到数组的末尾,我们称之为数组的旋转。输入一个非递减排序的数组的一个旋转,输出旋转数组的最小元素。例子例如数组{3,4,5,1,2}为{1,2,3,4,5}的一个旋转,该数组的最小值为1。NOTE:给出的所有元素都大于0,若数组大小为0,请返回0。思路 对于数组{3,4,5,1,2},我们可以使用二分法的思想,使用2个指针,第一个指针指向头,第二个指针

2017-08-28 21:47:43 257

转载 快速排序

快速排序 设要排序的数组是Arr[0]—–Arr[N-1],首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。值得注意的是,快速排序不是一种稳定的排序算法,也就是说,多个相同的值的相对位置也许会在算法结束时产生变动 , 因此,快速排序是不稳定的排序。代码int AdjustArray(int s[

2017-08-28 21:29:41 528 1

原创 赫夫曼编码

赫夫曼编码在计算机资料处理中,霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。实验要求 理解huffman树构造方法 要求给定若干输入权重,给出huffman 编码结果#i

2017-08-28 21:09:08 277

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除