自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

邵华成

http://blog.csdn.net/shaohuacheng

  • 博客(18)
  • 收藏
  • 关注

原创 欢迎交流!

博客主要记录学习中的点滴心得,希望能和大家诚心切磋,相互交流,共同进步!csdn blog:  http://blog.csdn.net/shaohuachengEmail:[email protected]

2014-11-26 22:51:38 467

原创 【机器学习入门】logistic回归

logistic回归名为“回归”,实质上却是一个分类模型。它的思路是用一个S型函数进行回归模型拟合,预测值大于0.5时认为是正类,小于0.5时认为是负类。 用logistic回归用于分类而不采取线性回归的原因在于,当两个类的样本较多分布不同的时候,线性回归会倾向于偏向样本较多的那个类,并尝试拟合“较远”的样本。logistic回归选择将线性回归函数转化到一个S型函数上。 hθ(x)=g(θTx)

2016-07-23 00:05:27 404

原创 【机器学习入门】局部加权回归

线性回归:拟合参数θ\theta使得∑i(y(i)−θTx(i))2\sum_i (y^{(i)} - \theta^Tx^{(i)})^2最小,返回θTx\theta^T x作为预测值。局部加权回归(Local Weighted Regression, LWR)是这样一个模型: 当你需要拟合xx时,检查数据集,并且只考虑那些位于xx周围的那些点。对xx附近的数据子集使用线性回归来拟合出一条直线。

2016-07-22 10:18:56 618

原创 【机器学习入门】线性回归的概率解释

Andrew Ng的公开课机器学习线性回归中我们建立了一个线性模型h(x(i))=θTx(i)h(x^{(i)})=\theta^T x^{(i)},并计算误差函数J(θ)=∑mi=1(h(x(i))−y(i))2=∑mi=1(θTx(i)−y(i))2J(\theta) =\sum _{i=1}^{m}(h(x^{(i)})-y^{(i)})^2 = \sum _{i=1}^{m}(\theta^

2016-07-21 19:28:33 1734

转载 Ubuntu下安装scikit-learn(sklearn)

原文转自:http://blog.csdn.net/sdhfaka/article/details/22040527按说,这个安装应该也不是很困难,但是官方网站的说明在我看来写的实在是有待改进,所以写文一篇,方便以后安装。背景:Ubuntu 13.04python 2 .7. 4(系统预装)步骤:官网原文见此链接1.

2016-07-15 11:18:02 797

原创 python笔记-import用法

在用python的过程中,发现import的方法有些乱,在此做个总结。import的方法有3种,比如我要使用numpy中的array方法和sum方法,则可以:1.import numpy2.import numpy as np3.from numpy import array,sum具体区别如下:**1.import numpy**把numpy模块全部导入,调用语句numpy.ar

2016-07-09 23:20:17 713

原创 卡特兰数应用 pku OJ ID:1095

pku OJ 的第1095题,有关卡特兰数与二叉树的括号表示。DescriptionWe can number binary trees using the following scheme: The empty tree is numbered 0. The single-node tree is numbered 1. All binary trees having m

2014-12-05 14:12:50 601

原创 参数算法

计算机的核心就是算法,甚至有人将程序解释为”数据结构+算法“。事实上,只要有些经验的程序员都会体会到,语言只是实现算法的工具,用C、java、Python等实现并没有什么实质性区别,只不过是将算法以语言的形式表达了出来而已。那么计算机实现算法的原理是什么呢?穷举。无论你是否认同,穷举是计算机解决问题的基本思路。也就是说,计算机与人相比优势在于其速度之快,可以将解空间可能的解在有限的时间内解决出来而

2014-12-05 13:37:33 1363

转载 NP问题与NPC问题

NP(Non-Deterministic Polynomial,非确定多项式)问题,是指可以在多项式时间内被非确定机解决的问题。与之相对应的为P(Polynomial,多项式)问题,它是指可以在多项式时间内被确定机解决的问题,这里的确定机可以理解为通常意义下的计算机。简单的说,存在多项式时间的算法的一类问题,称之为P类问题;而像梵塔问题,推销员旅行(TSP)问题等问题,至今没有找到多项式时间算法解

2014-12-05 13:19:01 820

原创 Python笔记-排序算法(3)

归并排序和希尔排序归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。值得注意的是归并排序是一种稳定的排序方法。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。例如有两个有序表:(7,10,13,15)和(4,8,19,20),归

2014-12-01 21:37:32 425

转载 为什么要使用Python?

有一天,我突然发现有一个员工,他的代码质量又好,功能完成又快,只要把他的模块跟别人联调,不仅代码不出问题,还帮别人找出很多问题。我对这个现象比较好奇,连续观察几周之后,在一次技术交谈会上,我让他说说倒底有什么神奇武功绝招可以分享出来的。他说没有什么别的可以藏起来的绝招,只是使用了Python这个工具,这个工具绝对比《葵花宝典》实用多了,因为它不用自宫,即可成功。我仔细地整理一下他分享的

2014-11-30 11:25:59 773

转载 互联网时代你的时间去哪了

时间去哪了1、地铁或公交车上,玩手机等。上下班两次,每次30分钟。    60分钟2、打开电脑弹出新闻,及附属连带其他时间,每天至少20分钟。    20分钟3、搜索引擎的干扰信息,如百度的“猜你喜欢”,“周围热搜”。多次干扰。    30分钟4、QQ群干扰。每天多次干扰。    15分钟5、QQ聊天,每天多次聊天。    20分钟6、工作中多次刷下社交网站。    3

2014-11-29 13:16:15 438

原创 图上若干问题总结 诱导子图(induced subgraph),团(clique),最大独立集(maximun indenpendet Set),弦图(chordal graph)

实例:无向图G=(V, E),V为图的所有顶点集合(非空),E为图的所有边的集合。  【子图(subgraph)和生成子图(spanning subgraph)】  G'=(V', E'),V'被包含于V,E'被包含于E,G'为G的子图。        对于子图有一个生成子图的概念,两者的区别在于:在子图中,E'   【诱导子图(induce

2014-11-29 12:51:41 3769

原创 Python笔记-排序算法(2)

主要是插入排序和快速排序。插入排序(insertion sort)的基本思想:每次将一个待排序的记录,按其关键字大小插入到前面已经排序好的序列中,直到全部记录插入完成为止。第i次插入以前,已排序的序列为前i个,后面的n-i个未排序。具体算法描述如下:⒈ 从第一个元素开始,该元素可以认为已经被排序⒉ 取出下一个元素,在已经排序的元素序列中从后向前扫描⒊ 如果该元素(已排序)大

2014-11-28 23:18:16 399

原创 斐波那契数列心得

前几天看了一个面试题,现在把题目和思路整理如下,以飨读者。  对一个正整数作如下操作:如果是偶数则除以2,如果是奇数则加1,如此进行直到1时操作停止,求经过9次操作变为1的数有多少个?我们可以先进行反向推理:第9次操作:结果1只能由2产生。第8次操作:结果2只能由4产生。第7次操作:结果4由8、3产生。第6次操作:结果8由16、7产生;结果3由6产生。

2014-11-28 18:58:26 2339

原创 Python笔记-排序算法实现(1)

排序是数据结构中常用的方法,现用Python实现起泡排序和选择排序。将被排序的记录数组R[1..n]垂直排列,每个记录R[i]看作是重量为R[i].key的气泡。根据轻气泡不能在重气泡之下的原则,从下往上扫描数组R:凡扫描到违反本原则的轻气泡,就使其向上"飘浮"。如此反复进行,直到最后任何两个气泡都是轻者在上,重者在下为止。冒泡排序是就地排序,且它是稳定的。(1)初始

2014-11-27 22:48:59 476

原创 Python开发进阶——数据集处理与机器学习初步

科学家将研究数据集共享给其他研究人员使用,同时也期待数据有助于解决某些重要问题。其中之一的免费资源就是加利福尼亚州欧文分校的机器学习数据仓库(http://archive.ics.uci.edu/ml)。本文采取了其中一个乳腺癌患者身上切除肿瘤的数据集(breast-cancer-wisconsin.data),读者可自行前往下载。肿瘤学家研究切片组织并描述组织的各种特征,并决定肿瘤是良性还是

2014-11-27 21:03:19 2030

原创 Python 统计文章单词出现频率

近来学习Python,Python在科学计算中有着较强的优势。练习文章处理的初级代码,共享出来希望高手指点。任务目标:统计英文文章中出现频率较高的单词,画出频率图并显示频率较高的单词。基本要求已完成。应改变显示结果的条件,适应长短相差较大的文章。import pylabimport numpyimport stringdef linetoword(line):

2014-11-26 22:57:40 2508

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除