自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 断更后的回归

当初写这个博客是为了找工作,后来因为各种杂事就没有在这分享了,而是转移到了onenote上,因为那边比较方便,排版方便。接下来打算在知乎上分享吧,一方面是总结自己学习的内容,理清思路;另一方面也是为了能和大家一起学习。愿能共同进步。...

2019-05-19 00:32:33 127

原创 爬取得到数据写入过文件时出现UnicodeEncodeError的错误

最近刚接触lda主题模型,为了加深自己的理解,从网上爬取文本进行主题模型的构建和文本的主题预测。           在获得文本,写入文件时,出现了以下问题:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-10: ordinal not in range(128)。          这篇博文(

2017-07-08 22:19:17 532

原创 广义线性模型及softmax回归

看了Andrew Ng 关于广义线性模型这内容的视频,对概念还是有点模糊,于是搜到这篇博文http://blog.csdn.net/lilyth_lilyth/article/details/10032993。只不过Andrew Ng的推导顺序和这篇文章是相反的,但还是同一个原理。下面我摘了这篇文章关于广义线性回归的内容。         1)指数家族

2017-06-13 16:56:52 819

原创 visual studio 配置opencv遇到的问题

用visual studio 2013配置2.4.10的opencv时,遇到了一些困难,对于一个小白来说真的是略郁闷啊,好在最后解决了,打算记录下这些问题供借鉴。          问题一:导入项目时头函数报错;          方    法:原因是库函数没导入,这时候opencv就出场了,可以在opencv官网下载所需的版本,安装后就可以配置了。  具体的配置方法可参考这篇博文:htt

2017-06-12 19:25:21 403

原创 最小二乘法的新体(接上篇)

在学习线性回归中,接触了到最小二乘法,知道怎么用它来解决回归问题,但其本质还没深入地理解,然后在项目中也听到了这个知识点,所以就有了这篇笔记。      最小二乘法的核心就是使得所有数据的偏差平方和最小。但是在数据拟合的时候,为什么是要使得用模型预测出来的值和真实值之差的平方和最小?     这个问题见链接(http://blog.sciencenet.cn/blog-430956-621

2017-06-10 19:42:15 244

原创 线性回归以及梯度下降的学习

最近打算重新学习机器学习,为数据分析打好基础,本章记录线性回归以及梯度下降的内容。在机器学习中,线性回归是一个较简单的模型,属于监督学习。先给定一个训练集,根据这个训练集学习出一个线性函数,然后测试此函数是否足够拟合训练集数据,挑选出最好的函数(代价最小)即可。一、概念:1、线性回归的假设模型:为了评估假设模型,需要引入代价函数(cost function)的概念。

2017-06-10 11:29:51 240

原创 springboot--支付宝条码支付的实现

这几天一直在调支付宝的条码支付的接口,遇到不少问题,想跟大家分享一下。我还是建议大家在官网下载的接口先调通了,再放入自己的项目中。我的小伙伴做的是微信条码支付,不得不说,支付宝的接口文档比微信的详细多了,此外支付宝还附带一个样例demo,非常便于新手开发与学习       所谓的条码支付,就是商家扫用户的付款二维码进行结账,用户只需展示付款二维码即可。而扫码支付是用户扫商家的二维码,然后输入金

2017-04-29 11:56:39 4298

原创 《利用python进行数据分析》读书笔记之案例二:全美婴儿姓名

这份数据包含了从1880到2010年间的婴儿名字频率数据,其数据形式是多个txt文件,且用逗号分隔,可以用pandas.read_csv将其加载到DataFrame中,并且用pandas.concat将所有数据都组装到一个DataFrame。   years=range(1880,2011) pieces=[] columns=['name','sex','births']

2017-04-06 17:03:39 2492

原创 《利用python进行数据分析》读书笔记之案例二:MovieLnes 1M数据集

MovieLens 1M数据集含有来自6000名用户对4000部电影的100万条评分数据。它分为三个表:评分,用户信息和 电影信息。将该数据解压出来以后,可以通过pandas.read_table将各个表分别读到一个pandas DataFrame对象中       import pandas as pd import numpy as np import matp

2017-03-30 18:33:59 1037 1

原创 《利用python进行数据分析》读书笔记之案例一:来自bit.ly的1.usa.gov数据

从网上下来的数据文件,先读取文件中的第一行查看是什么数据类型           path="usagov_data.txt"   open(path).readline() 结果为: 从上面可以看出它是json格式,在python中有许多内置或第三方模块可以将json字符串转换成python字典对象。将使用json模块及l

2017-03-29 20:51:07 1391 2

原创 ssh 改项目名再运行还是原来的项目在运行的解决方法.

最近在用java在开发一个网站,用的框架是ssh,但是经常遇到复制项目,改项目名运行之后,新项目无法正常运行,原来的项目名还在运行。这时,我们需要右击Properties——>Myeclipse里有Web,然后修改Web Content-root框里的名字。

2017-03-28 21:37:55 620

原创 初学pandas,处理数据集来熟悉pandas

从一个数据集开始,开启学pandas之旅。         推荐大家一个网站:http://blog.csdn.net/u010945683/article/details/45344121。         我下载的是一个有关书籍的数据集,包含三个文件:(1)BX-Users.csv;(2)BX-Books.csv;(3)BX-Book-Ratings.csv         代码编

2017-03-22 21:39:49 608

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除