自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(76)
  • 收藏
  • 关注

原创 python进阶系列学习(三)

python中的闭包回顾上一节返回函数:#python中的闭包def f(): print("我是f()函数") def g(): print("我是g()函数,是被f()函数调用的") return g #f()函数返回的就是函数if __name__=="__main__": g=f() print('*'*30) ...

2018-08-08 11:00:06 488

原创 python进阶系列学习(二)

sorted()函数和sort()函数sort()函数作用在list上,只不过是在原有的list上进行操作,会改变原有的listsorted()函数是python内置的高阶函数,可以作用在list上也可以作用在其他的可迭代对象上,不会改变原来的list,只会返回一个新的list对象。所以当作用的对象是可迭代对象字典时,我们可以给key传入相应的值,来决定根据键还是值进行相应的排序,如果...

2018-08-06 23:07:59 412

原创 python进阶系列学习(一)

map函数map函数是python的内置的高阶函数,接受两个参数,第一个就是函数f,另一个就是列表list,作用就是f函数作用于list的每一个元素,这里需要注意的一点是map()函数作用于一个list时,会返回一个新的list,并不会改变原有的list在做课后习题时 题目: 假设用户输入的英文名字不规范,没有按照首字母大写,后续字母小写的规则,请利用map()函数,把一个list(包...

2018-08-06 15:20:24 749

原创 pycharm安装教程(注册码)

详见: https://blog.csdn.net/qq_32811489/article/details/78636049

2018-08-06 10:40:24 1386

原创 python数据可视化绘制热图

最近要处理的数据需要更直观的显示出来,也就是需要数据的可视化操作,需要用到pyheatmap,具体安装,直接pip install pyheatmap 即可由于我要绘制的数据是二维的,行是样本,列是代谢物,或者pathway 也就是不同的特征,绘制heatmap时 参考了下面的资料,觉得很有用呀,嘻嘻 Python-Seaborn热图绘制Python可视化:Seaborn库热力图使用进阶...

2018-07-31 21:12:20 17848

原创 python课程系列学习(二)ls和通配符的联合使用

这一小节介绍通配符的使用,先说一下使用场景: 比如当我们需要查找某一个文件时,有可能需要查找的文件在很多很多的文件当中,比如我们ls一下,出来满屏的文件,这个时候通配符就显得十分有用啦(有点类似于正则表达式匹配的感觉),可以使用通配符帮助我们快速定位到需要操作的文件中去~” * 表示匹配任意个数的字符” “?只代表任意一个字符,注意这里是一个,而不是任意一个” “ [] 表示可以匹配字符...

2018-07-30 23:20:43 865

原创 python课程系列学习(一)--文件和目录命令

过几天装一下虚拟机,装一个linux系统,熟悉一下今天学习的linux命令:关于linux终端窗口的放大和缩小:放大:ctrl + shift + = 缩小:ctrl + -对于文件和目录的基本操作命令:查看当前目录下的内容: ls (list的缩写)查看当前的工作目录: pwd(print work directory)切换工作目录: cd 要切换的目录名...

2018-07-30 22:56:10 223

原创 python数据结构----------抽象数据类型和python类

废话最近在看python数据结构的书,第二章是复习python面向对象编程,其中提到了python面向对象编程的特点(封装成模块,我的理解就是把跟某一个功能相关的操作都封装成一个类,对外部需要使用该功能的人来说,只需要调用提供的接口 其实就是调用这个类,不用关心内部具体是如何实现的)之前对面向对象编程学的就不是很好,现在重新看,发现也没有那么难了,,,哈哈哈实现一个有理数类先来...

2018-07-30 11:37:16 863

原创 python中关于变量的存储

最近在看了python数据结构的书,关于python中变量的存储查了一下资料:现总结如下:python中变量存储的值就是所谓的对象,并且该变量其实是指向其值所在的内存地址,而不是直接存储的该变量的值,这就是所谓的引用语义,和C语言中变量存储的都是该变量的值有本质的区别(值语义),这点需要特别注意!然后关于变量存储有一篇文章觉得讲的特别好:这篇其实我看到了两篇一样的文章,不知道哪个是...

2018-07-26 11:11:04 1749

原创 吴恩达机器学习课程第一周

关于线性回归的记录: 使用的损失函数是平方误差损失函数J(θ),也就是最简单的假设函数和真实值差的平方和(对于所有样本求和),然后最小化J(θ),也就是使用梯度下降算法;平方误差代价函数是解决回归问题最常见的手段;对于单变量线性回归问题: 如果是对于单变量线性回归,代价函数(参数为θ)关于假设函数中参数的图形为: 因为只有一个变量所以只有两个参数,总可以找到一组参数使得该代价函数...

2018-07-04 18:55:45 350

原创 回归中的相关度和R平方值

机器学习中关于回归模型有时候需要衡量自变量和因变量之间的相关度,接下来介绍两个衡量相关度的指标:皮尔逊相关系数它是用来衡量两个变量之间的相关度的; 取值:[-1,1] 该值>0 表示两个变量之间是正相关的,值为0表示两个变量之间无相关性,值<0表示两个变量之间是负相关的;皮尔逊相关系数的计算公式可以表示为: R平方值也称为决定系数,反映因变量的全部变异能通过回...

2018-06-24 12:17:41 56289 2

原创 使用梯度下降算法来求解线性回归模型

废话求解线性回归模型的解析解可以直接使用公式,这节可以使用梯度下降算法来求解这类问题的优化问题: 原理的东西不想说了 ,总之机器学习的一般思路都是: 构建模型(也就是你想建立什么样的预测函数 y=blabla) —-》 接着就是你想对你要建立的模型使用什么样的损失函数求解最优化问题(此处使用的是最小二乘的原理也就是预测值和真实值的差平方和 ,最后除以样本数cost=blabla) ...

2018-06-23 20:18:20 1578

原创 机器学习之多变量回归模型(二)

废话上一篇博客已经提到关于多变量回归模型的训练(其实就是调用sklearn中的linear_model中的LinearRegression)然后对新的数据进行预测 接下来我们再补充一下,就是当变量中不仅仅有上述连续性的变量,也有一些离散型的变量,而对这些表示类型而不是真实表示数据大小的变量应该怎么处理,然后用现有的模型进行训练呢?介绍对于上面提到的问题解决办法就是把那些非数值类型的数...

2018-06-23 15:26:29 2682

原创 机器学习之多变量回归模型(一)

废话主要是用sklearn库中的linear_model中的LinearRegression模型进行训练,另外对于训练集数据的读取用到了上一篇提到的文件读取的相关操作,这里熟悉一下https://blog.csdn.net/jiaowosiye/article/details/80782729 这段时间的学习主要侧重于掉包,希望能成为一个厉害的调包侠~~~介绍导入训练数据,使用ske...

2018-06-23 14:46:54 7705

原创 使用python读取csv文件

用python读取文件的操作是很常见的,所以在这里记录一下相关的操作步骤: 有参考这篇博客:https://www.cnblogs.com/unnameable/p/7366437.html文件的读取1.首先你得有一个csv文件,可以把excel文件另存为csv文件也可以~ 我这里命名为delivery.csv 里面的数字格式如下: 2.接下来就是利用csv模块的相关函数进行打开...

2018-06-23 12:57:58 63269 3

原创 阶段性总结-2018-06-13

最近有考试,整个计划都好象被打乱了,发现自己不会合理安排时间,这一点非常不好,需要改。最近没有在看机器学习的东西了,学一件东西很容易就坚持不了,容易间断,这样前面学的东西就很容易忘掉,导致不停的在做无用功。前段时间(6.2-6.5)去北京,刚好有个HR小姐姐给我打电话,让我去面试,实习工作是测试,面试官说会有一个python相关的项目刚搭好一个框架,我去了可以让我做,算是第一个实习吧,可是一...

2018-06-13 22:05:38 179

原创 数据结构复习总结之二叉树(七)

前两天看了二叉树的相关知识,包括二叉树的广度优先遍历,深度优先遍历,二叉树的添加,前序遍历,中序遍历以及后序遍历,最后看了给定二叉树的前序和中序遍历结果(或者给定二叉树的后序和中序遍历结果)写出另一个遍历结果(中序遍历是一定要给的)包括二叉树的广度优先遍历,深度优先遍历,二叉树的添加,前序遍历,中序遍历以及后序遍历# -*- coding: utf-8 -*-"""Created ...

2018-05-31 21:07:18 250

原创 数据结构复习总结之二分查找(六)

学完排序算法之后我们就要学习搜索啦,其中一个比较常见的就是二分查找,其实关于二分查找早就听说了,今天才正式学,好开心,终于学到这啦~~~先来说下二分查找算法的原理吧原理概述二分查找首先要求序列必须得是有序的,其次可以直接用下标索引的,所以也就是操作的时顺序表而不能是链表什么的主要就是对于要查找的元素,先看该元素和表中间位置的元素相比是大是小,如果要查找的值比中间元素小,就把该元素继...

2018-05-29 17:18:57 299

原创 数据结构复习总结之归并排序(五)

前两天就看了归并排序,一直还没实现,昨天晚上只是想了一下实现的过程,以为会了呢,,,,动手写了一遍代码才发现,仍然有问题,,,,记录一下,过几天再来做一遍!原理概述归并排序和快速排序一样都是需要用到递归的,先来回顾一下快速排序: 快速排序是首先把一个完整序列的第一个元素找到它的合适位置:位于该元素左边的元素都比它小,位于该元素右边的元素都比它大(这就需要low 和high 游标在移动...

2018-05-29 11:46:28 233

原创 数据结构复习总结之快速排序(四)

今天学一下快速排序 哦对了,吉大今天成立人工智能学院啦~~~,6的不行原理概述快速排序和插入排序,选择排序不太一样,后两个都是会把原来的序列分成两部分,有序和无序,然后操作其中一部分序列(插入排序是操作有序序列:取无序序列的第一个元素,在有序序列中选一个位置插入进去;选择排序是操作无序部分:选一个最小的追加到有序序列的后边)快速排序主要是对于一个元素需要找到它在剩余序列中的合适位置,...

2018-05-27 15:50:39 255

原创 Spyder中常用快捷键操作

经常需要用到的快捷键如下(后续有的话再补充) 1. 多行缩进 : ctrl + ] 取消缩进: ctrl + [ 2. 多行注释:ctrl + 1 或者ctrl +4 注释取消:ctrl + 1 或者ctrl +5跳转到指定行: ctrl + l...

2018-05-26 21:21:47 14298

原创 数据结构复习总结之希尔排序(三)

先来看一下希尔排序:原理概述希尔排序其实是插入排序的改进版本,性能会有所提升,该算法设置一个gap步长(后续会变化),选取原序列的隔步长的元素组成一个子表,对该子表使用插入排序,其实很明显的就是每设置一个步长该原序列就会被分成gap个子表,对所有子表都分别进行插入排序,也就是在各自的表顺序内进行插入排序,但是操作的元素仍是原表中对应的索引(而不是新的子表中的索引,所以子表中每两个元素之间的...

2018-05-26 19:41:37 948

原创 数据结构复习总结之插入排序(二)

今天开始学习插入排序,首先回顾一下冒泡排序和选择排序,以便进行比较:冒泡排序:每一次遍历都是比较前后两个元素的大小,把大的元素往后放,也就是当该次遍历完成后的效果就表中最大的元素置于表的最后,然后第二次遍历会把第二大元素放在倒数第二个位置,,,以此类推,依次把大的元素往后放即可完成排序。选择排序该算法的思想是把原序列分成两部分,有序(已排序)和无序(未排序部分)每次遍历都会去无...

2018-05-26 11:15:57 190

原创 数据结构复习总结之冒泡排序和选择排序(一)

颓废了两周,有时候就是会周期性的心情失落,学不进去,还好现在调整过来啦~~ 其实很多时候都是太闲了,想的太多,其实可以多去做,不要老是瞎想,生活充实就会好啦~~*******************************正经分割线********************************* 今天学了单向链表插入删除,双向链表的插入删除,大致原理是懂了,本科没学懂的指针终于看懂啦~~...

2018-05-25 22:33:15 505

原创 Git笔记总结(二)

之前也写过一篇关于git的命令操作,这里,可是写的有点乱,也没有传图,这里重新写一下在平时经常用到的命令操作。一. 在远程仓库建立文件夹刚开始你可能会比较困惑,只有新建文件,没有新建文件夹,,,其实你只要点新建文件按钮,输入文件夹名称之后按一下’/’回车之后就变成文件夹啦~~ 二. 从远程仓库克隆到本地仓库首先在本地一个文件夹gitworkspace下面(用来放你的项目pr...

2018-05-12 17:54:20 278

原创 kaggle-------DigitRecognition

kaggle上的一个比赛,主要是识别数字的,具体描述可以去官网看一下,然后里面也有数据集,可以下载下来在本地跑,也可以在kaggle的平台上跑,注意去setting下面把GPU的开关打开~~ 我之前也写过手写体识别的,在这里 ,用的是logistic regression+softmax 数据集是放在两个文件夹下面,没一个样本是存成一个txt文件的,就是这里导入数据集比较麻烦。 现在的数据...

2018-05-12 16:25:37 957

原创 Leetcode刷题——Day2

695. Max Area of IslandGiven a non-empty 2D array grid of 0’s and 1’s, an island is a group of 1’s (representing land) connected 4-directionally (horizontal or vertical.) You may assume all four edg...

2018-05-11 15:52:52 185

原创 Leetcode刷题——Day1

一边看算法,一边刷题吧,先从简单的开始: 刷题之路这就开始了?561. Array Partition IGiven an array of 2n integers, your task is to group these integers into n pairs of integer, say (a1, b1), (a2, b2), …, (an, bn) which makes...

2018-05-10 17:06:15 524

原创 kaggle比赛流程记录

下周一平安科技的远程面试,准备30分钟的PPT,主要是介绍相关项目经验,着重技术,代码,模型,算法等方面 今天大致看了一下kaggle上面的入门级比赛,主要是熟悉一下流程首先要注册kaggle账号,我用的是gmail邮箱登录的,然后需要绑定自己的github账号; 接下来找到competition的digit recognition数字识别; 进入之后可以看看比赛说明,下载数据(如果你是...

2018-05-08 21:46:35 3232

原创 Git个人笔记总结(一)

git 基本知识git是一个分布式版本控制系统,可以进行代码的管理,合并别人的代码等,最开始接触git是在GitHub网站上,号称全球最大同性交友网站,活跃着各种各样的大佬,当然也有像我这样的小白存在。如果你看到一个项目觉得挺好的,你可以把这个项目fork下来,研究的过程中你的水平也越来越高,终于有一天你发现其实大佬的代码可以进行优化,于是你把fork的项目clone到本地,修改之后pus...

2018-05-07 12:02:09 844

原创 CS61A 系列课程笔记(一)

嗯 今天刚看第二周的课程,大量的 reading 材料我是真的要崩溃了,全英。。。。 我觉得我小学的时候英语挺好的呀,都被老师表扬过呢,滑稽.jpg (逃 每周的reading 是真的很多啊,不说了 我废话好多啊**********************正文*********************** 看到函数一节,reading 1.5材料中 介绍了对函数的测试 主要讲了三种: ...

2018-05-06 19:33:54 12478 1

原创 机器学习实战之KNN算法

书上的代码看不懂,自己写了一个,就是太麻烦,书上才15行,我用了26行代码,,可是我为什么看不懂别人的代码啊!哭唧唧主要是思路,这里我用的数据特别简单,就是自己写了四个点,然后给他们标签,来一个新的数据,通过计算该点与已知数据点(带有标签的那种)的距离,选取K个最近的点,统计这K个点的标签,选取最多类别的那一个作为最后该新输入数据集的标签,其实原理类似于说,你周围的点是什么样子,其实大概率决定...

2018-04-29 15:30:59 254

原创 机器学习算法面试准备

转自大神

2018-04-24 19:46:41 170

原创 python算法题记录(二)

Day 2 熄灯问题规则是 0 表示灯的状态为亮,1表示灯的状态为灭,然后有一个开关矩阵 1表示按下 0表示无操作,如果原来的灯亮 则按下去之后 灯就灭了,反之亦然。 只不过按下开关操作的并不仅仅是被按下的灯,还会影响它周围灯的状态,也就是中间的灯来说 会造成5个(上下左右和本身)灯状态的改变,对于四个角上的灯只有三个状态改变,对于边上的灯会有4个状态发生改变。 现在假设有一批灯 5*6...

2018-04-23 20:37:30 446

原创 python算法题记录(一)

接下来写一下算法题的实现 刚开始都是一些简单的算法实现,就在刚刚我写判断一个不大于N的最大素数时 我竟然没有立马写出来,,,,崩溃。接下来打算每天写一篇算法的实现,今天开始看算法的视频 然后对里面提到的算法进行实现,记录在这里啦对了这几天一直在找实习,我发现有点受打击,好好打基础,还有不到一年 ,加油!Day1 “写出不大于N的最大素数” 今天在看枚举时 举了这个例子 乍一看很简单...

2018-04-17 21:15:36 1168 1

原创 机器学习竞赛Sofasofa

这两天看了SofaSofa上的新手赛,有一个根据名字预测性别的:参考标杆模型 自己也试着从头到尾写了一遍提交上去结果82% 嗯排名是很迷 53/104 ,(耗时一天)继续努力~ 这里说一下思路,(说一下 这个是给我自己看的 写的太乱,主要是记录下来方便我以后理解) 就是首先需要导入数据 由于是使用了pandas的read_csv()函数 得到的数据类型是DataFrame 所以相关操作需要熟...

2018-04-16 21:48:17 1912

原创 机器学习实战之Adaboost之机器学习作业记录(三)

好久没更新作业了,,,主要是李航统计学习方法的第八章,准确率80% 总感觉不对,先记录到这,,,其中关于概念的理解参考了以下博客,觉得对我很有帮助,记录一下: 1 2 3 4 这篇 尤其这篇 还有这篇 这篇 这篇 这篇 这篇 这篇 这篇然后我的代码放在这里啦:# -*- coding: utf-8 -*-"""Created on Sat Apr ...

2018-04-15 12:18:43 181

原创 机器学习-实习记录篇

看着论坛,实习群各种实习,记录一下各个公司的要求,查漏补缺,加油~1. 人工智能算法-长威科技岗位描述:1、负责设计、训练和测试机器学习、深度学习算法模型; 2、负责数据收集、整理和分析,并设计模型的检验方案; 3、参与设计大数据架构、分布式机器学习平台和机器人智能系统。要求:1、研发生及以上学历,计算机、应用数学、统计类或电子工程等相关专业; 2、在以下至少一个领域有...

2018-04-13 21:41:40 2556 1

原创 机器学习算法SVM之核函数

最近在看SVM的论文,关于核函数不是很理解 查了一些资料 启发最大的: 知乎大佬 还有这位大神有时间再来补充

2018-04-12 21:15:25 429

原创 机器学习实战之0-9手写字识别

嗯 觉得自己很棒棒哦 总之进步挺大的 哈哈哈哈 0-9的数字识别 属于多分类问题 需要用到softmax分类的知识 具体讲解请参考下面几个博客: 1 2 3 4首先有两个数据集 训练集和测试集,两个数据集都有txt文件 如0_0.txt表示该txt文件属于第0类 后面的0表示该类别下的一个训练样本 其实每一个txt文件都是一个样本而且里边的32*32维(102...

2018-03-31 10:49:50 2156 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除