自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 leetcode数组类简单题中的“减治思想”

题目描述删除排序数组中的重复项 给定一个排序数组,你需要在 原地 删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。不要使用额外的数组空间,你必须在 原地 修改输入数组 并在使用 O(1) 额外空间的条件下完成。示例 1:给定数组 nums = [1,1,2],函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 1, 2。你不需要考虑数组中超出新长度后面的元素。示例 2:给定 nums = [0,0,1,1,1,2,2,3,3,4],函数应该

2020-08-14 20:45:22 238

原创 CS224n学习笔记-1

NLP第一课:寻找合适的途径/方式表示词的意义问题一:如何去代表一个词的“意义”?表示方法一:one-hot,词向量的长度是不同词的总数,每个向量只有一个地方是1,其余为零,感觉这种表示方法很笨拙,不太能代表词的意义,单个向量意义不大,也没法表示词之间的关系,总之就是太笨了。表示方法二:word2vec,这个思想来源于“词的意思应该被它周围的文本所表示”,用词周围的的词来表示这个词,有点完形填空的味了。Note: word vectors are sometimes called word emb

2020-07-16 16:43:32 223

原创 Softmax函数通俗理解

最近学习CS224n的时候,里面教授有讲softmax的含义,一部分是max,一部分是soft。假如,我们有一些数字:{1,2,3,4,5,6,7,8,9},我们知道这个数列里面的最大值是9,如果我们定义一个映射:最大值不变,其他值为零,我们会得到这样的数列:{0,0,0,0,0,0,0,0,9},我们可以称这个映射为“hardmax”,直接选择最大值出来,其他值都是没有意义的。max:选择最大值,就像hardmax那样,可以得出最大值,我们观察这个公式,上下都有exp()函数,这是一个指数函数,而指

2020-07-09 20:28:11 705

原创 爬虫入门:爬取煎蛋妹子项目学习笔记

作为一名刚刚入门python和爬虫的小白,最近在学习github上面的爬虫入门项目(https://github.com/Dong-gxian/jandan_spider)时自然遇到了不少的困难,在这里把我的学习过程记录一下:首先是作者用到了几个库我没有见过:import argparseimport astimport atexitimport multiprocessing经过查阅得知:argparse模块是“命令行选项、参数和子命令解析器”,简单来说,就是用来实现命令行操作的,我们都

2020-07-06 15:51:39 235

原创 爬虫简单入门实战项目:用正则表达式爬取猫眼电影排行

  今天学习了《python3网络爬虫开发实战》的正则表达式部分,紧接着是一个爬虫小项目:爬取猫眼电影排行,看着没什么难度,就想自己来独立完成这个项目,部分参考了书上的代码。项目目标利用正则表达式抓取猫眼电影TOP100电影信息并保存。用到的库requests库、re库初步分析猫眼电影TOP100 的链接地址是https://maoyan.com/board/4,打开以后是这样的:把它拉到最下方,是有分页的,点击第二页:我们可以看到页面的URL变成了https://maoyan.com/

2020-07-05 17:29:31 655

原创 初学者如何阅读论文

成为一名研究生必不可少的工作是阅读论文,我想提升一下这方面的能力,能够用一种比较高效的方法阅读冗长的论文,于是我从知乎上搜索到了一个答案,里面是明尼苏达大学的一个教授的经验之谈,在这里记录一下(后续有好的方法或心得会持续更新)。首先审视一下论文是否值得花大量的时间去阅读阅读标题(title)和关键字(key words):如果标题和关键字不吸引你,就不去读。阅读摘要来熟悉论文。阅读结论(直接跳到最后看结论是不是跟你的研究有关)。浏览表格和图片(包括caption):这些东西是科学家们真正所做的的

2020-06-27 23:16:37 290

原创 使用requests.get()得到的源代码与浏览器中的不一样

最近在入门爬虫,遇到了一个问题,就是我用requests.get()之后得到的源代码跟浏览器里面的不一样(爬的是百度搜索“美女”之后的网页),今天看了崔庆才的《python3网络爬虫开发实战》在2.3.3节找到了答案:我们用urllib或requests获取到的是HTML源代码,但是这个网页是用js渲染的,上面两个库不会像浏览器那样继续运行后面请求来的js模块,所以不一样。还有一个问题,就是我用Beautiful Soup的find_all()方法找不到的标签,用正则表达式找到了,可能也跟上面有关?还需要

2020-06-26 19:47:52 10078 9

原创 指针数组,数组指针

最近复习C语言的时候接触到指针数组和数组指针,这两者通常会被搞混,今天突然间好像发现了什么,现在来记录一下。先说指针数组,有int型数组、char型数组、结构体型数组、那么指针数组也就不足为奇,举个例子:int *p[10]p是数组名,因为 [] 运算符的优先级高于 * , 所以p先与[]结合构成数组。这是为什么这种形式是指针数组。下面谈一谈数组指针,首先举个例子:int(*p)[10]...

2020-04-04 15:58:12 63

程序员数学

本书面向程序员介绍了编程中常用的数学知识,借以培养初级程序员的数学思维。读者无需精通编程,也无需精通数学,只需具备四则运算和乘方等基础知识,就可以阅读本书。

2018-11-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除