- 博客(16)
- 收藏
- 关注
原创 pyltp安装中的各种坑
采用pip install pyltp,安装过程十分曲折坑一: 提示没有visual c++,于是要先装好vc坑二: 提示 D:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_amd64\\cl.exe' failed with exit status 2 错误果断放弃pip的安装方法 ...
2018-09-19 11:23:11 7727 2
原创 爬虫方法二 分析Ajax请求抓取今日头条街拍美图
前言:有过一些自学爬虫的经历,但都是很小的爬虫。步骤如下:1、解析页面打开街拍页面图集,重新加载,发现又回到综合的那页。审查元素,找到network,发现并没有返回街拍那页的源代码。点开XHR,headers里面查看,可看见keyword为街拍,再点开preview,点开data,可以看见data的title对应上了页面数据。2、代码编写def get_page_index(offset,keyw...
2018-05-14 17:19:40 229
原创 知识图谱
一、获取关键词#基于nltk获取关键字(针对英文)from rake_nltk import Raker = Rake()#mytext = 'Hello evryone , my name is wyz.Nice to meet you'mytext = '海南拟建国际自贸区和自贸港。对此,多家公司回应在海南业务情况。基金君整理如下:欣龙控股:在海南老城经济开发区拥有的近1000亩土地证...
2018-04-16 11:01:29 264
原创 train.py
# coding: utf-8# In[1]:FN = 'train'# you should use GPU but if it is busy then you always can fall back to your CPU# In[2]:import osos.environ['THEANO_FLAGS'] = 'device=cpu,floatX=float3...
2018-03-29 16:28:38 766
原创 vocabulary_embedding.py
# coding: utf-8# Generate intial word embedding for headlines and description# The embedding is limited to a fixed vocabulary size (`vocab_size`) but# a vocabulary of all the words that appeared ...
2018-03-29 16:28:04 486
原创 Predict.py
# coding: utf-8# In[1]:FN = 'predict'# if your GPU is busy you can use CPU for predictions# In[2]:import osos.environ['THEANO_FLAGS'] = 'device=cpu,floatX=float32'# In[3]:import th...
2018-03-29 16:27:15 855 1
原创 Deep learning with python 学习笔记(一)
一、前馈神经网络 第三章: 编写前馈神经网络的代码:#Layer Neural Network for Regressionimport autograd.numpy as npimport autograd.numpy.random as nprfrom autograd import gradimport sklearn.metricsimport pylab#Genera...
2018-03-25 22:19:20 1585
原创 A Neural Attention Model for Abstractive Sentence Summarization 论文阅读笔记
作者:Rush, A. M., Chopra, S., & Weston, J.单位 :Facebook AI Research / Harvard SEAS关键词:Neural Attention, Abstractive Sentence Summarization文章来源:EMNLP 2015问题这篇来自Facebook的paper的主题是基于attention based NN的生...
2018-03-20 20:27:30 1949 1
原创 Keras 学习
Keras:基于Python的深度学习库一、介绍 Keras是一个高层神经网络API,Keras由纯Python编写而成并基Tensorflow、Theano以及CNTK后端。
2018-03-12 16:11:28 192
原创 日常学习总结
3月9日一、使用linux,并完成安装redis。./redis-server port:6379,PID:35854二、安装dockerDocker的三大核心概念:镜像、容器、仓库镜像:类似虚拟机的镜像、用俗话说就是安装文件。容器:类似一个轻量级的沙箱,容器是从镜像创建应用运行实例,可以将其启动、开始、停止、删除、而这些容器都是...
2018-03-12 14:42:30 285
原创 日常疑问
1.若pip不成功的话,则尝试doc下,即可成功conda install -c anaconda html5lib 或者更新pip python -m pip install --upgrade pip2.word2vec词向量word2vec也叫word embeddings,中文名“词向量”,作用就是将自然语言中的字词转为计算机可以理解的稠密向量(Dense Vector)。在w...
2018-02-01 19:40:45 112
原创 python 爬虫学习
Python 爬虫第一周内容 一、回顾div+css ①div:区域 p:文字内容 li:列表 ul:无序列表 img:图 h1-h6 :不同字号标题 a herf= “”:链接 hr: !–使用hr标签实现水平分割线,需要注意的是这个标签比较特殊,在html中只有开始标签hr,没有结束标签/hr borde
2017-12-11 20:49:29 237
原创 文章标题
Python 爬虫第一周内容 一、回顾div+css ①div:区域 p:文字内容 li:列表 img:图 h1-h6 :不同字号标题 a herf= “”:链接 hr: !–使用hr标签实现水平分割线,需要注意的是这个标签比较特殊,在html中只有开始标签hr,没有结束标签/hr ②header 信息传递给浏览器,对我们不可见 content
2017-12-10 21:01:40 110
原创 Python 基础学习
一、Python中的数据结构(容器)①List(列表) a=[1,2,3,4] 用方括号标记 可被修改 a[0] = 1②Tuple(元组) a=(4,5,6) 用圆括号标记 不可被修改 b[0] = 4③Dictionary(字典) 即映射 d = { 'today':20,'tomorrow':30 }④Set(集合) 不重复,无序,不支持索引 s = {...
2017-11-02 21:35:13 235
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人