自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 seaborn画图

import pandas as pd dataset = pd.read_csv("E:\data\cal_housing.csv")print("Dataset: {}".format(dataset.shape))print("Columns: {}".format(dataset.columns))dataset.head(5)import matplotlib.pyplo...

2019-10-17 17:39:47 307

原创 stanfordcorenlp安装

stanfordcorenlp安装:win10+JDK1.8.0_144+Python3.7.3+stanford-corenlp-full-2016-10-31成功调用Server,启动服务后调用速度能加快cmd启动服务命令:cd E:\tools\stanford-corenlp-full-2016-10-31; java -mx4g -cp "*" edu.stanford.nlp.p...

2019-10-14 14:17:06 989

原创 Tensorflow分布式训练

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2019/10/10 13:50# @Site : # @File : distributed_MNIST.py# @Software: PyCharmimport tensorflow as tffrom tensorflow.contrib.learn...

2019-10-11 16:36:50 345

原创 python多进程和串行运行

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2019/10/8 10:40# @Site : # @File : 多进程_串行.py# @Software: PyCharmimport timeimport multiprocessingdata = range(8)def muchjob(x...

2019-10-08 11:06:37 424

原创 使用单例模式加速

from ... import ...相当于一个单例模式,模块第一次导入后会生成.pyc文件第二次导入时,就会直接加载.pyc文件基于__new__方法实现当我们实现单例时,为了保证线程安全需要在内部加入锁我们知道,当我们实例化一个对象时,是先执行了类的__new__方法(我们没写时,默认调用object.__new__),实例化对象;然后再执行类的__init__方法,对这个对象进...

2019-09-24 11:51:22 190

原创 numpy求范数

用于求向量欧式距离import numpy as npw[u][v] += num / (1 + np.linalg.norm(u_vector - v_vector))

2019-09-23 14:59:47 799

原创 正则匹配护照格式

美国、英国护照号码:9 位数字 加拿大护照:2 个字母加 6 个数字 法国护照:2 个数字加 2 个字母加 5 个数字 意大利护照:2 个字母加 7 个数字 西班牙护照:3 个字母加 6 个数字 德国护照:9 个字符,由 2-3 个数字与 6-7 个字母混排,头尾是字母。或者单纯为 9 个数字def foreign_passport(sentence): pattern = [r'...

2019-09-20 16:46:07 4837

原创 判断字符串中是否有身份证号码

# -*- coding: utf-8 -*-import reclass Solu:# Errors=['验证通过!','身份证号码位数不对!','身份证号码出生日期超出范围或含有非法字符!','身份证号码校验错误!','身份证地区非法!'] def checkIdcard(self, idcard): Errors = ['验证通过!', '身份证号码位数不对...

2019-09-18 18:22:06 2210

原创 mysql查询在一个表而不在另一个表中的数据

select C.company_name,C.company_address from Companylist C left join "company_LoAndLa" L on C.company_name=L.company_name where L.company_name is null其他两种写法:select distinct A.ID from A where A.I...

2019-09-18 09:10:25 627

原创 scrapy 通过命令行传参数批量爬取

class EypSpider(scrapy.Spider): name = 'eyp' def __init__(self, category=None, *args, **kwargs): super(EypSpider, self).__init__(*args, **kwargs) cat = [category, category] ...

2019-09-10 16:09:42 538

原创 手写逻辑回归

LR代码:import numpy as npfrom sklearn.metrics import accuracy_scoreclass LogisticRegression(object): def __init__(self): """初始化Logistic Regression模型""" self.coef = None ...

2019-09-04 10:55:47 557

原创 查找两个数组的公共元素,最大和子序列

jd面试题l1 = [2,3,4,5]l2 = [4,6,7,8]print([x for x in l1 if x in l2])查找数组中最大和子序列nums = [3,-5,7,4,10]s = 0seq = [x for x in nums if x >=0]print(sum([x for x in nums if x >=0]))最大连续子序列...

2019-09-03 10:45:03 699

原创 python 读取本地excel存入数据库

import pandas as pdimport osfrom read_pgdata import Postgredataroot_dir = r'root'file_names = os.listdir(root_dir)[:-1]print(len(file_names), file_names)pg = Postgredata()for i in range(len(...

2019-09-02 11:44:40 541

原创 查询表中第一个下订单的用户id和订单id

滴滴笔试题order_list表:userid,orderid,start_timeselect userid,orderid from order_list awhere(select count(*) from order_list b where b.start_time<a.start_time)<=1 selectuserid,orderidf...

2019-08-29 17:33:40 2423

原创 python时间格式转换

import time, datetimenow = datetime.datetime.now()ago = now - datetime.timedelta(days=30)print(ago.strftime("%Y-%m-%d %H:%M"))输出:2019-07-30 15:51得到30天前的时间。

2019-08-29 15:51:54 218

原创 python RPC原理

rpc远程调用原理 :比如 A调用B提供的remoteAdd方法:首先A与B之间建立一个TCP连接;然后A把需要调用的方法名(这里是remoteAdd)以及方法参数(10, 20)序列化成字节流发送出去;B接受A发送过来的字节流,然后反序列化得到目标方法名,方法参数,接着执行相应的方法调用(可能是localAdd)并把结果30返回;A接受远程调用结果,然后do()。RPC框...

2019-08-28 16:41:50 358

原创 Postgresql 数据库操作类

# -*- coding: utf-8 -*-'''Postgresql 数据库操作类'''import psycopg2import json# import pandas as pd# 从postgresql获取数据class Postgredata(): def __init__(self): self.dbname = "----" ...

2019-08-16 18:46:33 255

原创 同时解决最长公共子序列和最长回文子序列

'''给定两个单词word1和word2,找到使得word1和word2相同所需的最小步数,每步可以删除任意一个字符串中的一个字符。示例 1:输入: "sea", "eat"输出: 2解释: 第一步将"sea"变为"ea",第二步将"eat"变为"ea"说明:给定单词的长度不超过500。给定单词中的字符只含有小写字母。'''#LCS 最长公共子序列#构建dp...

2019-08-15 15:26:38 280

原创 回溯法电话号码字母组合问题

https://leetcode.com/problems/letter-combinations-of-a-phone-number/#回溯法电话号码问题import itertoolsclass Solution: def letterCombinations(self, digits): if len(digits) == 0: r...

2019-08-03 10:54:47 357

原创 selenium模拟firefox点击,优化内存

import scrapyfrom parse_tools.parseTools import get_text, get_js_webpagefrom parse_tools.Postgredata import Postgredatafrom customswords.items import realtime_flight_filterfrom selenium import we...

2019-08-02 09:29:54 977

转载 Linux chmod命令

Linux/Unix 的文件调用权限分为三级 : 文件拥有者、群组、其他。利用 chmod 可以藉以控制文件如何被他人所调用。使用权限: 所有使用者语法chmod [-cfvR] [--help] [--version] mode file...参数说明mode : 权限设定字串,格式如下 :[ugoa...][[+-=][rwxX]...][,...]其中:...

2019-07-31 10:24:09 127

原创 win10+tensorflow1.12.0+CUDA9.0+cudnn7.1

注意:上面版本成功安装,tensorflow1.7.0也可以安装,环境变量只需配置path路径就可以。

2019-07-30 11:54:09 204

转载 Tensorflow搭建bilstm+attention文本分类模型

# 构建模型class BiLSTMAttention(object): """ Text CNN 用于文本分类 """ def __init__(self, config, wordEmbedding): # 定义模型的输入 self.inputX = tf.placeholder(tf.int32, [None, confi...

2019-07-26 16:46:57 8057 1

原创 爬虫相关

模拟浏览器访问:from selenium import webdriverfrom scrapy.selector import Selectorbrowser = webdriver.Firefox()browser.get("https://www.planespotters.net/deliveries/1960/01")res = Selector(text=browser...

2019-07-25 16:53:14 219

原创 scrapy爬虫

创建一个新scrapy项目:scrapy genspider boatcompany www.sofreight.com使用scrapy爬取航司网站数据爬取一个div中所有文字text:text = response.xpath('//div[@class="carrier_desc"]').xpath('string(.)').extract_first()爬取链接时要注意空链接判断使...

2019-06-20 17:18:12 195

原创 python实现树的广度优先搜索BFS

题目描述从上往下打印出二叉树的每个节点,同层节点从左至右打印。# class TreeNode:# def __init__(self, x):# self.val = x# self.left = None# self.right = Noneclass Solution: # 返回从上到下每个节点值列表,...

2019-05-03 20:54:59 1116

原创 定义一个栈,得到栈中最小元素,要求时间复杂度为O(1)

题目描述定义栈的数据结构,请在该类型中实现一个能够得到栈中所含最小元素的min函数(时间复杂度应为O(1))。思路:利用一个辅助栈来存放最小值 栈 3,4,2,5,1 辅助栈 3,3,2,2,1每入栈一次,就与辅助栈顶比较大小,如果小就入栈,如果大就入栈当前的辅助栈顶当出栈时,辅助栈也要出栈这种做法可以保证辅助栈顶一定都当前栈的最小值。#...

2019-05-03 13:01:14 439

原创 Python写一个微信个性签名词云

#!/usr/bin/env python# -*- coding: utf-8 -*-# File : wxfriends_information.py# Author: PengLei# Date : 2018/8/2import itchat ,time,sys,xlwtfrom pyecharts import WordCloudimport randomfile...

2018-08-02 16:36:18 415

原创 Python生成微信好友信息excel

包括昵称,备注,个性签名等import itchat ,time,sys,xlwtfile = xlwt.Workbook()table = file.add_sheet('info', cell_overwrite_ok=True)itchat.auto_login(hotReload=True)print(u'logged')friends = itchat.get_fri...

2018-08-02 15:45:28 868

转载 用Python画一个3D散点图

话不多说,直接代码~from pyecharts import Scatter3Dimport randomdata = [ [random.randint(0, 100), random.randint(0, 100), random.randint(0, 100)] for _ in range(580)]range_color = [ '#...

2018-08-02 14:04:32 5615 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除