自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

LovePeppa的专栏

你当温柔,却有力量

  • 博客(47)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 趣味编程题之Milk Measurement

Farmer John purchases three cows: Bessie, Elsie, and Mildred, each of whom initially produces 7 gallons of milk per day. Since the milk output of a cow is known to potentially change over time, Farmer

2018-01-18 17:02:07 1067

原创 趣味编程题之Blocked Billboard

During long milking sessions, Bessie the cow likes to stare out the window of her barn at two huge rectangular billboards across the street advertising “Farmer Alex’s Amazingly Appetizing Alfalfa” and

2018-01-18 17:00:06 1256

原创 自动删除指定时间内的日志和文件shell脚本

直接上代码,注意shell格式很重要:#!/bin/bash#删除5天以前的日志数据 日志位于./logs 文件夹下find ./logs/ -mtime +5 -name "*.log*" -exec rm -rf {} \;#需要保留7天的数据的文件夹名FileDir7=(drama homepage weibo weixin )#需要保留20天的数据的文件夹名FileDi

2018-01-18 10:43:18 3143

原创 python通过FTP方式从虚拟机服务器上下载文件

因业务需求,需要将几台虚拟机服务器上的特定文件夹下的日志集中到一台服务器上,参考前人工作直接写python脚本,先上代码:#!/usr/bin/python# -*- coding:utf-8 -*-'''Created on 2017年6月28日@author: Luoxun'''import osimport sysimport ftplibimport socket#desD

2017-07-05 11:42:20 2602

原创 爬虫爬取页面过程中HttpClient导致的进程阻塞问题

爬虫爬取页面过程中HttpClient导致进程阻塞问题目前在做爬虫项目,爬取多个书籍网站的书籍详情页面,遇到一个很恶心的问题,别的网站都能在短时间内完成爬取,唯独网站A的线程卡死,永远随机的阻塞在某个页面。定位到错误点在下载函数,这是初始的下载函数: public String staticDownload(String urlstr, String encoding,String param)

2016-12-27 19:57:45 5162 3

原创 解决postgresql选择表名增加字段错误问题

解决postgresql选择表名增加字段错误问题表名:BOOKOMIT_OUTPUT_W Schemas:public 要向该表增加自增字段id,使用 alter table public.BOOKOMIT_OUTPUT_W ADD COLUMN id SERIAL primary key; 发现报错:ERROR: relation “public.bookomit_output_w” d

2016-09-23 11:01:38 2746

原创 在Mac terminal上安装scrapy过程报错及解决方法

使用pip install scrapy 下载scrapy很顺利,当下载lxml时出现src/lxml/includes/etree_defs.h:14:10: fatal error: 'libxml/xmlversion.h' file not found然后系统自动给出解决方法,搜索这个错误的时候stackoverflow也给出的是这个方法Could not find function xml

2016-08-25 20:04:00 1888

原创 推荐系统实践读书笔记一

第一章 好的推荐系统个性化推荐系统的应用电子商务 代表网站亚马逊,它是个性化推荐系统的积极应用者和推广者,被RWW(读写网)称为“推荐系统之王”。一个最主要的应用是个性化推荐列表,包括:推荐结果的标题、缩略图以及其他内容属性;推荐结果的平均分;推荐理由。另一个重要推荐应用是相关推荐列表,当你在亚马逊买一个商品时,它会在商品信息下面展示相关的商品,亚马逊有两种相关商品列表,一种是包含购买了这个商品

2016-06-29 23:14:52 570

原创 gitlab中fork项目向源项目merge过程中的conflict问题

前段时间使用gitlab管理项目,遇到这样的问题,我fork了项目组长建立的项目,其中: 组长项目地址:http://192.168.1.1:8000/LOL/demaxiya.git 或者 [email protected]:LOL/demaxiya.git。 我的项目地址:http://192.168.1.1:8000/OW/demaxiya.git 或者[email protected]:LO

2016-06-29 22:57:54 11804

原创 Web Scraping with Python 学习笔记9

Chapter 9: Crawling Through Forms and LoginsPython Requests Library        主要介绍Python Requests Library,它能处理更加复杂的HTTP requests, cookies, headers等等。Submitting a Basic Form        只需四行代码就可以完成一个简单的表单提交,下面是

2015-12-31 14:11:31 1473

原创 Web Scraping with Python 学习笔记8

Chapter 8:Reading and Writing Natural LanguagesSummarizing Data        自然语言处理这块有一项重要的内容就是文本摘要,本节涉及的只是去停用词,类似中文的“地,的,得”,英文中对应的“the,be,and”等等。大概有5000个高频词汇,这足够过滤掉很多无用的2-grams,下面展示的是前100个词汇:def isCommon(ng

2015-12-28 10:52:02 1451 1

原创 Web Scraping with Python 学习笔记7

Chapter 7:Cleaning Your Dirty DataCleaning in Code        首先简单介绍一下N-Gram,N-Gram是大词汇连续语音识别中常用的一种语言模型,对中文而言,我们称之为汉语语言模型(CLM, Chinese Language Model)。在做自然语言处理时,通常会根据句子中的固定搭配把句子划分为小片段,这里的固定搭配有2个词组成(2-gram)

2015-12-21 13:36:54 2945

原创 Web Scraping with Python 学习笔记6

Chapter 6: Reading Documents        本章主要解决文档读取问题,是否需要你下载下来再读取还是直接读取从中抽取你需要的数据,同时讨论一下不同文档的编码格式。文本文档        如果能直接爬取文本文档那是最好不过了,但是现在的网页都是HTML,XML等格式的,需要我们进行有针对的转换,通常情况下,我们把html文档转为BeautifulSoup对象,然后根据标签(比

2015-12-19 13:17:52 1497

原创 BeautifulSoup解析文档只有部分内容

首先建议参考:    http://m.blog.csdn.net/blog/muzixiaozi/39960219    我的错误跟他十分相似,同样python2.7的环境,调用BeautifulSoup解析网页源代码,发现解析后的结果丢掉后了小半部分,只保留前半部分的内容。    BeautifulSoup4.4的官方文档,给出了一个代码诊断的功能: from bs4.diagnos

2015-08-31 21:50:13 3588

原创 Mac下安装from matplotlib import pyplot或者 import matplotlib.pyplot as plt报错

>>>from matplotlib import pyplot Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/Library/Python/2.7/site-packages/matplotlib/pyplot.py", line 34, in <module> f

2015-08-19 14:32:44 3649

原创 Effective C++最新条款

说明:本内容摘自《Effective C++》侯捷译 01、视C++为一个语言联邦 同时支持过程形式,面向对象形式,函数形式,泛型形式,元编程形式的语言 02、尽量以const、enum,inline替换#define 对于单纯常量,最好以const对象或enums替换#define 对于形似函数的宏,最好改用inline函数替换#define 03、尽可能使用const 04、确定对

2015-07-09 18:29:46 439

原创 LeetCode算法题之String to Integer (atoi)

问题描述: Implement atoi to convert a string to an integer. Hint: Carefully consider all possible input cases. If you want a challenge, please do not see below and ask yourself what are the possible inpu

2015-05-27 15:19:57 416

原创 LeetCode算法题之Merge Sorted Array

问题描述: Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note: You may assume that nums1 has enough space (size that is greater or equal to temp + n) to hol

2015-05-27 11:17:08 399

原创 LeetCode算法题之Plus One

问题描述: 一个整数按位存储于一个vector中,排列顺序为:最高位在array[0] ,最低位在[n-1]。 解题思路: 从数组的最后一位开始加1,诸如999的数字加1后需要考虑进位。class Solution {public: vector<int> plusOne(vector<int>& digits) { vector<int> result;

2015-05-22 15:13:33 482

原创 LeetCode算法题之Next Permutation

问题描述 Implement next permutation, which rearranges numbers into the lexicographically next greater permutation of numbers. If such arrangement is not possible, it must rearrange it as the lowest possi

2015-04-21 12:02:11 478

原创 Flume-ng 多节点集群搭建

Flume NG是一个分布式、可靠、可用的系统,它能够将不同数据源的海量日志数据进行高效收集、聚合,最后存储到一个中心化数据存储系统中,方便进行数据分析。事实上flume也可以收集其他信息,不仅限于日志。由原来的Flume OG到现在的Flume NG,进行了架构重构,并且现在NG版本完全不兼容原来的OG版本。相比较而言,flume NG更简单更易于管理操作。 Flume OG:Flume ori

2015-04-10 13:02:19 13866

原创 LeetCode算法题之int to Roman

问题描述: Given an integer, convert it to a roman numeral. Input is guaranteed to be within the range from 1 to 3999. 将数字转换为罗马数字表示。 解题思路: 按照罗马数字组数标准组合即可,附罗马数字百度百科:http://baike.baidu.com/link?url=UUF_E

2015-04-07 23:01:46 494

原创 LeetCode算法题之Valid Sudoku

问题描述: Determine if a Sudoku is valid, according to: http://sudoku.com.au/TheRules.aspx The Sudoku board could be partially filled, where empty cells are filled with the character ‘.’. A partially fi

2015-04-07 13:50:23 465

原创 LeetCode算法题之Multiply Strings

问题描述: Given two numbers represented as strings, return multiplication of the numbers as a string. Note: The numbers can be arbitrarily large and are non-negative. 一个数字以字符串的形式相乘,这就意味着传统的乘法肯定不能满足,计算机表

2015-03-31 19:45:04 449

原创 LeetCode算法题之Rotate Image

问题描述: You are given an n x n 2D matrix representing an image. Rotate the image by 90 degrees (clockwise). Follow up: Could you do this in-place? 要求不能另开空间,一开始理解错了,后来画图明白了 解题思路: 首先以对角线为轴对称交换,再以中间列

2015-03-31 14:02:07 934

原创 LeetCode算法题之Anagrams

问题描述: Given an array of strings, return all groups of strings that are anagrams. Note: All inputs will be in lower-case. Anagrams指的是具有如下特性的两个单词:在这两个单词当中,每一个英文字母(不区分大小写)所出现的次数都是相同的。 例如,“Unclear”和“Nu

2015-03-31 12:13:58 499

原创 LeetCode算法题之Permutations

问题描述: Given a collection of numbers, return all possible permutations. For example, [1,2,3] have the following permutations: [1,2,3], [1,3,2], [2,1,3], [2,3,1], [3,1,2], and [3,2,1]. 给一个内部元素互不相等的集

2015-03-30 20:08:49 426

原创 LeetCode算法题之Pow(x, n)

问题描述:Implement pow(x, n).自己写函数实现乘方运算解题思路:直接实现肯定超时,并且要考虑指数为0,指数为1,指数为负,底数为0的特殊情况,此题用递归方法实现,以下代码来自《剑指offer》,此代码写的太赞了,如果想详细了解解题思路请买书!!刚看完所以直接贴上去运行了,必然轻松A过,向大神致敬!!!bool g_InvalidInput = fals

2015-03-27 17:35:51 456

原创 LeetCode算法题之Count and Say

//问题描述The count-and-say sequence is the sequence of integers beginning as follows:1, 11, 21, 1211, 111221, ...1 is read off as "one 1" or 11.11 is read off as "two 1s" or 21.21 is read o

2015-03-27 15:55:08 443

原创 LeetCode算法题之Implement strStr()

问题描述:Implement strStr().Returns the index of the first occurrence of needle in haystack, or -1 if needle is not part of haystack.字符串匹配解题思路:暴力破解和KMP算法,后者还没认真学习,直接一个个比较了!class Soluti

2015-03-27 09:58:21 520

原创 LeetCode算法题之Remove Duplicates from Sorted Array

问题描述:Given a sorted array, remove the duplicates in place such that each element appear only once and return the new length.Do not allocate extra space for another array, you must do this in

2015-03-26 17:15:00 438

原创 Python爬虫爬取百度搜索结果——邮箱地址

因为需要拿一些外部邮箱做测试,所以要获得一些真实的邮箱地址,我在百度上搜索"@xxxx.com.cn"(xxxx保密,哈哈)之后,得到大概1,700,000条结果。但我只需要一千个不重复的就够了,鼓捣了一下午终于搞定,直接贴上代码,具体说明都写在注释里。(另外我发现学会正则表达式真的特别重要,附上大神写的正则表达式学习指南:http://www.cnblogs.com/huxi/archive/2

2015-03-24 14:19:02 6074 2

原创 LeetCode算法题之Valid Parentheses

问题描述:Given a string containing just the characters '(', ')', '{', '}', '[' and ']', determine if the input string is valid.The brackets must close in the correct order, "()" and "()[]{}" are all v

2015-03-23 17:05:27 387

原创 LeetCode算法题之Letter Combinations of a Phone Number

问题描述:手机键盘上的数字对应着若干个字母,输入一组由数字组成的字符串,对应输出相应的字母的所有可能组合,顺序不限解题思路:暴力破解可以得到结果相当于遍历一棵树,可以使用数的遍历算法DFS25 / 25 test cases passed.Status: AcceptedRuntime: 3 ms

2015-03-16 16:24:36 411

原创 POJ之1012

问题描述:有k个坏人k个好人坐成一圈,前k个为好人(编号1~k),后k个为坏人(编号k+1~2k),现在从编号1开始报数,一直报到m,一轮结束后,必须要求第m个报数的人死掉,而且他要是坏人,在他死掉之后继续从他的下一个开始报数,也是从1开始报到m,第m个是坏人,拉出去毙掉,直到坏人全部死去,好人全部留下,我们需要编程找到这个值m; 解题思路: 推导时要注意2点:第一:每

2015-03-13 15:15:52 551

原创 POJ之1014

/*两人分石头,要求平分,但石头大小不一,价值也不一样,从1到20000,如果一堆石头的总价是奇数显然不可分,则输出不可分割否则再看这堆石头是否能被分成两份,在保证石头完好无损的情况下。输入1 0 1 2 0 0代表价值为1的1个,价值为2的0个,·····;即有四块价值分别为4,4,3,1的石头,显然这石头是没法分的输入1 0 0 0 1 1代表·····,即有三块价值为6,5,

2015-03-10 18:43:34 343

原创 自学数据挖掘十大算法之PageRank

PageRank是Google用来衡量一个网站好坏的唯一标准,Google将其分为0—10级,一般PR值达到4,该网站已经很不错了,Google将自己的网站等级定为10。对于某个互联网网页A来说,该网页的PageRank值的计算基于两个假设: 数量假设在Web图模型中,如果一个页面节点接收到的其他网页的入链数量越多那么这个网页越重要。

2015-03-05 22:11:02 1374

原创 POJ之1007

/*"DEABC",对于D有ABC三个按照字母顺序排列应该排在D前,此时在D后故,对D有逆序个数3,对于E同理逆序个数3,ABC均为正序,故整个字符串逆序程度为3对于DNA序列input:AACATGAAGG  TTTTGGCCAATTTGGCCAAAGATCAGATTTCCCGGGGGGAATCGATGCAT第一个3+5+2第二个6*4+4*2+2*2

2015-02-11 15:07:23 517

原创 自学数据挖掘十大算法之CART

分类与回归树(Classification andRegression Trees, CART)算法由Breiman等人于1984年提出,是分类数据挖掘算法的其中一种。CART采用一种二分递归分割的技术,将当前的样本集分为两个子样本集,使得生成的决策树的每个非叶子节点都有两个分支。CART算法生成的决策树是结构简洁的二叉树。分类树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法;第二个

2015-02-06 10:42:51 4606

原创 LeetCode算法题之ZigZag Conversion

问题描述:The string "PAYPALISHIRING" is written in a zigzag pattern on a given number of rows like this: (you may want to display this pattern in a fixedfont for better legibility)P   A   H   NA P

2015-02-03 12:48:46 555

MySQL-Python for Windows 64位

使用在此windows系统中的python来安装一个mysqldb模块

2015-04-30

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除