自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

当法律与事业相遇

当法律与事业相遇

  • 博客(34)
  • 资源 (1)
  • 收藏
  • 关注

原创 1.用人单位扣押劳动者身份证等证件或者要求提供担保的应该承担什么法律责任?

《劳动合同法》第84条规定了用人单位的法律责任,用人单位违反法本法规定,扣押劳动者身份证等证件的,由劳动行政部门责任限期退还劳动者本人,并依照有关法律规定给予处罚。用人单位违反本规定,以担保或者其他名义向劳动者收取财物的,由劳动行政部门责令限期退还劳动者本人,并以每人五百元以上二千元以下的标准处以罚款;给劳动者造成损害的,应当承担赔偿责任。...

2021-09-16 16:36:28 147

原创 竞业禁止与竞业限制

文章目录一、竞业禁止二、竞业限制三、竞业限制的经济补偿金四、竞业禁止和竞业限制二者区别五、股东竞业的要求六、公司的董事可以在外面同业公司做监事吗?广东赋诚律师事务所 谢华东一、竞业禁止法定竞业禁止:《公司法》第一百四十八条规定:董事、高级管理人员不得有下列行为: 第(五)项:“未经股东会或者股东大会同意,利用职务便利为自己或者他人谋取属于公司的商业机会,自营或者为他人经营与所任职公司同类的业务。”《公司法》第六十九条规定:“国有独资公司的董事长、副董事长、董事、高级管理人员,在没有经过国有资产监督

2021-06-08 15:28:50 656 1

原创 自我再教育

我写这一个专栏是用来总结自己的过往以及对未来的一点点思考。希望我的文章对你有帮助。我先设计一些大纲:1. 为什么有些人不吹牛会死?2. 决定程序员水平高低的因素都有哪些?3. 如何保持人格独立?4. 我是如何在一线城市扎根的?5. 你为什么娶她?6. 你有没有付费学习过?没有的话,请付费一次。7. 情绪哪里宣泄?8. 我的母校我的爱9. 我是如何战胜病魔的?10. 未来五...

2020-03-30 14:33:11 279

原创 爬虫-广州市中小学信息爬取-(2020-03-30)

文章目录爬取的网站爬取的代码致谢爬取的网站想要学区房,先看看你的孩子想要去哪个学校。如果不知道哪个学校好,想要所有的学校,那么我这个爬虫脚本可以给你帮忙。51搜学校网站爬取的代码# coding:utf-8import datetimeimport jsonimport osimport reimport timefrom copy import copyimport xl...

2020-03-30 14:14:26 564 1

原创 爬虫-东方财富网报表爬取(2020-03-25)

文章目录爬取网站疑难分析代码致谢爬取网站领导又让人爬数据了,其实爬虫对我来说也就兼职做做,下面要爬取就是这个网站的几张列表。这个网站其实之前写过代码的,只是后来吧,这个数据被加密反爬虫了。东方财富网报表疑难分析因为这个数据被加密了,所以我去找他的js。发现他的js链接是:http://dcfm.eastmoney.com/em_mutisvcexpandinterface/api/...

2020-03-25 13:46:43 3521

原创 netty是什么?你什么时候需要使用netty?-(2020-03-18)

文章目录想要远程调用,你会遇到哪些问题?Netty是什么东西?想要远程调用,你会遇到哪些问题?远程调用,A系统的服务调用B系统的服务,很多没有经历过分布式系统实战的一部分同学就会像我以前的时候一样,用http方法,用springboot的restTemplate去调用,RestTemplate是Spring提供的用于访问Rest服务的客户端,RestTemplate提供了多种便捷访问远程Htt...

2020-03-18 15:52:43 1232

原创 对netty的认知以及小小的生产实践-(2020-03-18)

文章目录简要说明文章序列大概内容简要说明最近想把去年在生产中实践的Netty技术在这里分享一下。我先把整体要写的内容做一个简单概要:文章序列大概内容netty是什么?你什么时候需要使用netty?netty跟nio,socket有什么联系?netty的入门级代码nio在网络通信中入门级代码socket的入门级代码netty的生产小实践。什么是粘包和拆包,netty是如何处理...

2020-03-18 15:10:34 111

原创 zookeeper源码阅读——导入源码到IDEA中(2019-11-15)

文章目录windows安装ant编译zookeeper导入ideawindows安装ant下载ant:http://archive.apache.org/dist/ant/binaries/下载apache-ant-1.10.5-bin.tar.gz,解压缩,然后配置环境变量ANT_HOME,把$ANT_HOME/bin加入到PATH环境变量里去。ant -version检查一下ant的版...

2019-11-15 23:19:22 566

原创 爬虫-中国招标投标公共服务平台数据下载(2019-08-07)

文章目录前言代码详情后话前言最近都在写java,但是呢我的博客似乎写了很多爬虫的文章。昨天,一个朋友发了需求给我,帮她改改代码,于是我就自己改了一下。以后还是多写一写数据平台研发的文章。需求如下:网站地址:http://bulletin.cebpubservice.com/搜索关键字:银行内容:招标公告公告发布时间:后台自定义渠道:全部需要爬取的数据字段:招标公告名称、所属行业...

2019-08-07 21:38:29 6895 6

原创 01-Java的特点(2018-12-05)

文章目录开头Java之父Java语言特点常见的DOS命令JDK下载地址Java程序解析运行与工作原理开头都是记录自己的想加深知道和不知道。Java之父Java之父——詹姆斯·高斯林出生于加拿大,是一位计算机编程天才。在卡内基·梅隆大学攻读计算机博士学位时,他编写了多处理器版本的Unix操作系统,是JAVA编程语言的创始人。1983年获得了美国卡内基梅隆大学计算机科学博士学位,毕业后到IB...

2018-12-05 08:30:07 140

原创 爬虫-浦发银行-信用数据抓取(2018-11-19)

文章目录爬虫地址爬虫技术爬虫代码致谢爬虫地址http://per.spdb.com.cn/professional_investment_research/preferential_merchants/爬虫技术参照其他几篇文章:爬虫-中国银行卡-优惠商户活动数据(2018-11-15)爬虫-新浪财经-信用卡优惠商店数据(2018-11-15)爬虫代码# -*-coding:utf...

2018-11-19 15:11:41 2497 1

原创 爬虫-建设银行信用卡商家优惠数据抓取(2018-11-19)

文章目录爬虫地址爬虫环境和技术爬虫代码致谢爬虫地址http://creditcard.ccb.com/cn/creditcard/creditFavarite.html#card_province=1020&card_city=196&startNum=1&endNum=10爬虫环境和技术python3.6技术使用参照另外 两篇文章:爬虫-中国银行卡-优惠商户...

2018-11-19 15:06:46 1534

原创 爬虫-金采网数据(2018-11-19)

文章目录爬虫地址环境爬虫代码致谢爬虫地址http://www.cfcpn.com/plist/caigou?pageNo=1&kflag=0&keyword=&keywordType=&province=&city=&typeOne=&ptpTwo=,,环境python3.6.5爬虫代码# -*- coding:utf-8*

2018-11-19 14:35:13 1590

原创 爬虫-新浪财经-信用卡优惠商店数据(2018-11-15)

文章目录爬虫地址涉及技术爬虫思路亮点爬虫代码特别鸣谢爬虫地址http://money.finance.sina.com.cn/creditcard/view/vMerchantsearch.php涉及技术requests请求链接re正则表达式lxml.etree.HTML 函数把字符串转为html对象xlrd和xlwt保存为excel文件爬虫思路先找到所有的银行和城市用...

2018-11-15 16:46:41 762

原创 爬虫-中国银行卡-优惠商户活动数据(2018-11-15)

文章目录爬虫地址设计技术爬虫思路爬虫代码致谢爬虫地址http://www.boc.cn/sdbapp/rwmerchant/sra32/设计技术requests请求页面re正则表达式xpath语法解析html对象爬虫思路爬虫开始先找到大类,大类比如:每一个大类找到分页的链接解析每一个分页的链接里面的商店的链接对每一个商店的链接进行抓取和解析爬虫结束爬虫代...

2018-11-15 16:32:57 1064

原创 十分钟sparkstreaming简单入门测试(2018-04-19)

idea编辑器安装下载spark安装包和scala的安装包添加环境变量idea中新建项目启动nc -lk启动流计算程序idea编辑器安装参考笔记:http://www.aboutyun.com/thread-22320-1-1.html给大家准备了资料包: 下载地址: https://pan.baidu.com/s/1auAjP4npWDD0o...

2018-06-14 17:18:45 1325

原创 01-spark的standalone模式部署(2017-06-19)

1克隆一台虚拟机2安装jdk3安装spark4配置ssh免密码登录5启动集群6启动spark-shell7蒙特卡洛求Pi8worldcount打包实验1、克隆一台虚拟机删除[root@zbserver ~]# rm -rf /etc/udev/rules.d/*修改网卡[root@zbserver ~]# cat /etc/sysconfig/network-scripts/ifcfg

2017-06-20 22:57:45 832

原创 04-postgresql-9.6.1安全管理之pg_hba.conf配置(2017-06-12)

1测试需求2步骤1检查192168181141上的postgresql数据库的postgres用户l密码2修改密码为postgres3配置192168181141的pg_hbaconf文件4测试5附加测试配置pgpass1、测试需求192.168.181.141上的postgresql数据库,192.168.1.138要无密码登录进来,192.168.181.181要md5登录2、步骤

2017-06-12 17:43:43 1965

原创 1-新浪微博爬虫-(2017-05-09)

爬虫新浪微博博客

2017-05-10 21:05:26 5214

原创 01-centos7.2上源码编译部署LNMP+zabbix3.2(2017-03-07)

配置基础服务安装mysql数据库安装nginx安装php配置php安装zbabixZabbix Server基本配置Nginx和Zabbix Server Front Web配置web配置页面配置基础服务[root@zbserver ~]# cat /etc/redhat-releaseCentOS Linux release 7.2.1511 (Core)[root@zbser

2017-03-08 20:50:03 2662

原创 03-redhat-6.5升级python2.6到python2.7&安装psycopg2&连接postgresql-9.6.1(201-02-07)

1参考文档2安装依赖包3升级python4安装pip5安装psycopg26连接查询插入测试1、参考文档http://ruter.sundaystart.net/2015/12/03/Update-python/2、安装依赖包[root@pg96 ~]# yum -y update[root@pg96 ~]# yum install epel-release[root@pg96 ~]#

2017-02-07 22:16:04 1227

原创 02-源码编译安装测试postgresql 9.6.1(2017-02-07)

1下载安装包postgresql 9612软件下载3解压1 安装依赖包2 增加用户设置密码4配置编译选项5编译6初始化数据库7配置环境变量8启动测试9配置系统服务参考笔记1、下载安装包postgresql 9.6.1地址:http://ftp.stu.edu.tw/pub/postgresql/latest/rpm下载地址:https://yum.postgresql.org

2017-02-07 22:07:51 2506

原创 01-postgres9.4.5在redhat6.5环境下源码编译安装(2016-11-08)

0读者须知1安装redhat652更改本地yum源4解压postgres5安装依赖包6增加用户设置密码7开始编译和安装postgres8设置环境变量9初始化数据库10系统服务11启动数据库14开启远程访问15信任远程连接16重启postgreSQL服务17参考文档0、读者须知:1、安装前请阅读笔记末尾的三篇安装文档,还算靠谱。 2、跟着这篇笔记安装肯定是可以安装好的,不

2016-11-08 20:50:23 1143

原创 02-shell文本处理三剑客之sed

sed 是流编辑器,但是它不会修改源文件。sed (流文本编辑器) 用法:sed OPTIONS… [SCRIPT] [INPUTFILE…] -r: 使用扩展的正则表达式; -n, –quiet, –silent: 不输出模式空间的内容; -i:直接编辑原文件; -e: -e ” -e ” -e ”

2016-06-07 13:37:02 1402

原创 01-shell文本处理三剑客之grep

开篇:哈喽,今天我想写写shell编程,打算平均一天一篇吧,这样一个月后就可以进步比较多。 先从shell文本处理三剑客grep、sed、awk开始。听说啊,要是我不会这个命令,就不好意思说自己会shell编程。1 grep是什么意思?grep: Global search REgular expression and Print out the line. 文本搜索工具,根据用户指定的“模式(

2016-06-07 10:04:42 3601 2

原创 09-Hive查询操作Distributed by 和sort by

声明: 哈喽,大家好,我是谢老师。 今天来学习的是Distributed by 和sort by语法。首先还是要来回顾一下上一讲所学的join和mapjoin操作。mapjoin会比join快很多,数据量很小的时候优势不明显,数据量很大的时候就快很多了。mapjoin其实就是join的优化。很多人都说Hive语法很简单,跟写sql语句差不多,但是hive优化就比较难了,这一点我也感觉到了。 那

2016-06-06 21:57:42 15206

原创 08-Hive高级查询join

声明:我的朋友,这一篇不要转载,因为你可以直接在这里看。大家好,我们今天来学习Hive高级查询join语法。你有没有期待把Hive学完整?我打算写完整,只要我知道。我写的都是比较接地气的,因为高大上的我知道的少。砸门一起加油进步吧!1 我们先回顾一下上一节课说的。上一节我们知道了:order by是一个全局的操作,groupby是一个聚合的操作。避免数据倾斜的方法之一是设置参数:hive.group

2016-06-06 21:06:16 1389

原创 07-Hive高级查询order by、group by

声明:未经本人允许,不得转载哦!哈喽,大家好。这两天就要高考了,我原本是一名物理老师,这一届初高中的学生带完,估计就要开始找大数据岗位的工作了。目前掌握的是技能有java+linux++mysql+hadoop+hive+hbase,正在学习的是shell,计划2016年接着要学习的是scala+spark。祝我好运吧。今天我们一起来学习的是【Hive高级查询group、order语法】。话不多说,

2016-06-06 18:16:35 10933 3

原创 06-Hive表属性操作

大家好!砸门又又又又见面了。我再自我介绍一下哈,我长得比较帅,帅到哭的那种。 呵呵,开玩笑。这世界上,唯独美人和大数据不可辜负。好好学大数据技术,技多不压身。越学人就越帅,你说是吧?言归正传,今天要做的实验是Hive表属性操作。 表属性有啥?表名称、增加列,修改列呀!修改表名alter table table_name rename to new_table_name;修改列名alter tab

2016-06-02 22:19:38 7414

原创 05-Hive动态分区

大家好!砸门又见面了。我先作一个自我介绍吧。我是一个打算学习大数据一万小时的谢老师,目前学习了800多小时了,现在正在努力。 今天来玩的实验是:Hive分区表的动态分区分区是在处理大型事实表时常用的方法。分区的好处在于缩小查询扫描范围,从而提高速度。分区分为两种:静态分区static partition和动态分区dynamic partition。静态分区和动态分区的区别在于导入数据时,是手动输入

2016-06-02 20:57:54 1750

原创 04-Hive数据导出

大家好!砸门又见面了。今天来玩一下Hive数据导出。 导出的方式有以下几种 1)hadoop命令的方式 get text 2)通过insert…directory方式insert overwrite[local] directory '/tmp/ca employees'[row format delimited fields terminated by '\t']se

2016-06-02 17:44:57 937 1

原创 03-Hive数据加载的几种方式

声明:前面两篇文章已经知道了如何创建表 现在我们来学习Hive数据加载不得不说一个知识点:hive -help、hive –help 、 hive –service -help[root@hadoop1 host]# hive -helpusage: hive -d,--define <key=value> Variable subsitution to apply to

2016-06-02 17:11:36 8618

原创 02-Hive一个表创建另一个表,表分区,分桶

声明:如果你是初学者,看我这篇文章的时候,看我上一篇会更好。 Hive表的创建:http://blog.csdn.net/qq_29622761/article/details/51564680这篇的主要内容目录是:由一个表创建另一个表hive不同文件读取对比hive分区表hive分桶你现在开始吧! 1. 由一个表创建另一个表 格式:ceate table test3 like te

2016-06-02 12:32:07 13782 2

原创 01-Hive创建表

声明:本实验环境是Apache hadoop-2.2.0,zookeeper-3.4.5,mysql Server version: 5.1.73作为元数据库,hive版本是apache-hive-0.9.0-bin,都是apache,不是CDH和其他。本实验集群3台,一个主节点(hadoop1),三个从节点(hadoop1,hadoop2,hadoop3),zk在三个节点中都安装。本实验的数据都是

2016-06-02 10:48:37 20465 1

学校信息_2020-03-30.xls

爬取的学校信息数据,有小学的和中学的,如果需要其他的也可以联系我。这个是我的爬虫脚本的结果。

2020-03-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除