自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (15)
  • 收藏
  • 关注

原创 开发篇1_如何管理证书(并上传Azure)

作为Azure开发者,vs是最好的开发工具(建议大家用vs2013+update4或者更高版本),持有Azure订阅,世纪互联或者Microsoft Azure 账号都ok;Azure管理证书是一个用来验证对此订阅进行资源操作的客户端,如Visual Studio Tools for Windows Azure 或者使用服务管理API的客户端应用程序,以及 Windows Azure Powe

2015-04-21 20:16:59 708

原创 System Center VMM请注意不同语言版本的差异

在私有云的项目中,经常需要判断System Center一些组件的连接是否OK。  我这里有开发,和测试两个环境,开发是英文版的System Center VMM,测试用的是中文版的System CenterVMM。    我在配置库的链接字段的时候,我把“Authority”字段填写的是“管理员”,可是,开发环境始终在报错。报错提示:The specified u

2015-03-24 16:07:10 957

原创 Azure 上删除虚机是否保留附加磁盘?

在Windows Azure 上删除虚机时,会弹出两个选项卡当点击“保留附加的磁盘” 提示:将不从你的存储账户中删除附加的磁盘及其VHD文件。VHD保留的地方在: 选择你的存储账户: 注意后面的“大小”的参数这里的目的是: 删除虚机,保留VHD文件后,方便以后,想创建同样的虚机时,可以利用之前保留的虚机的VHD的文件恢复,删除后的虚机: 从库中创建VM 点击“我的磁盘

2015-03-13 13:48:43 761

原创 对Azure二次开发,解决资源“独占访问”的问题

在对Azure 进行二次开发过程中,首当其冲就是明白Azure的具体的”交互逻辑“,”消息机制“,”数据管理“,在说问题前,我想你对于Rest API 的使用,至少有了初步的了解。这里,我就不多说,微软给我最巨大的印象就是它的文档,如果,你还有些不了解,请参考“Microsoft Developer Network”的“服务管理Rest API参考”,链接是https://msdn.microsof

2015-03-11 17:51:25 916

原创 搭载Azure的开发环境及相关资源的使用

从http://azure.microsoft.com/zh-cn/downloads/?rnd=1下载azure开发工具,VisualStudio 2013 update 4 ; 安装好之后,下载Azure SDK,下载后,通过 Microsoft Web平台安装程序来获得并安装它们。接下来,你去可以微软下载官网,下载试用版的SQL-Server 2014 ;

2015-03-10 15:29:02 643

翻译 Windows Azure的可用性 摘要

高可用性:1.简单地讲,云的可用性(Availability)就是云平台允许其用户可以随时随地访问其云服务的特性。换句话说,云服务在绝大多数情况下在何时何处都是“可用”的。可用性看似简单,却涵盖着云平台与云服务在设计、开发及运营中的诸多方面。实现系统的可用性没有捷径可走。一般来说,系统的可用性都是通过冗余和备份来实现的。对于任何云平台供应商来说,为了有效控制其自身的成本,他们所选用的服务器

2015-03-05 17:18:27 485

hadoop权威指南第四版 英文

本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。

2017-04-05

rocketmq-console.war

用于管理RocketMQ3.2.6集群服务,直接将war包放在tomcat的webapps目录,打开http://ip:8080/rocketmq-console 即可访问,第一次访问不成功,需要修改webapps/rocketmq-console/WEB-INF/classes/config.properties 里的nameserver地址.

2017-03-12

1.8 jdk 源码

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境,JAVA工具和JAVA基础的类库。

2016-07-08

自己动手写网络爬虫

第1篇 自己动手抓取数据 第1章 全面剖析网络爬虫 3 1.1 抓取网页 1.1.1 深入理解url 1.1.2 通过指定的url抓取网页内容 1.1.3 java网页抓取示例 1.1.4 处理http状态码 1.2 宽度优先爬虫和带偏好的爬虫 1.2.1 图的宽度优先遍历 1.2.2 宽度优先遍历互联网 1.2.3 java宽度优先爬虫示例 1.2.4 带偏好的爬虫 1.2.5 java带偏好的爬虫示例 1.3 设计爬虫队列 1.3.1 爬虫队列 1.3.2 使用berkeley db构建爬虫队列 1.3.3 使用berkeley db构建爬虫队列示例 1.3.4 使用布隆过滤器构建visited表 1.3.5 详解heritrix爬虫队列 1.4 设计爬虫架构 . 1.4.1 爬虫架构 1.4.2 设计并行爬虫架构 1.4.3 详解heritrix爬虫架构 1.5 使用多线程技术提升爬虫性能 1.5.1 详解java多线程 1.5.2 爬虫中的多线程 1.5.3 一个简单的多线程爬虫实现 1.5.4 详解heritrix多线程结构 1.6 本章小结 第2章 分布式爬虫 69 2.1 设计分布式爬虫 2.1.1 分布式与云计算 2.1.2 分布式与云计算技术在爬虫中的应用——浅析google的云计算架构 2.2 分布式存储 2.2.1 从ralation_db到key/value存储 2.2.2 consistent hash算法 2.2.3 consistent hash代码实现 2.3 google的成功之道——gfs 2.3.1 gfs详解 2.3.2 开源gfs——hdfs 2.4 google网页存储秘诀——bigtable 2.4.1 详解bigtable 2.4.2 开源bigtable——hbase 2.5 google的成功之道——mapreduce算法 2.5.1 详解mapreduce算法 2.5.2 mapreduce容错处理 2.5.3 mapreduce实现架构 2.5.4 hadoop中的mapreduce简介 2.5.5 wordcount例子的实现 2.6 nutch中的分布式 2.6.1 nutch爬虫详解 2.6.2 nutch中的分布式 2.7 本章小结 第3章 爬虫的“方方面面”121 3.1 爬虫中的“黑洞” 3.2 限定爬虫和主题爬虫 3.2.1 理解主题爬虫 3.2.2 java主题爬虫 3.2.3 理解限定爬虫 3.2.4 java限定爬虫示例 3.3 有“道德”的爬虫 3.4 木章小结 第2篇 自己动手抽取web内容 第4章 “处理”html页面 159 4.1 征服正则表达式 4.1.1 学习正则表达式 4.1.2 java正则表达式 4.2 抽取html正文 4.2.1 了解htmlparser 4.2.2 使用正则表达式抽取示例 4.3 抽取正文 4.4 从javascript中抽取信息 4.4.1 javascript抽取方法 4.4.2 javascript抽取示例 4.5本章小结 第5章 非html正文抽取 201 5.1 抽取pdf文件 5.1.1 学习pdfbox 5.1.2 使用pdfbox抽取示例 5.1.3 提取pdf文件标题 5.1.4 处理pdf格式的公文 5.2 抽取office文档 5.2.1 学习poi 5.2.2 使用poi抽取word示例 5.2.3 使用poi抽取ppt示例 5.2.4 使用poi抽取excel示例 5.3 抽取rtf 5.3.1 开源rtf文件解析器 5.3.2 实现一个rtf文件解析器 5.3.3 解析rtf示例 5.4 本章小结 第6章 多媒体抽取 231 6.1 抽取视频 6.1.1 抽取视频关键帧 6.1.2 java视频处理框架 6.1.3 java视频抽取示例 6.2 音频抽取 6.2.1 抽取音频 6.2.2 学习java音频抽取技术 6.3 本章小结 第7章去掉网页中的“噪声” 257 7.1 “噪声”对网页的影响 7.2 利用“统计学”消除“噪声” 7.2.1 网站风格树 7.2.2“统计学去噪”java实现 7.3 利用“视觉”消除“噪声” 7.3.1 “视觉”与“噪声” 7.3.2 “视觉去噪”java实现 7.4 本章小结 第3篇 自己动手挖掘web数据 第8章 分析web图 283 8.1 存储web“图” 8.2 利用web“图”分析链接 8.3 google的秘密——pagerank 8.3.1 深入理解pagerank算法 8.3.2 pagerank算法的java实现 8.3.3 应用pagerank进行链接分析 8.4 pagerank的兄弟hits 8.4.1 深入理解hits算法 8.4.2 hits算法的java实现 8.4.3 应用hits进行链接分析 8.5 pagerank与hits的比较 8.6 本章小结 第9章 去掉重复的“文档” 317 9.1 何为“重复”的文档 9.2 去除“重复”文档——排重 9.3 利用“语义指纹”排重 9.3.1 理解“语义指纹” 9.3.2 “语义指纹”排重的java实现 9.4 simhash排重 9.4.1 理解simhash 9.4.2 simhash排重的java实现 9.5 分布式文档排重 9.6 本章小结 第10章 分类与聚类的应用 333 10.1 网页分类 10.1.1 收集语料库 10.1.2 选取网页的“特征” 10.1.3 使用支持向量机进行网页分类 10.1.4 利用url地址进行网页分类 10.1.5 使用adaboost进行网页分类 10.2 网页聚类 10.2.1 深入理解dbscan算法 10.2.2 使用dbscan算法聚类实例 10.3 本章小结

2016-03-05

编写可维护的JavaScript中文完整版

1.作者是大名鼎鼎的NicholasZakas,他是《JavaScript高级程序设计》、《Ajax高级程序设计》和《高性能JavaScript》的作者。在业界很有知名度和影响力,畅销书作者。 2.本书是第一本集中关注编程风格和最佳实践的JavaScript技术图书。 3.本书得到国内外众多知名前端工程师的推荐和好评。中文版由淘宝UED团队负责翻译,质量可靠,著译双馨

2015-11-07

django1.8英文文档

django 1.8 的英文文档 ,养成看英文文档的习惯,别担心看不懂。基本上单词,句型都认识

2015-07-20

CertMgr.exe

证书管理器工具 (Certmgr.exe) 管理证书、证书信任列表 (CTL) 和证书吊销列表 (CRL)。

2015-04-19

XML实用教程

全书共分9章,内容包括XML简介、规范的XML文件、有效的XML文件、XML与CSS、XML与XSL、基于DOM的解析器、XML Schema模式、XML与数据库以及综合实训等内容。《XML实用教程》本着“知识够用,应用为主”的原则,精选示例,贴近实际,力求拓展学生的应用能力。《XML实用教程》可作为高职高专院校相关专业的教材,对于XML的初学者,也不失为一本好的参考书。

2015-04-05

Snagit_11.0.1.93-简体中文版

一个非常著名的优秀屏幕、文本和视频捕获、编辑与转换软件。 Name:(可以随便输入) key : VJCWG-6JTAT-NZ4AC-CYC56-M4E5E

2015-01-27

asp.net典型模块与项目实战大全源程序

asp.net典型模块与项目实战大全源程序,里面的源代码很详细。希望给大家带来帮助。

2013-07-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除