自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(125)
  • 资源 (9)
  • 收藏
  • 关注

转载 Hadoop经典书籍资料收藏(35本)转

原文地址:http://www.hadoopor.com/thread-5128-1-2.html 1.”Hadoop.Operations.pdf.zip”http://vdisk.weibo.com/s/vDOQs6xMAQH62.”Hadoop权威指南(中文版)(带书签).pdf”http://vdisk.weibo.com/s/wxJYuVE573j3...

2018-07-04 18:42:06 10086

原创 深刻理解Python中的元类(metaclass)

深刻理解Python中的元类(metaclass) PEP 3115 – Metaclasses in Python 3000第一篇文章中我执行后有错误的代码是这一段:def upper_attr(future_class_name, future_class_parents, future_class_attr): '''返回一个类对象,将属性都转为大写形式''' ...

2018-06-21 23:51:04 596

原创 理解机器学习中的VC维

VC维的来龙去脉Computational Learning Theory - VC Dimension 这篇文章中有几个重要的链接要仔细看一下

2018-06-12 14:20:09 1220

原创 WinRAR去除广告

WinRAR 5.40 去除广告方法,屏蔽广告弹窗方法,亲测有效winrar5.50去广告教程(仅供学习使用)[Windows] 自己动手 winRAR 去广告 删代码

2018-06-11 12:20:21 6632

原创 2017年诺贝尔生理学或医学奖

2017年诺贝尔奖诺贝尔奖官方解读最新生理医学奖:睡觉和清醒背后的分子机制看完今年的诺贝尔奖,你还敢让孩子熬夜吗?

2018-06-10 16:18:21 3060

原创 Weka在wikispaces上相关内容整理

1. Weka Mailing ListThe WEKA Mailing list can be found here:List for subscribing/unsubscribing to the listArchives (Mirror 1, Mirror 2) for searching previous posted messagesBefore posting,...

2018-06-10 12:52:26 308

原创 Ubuntu下多个Python版本共存

一个方法是使用virtuallen环境,另一方法是使用pyenvvirtuallen使用virtuallen管理多个python版本,需要先安装多个python环境1. ubuntu下源代码安装python从http://www.python.org/download/下载源文件。编译安装tar zxvf Python-2.7.6.tgzcd Python-2.7.6...

2018-06-10 10:20:55 4750

转载 BeautifulSoup的输出

格式化输出BeautifulSoup中有内置的方法prettfy()来实现格式化输出。比如:from bs4 import BeautifulSoup html_markup = """<p class="ecopyramid"> <ul id="producers"> <li class="producerlist"&

2018-06-09 18:45:45 1942

原创 Python中过滤Windows文件名中的非法字符

网上有三种写法: 第一种(所有非法字符都不转义):def setFileTitle(self,title): fileName = re.sub('[\/:*?"<>|]','-',title)#去掉非法字符 self.file = open(fileName + &

2018-06-09 14:52:01 11807

原创 Weka源代码结构分析

Weka源码分析(1)——模块划分及core package分析

2018-06-02 23:40:17 739

原创 导入Weka源代码到Eclipse中

1、下载weka3.7,解压其中的weka-src.jar的文件,包含lib,src,META-INF三个文件夹和另外两个文件;2、在Eclipse下新建java project,命名为weka,在src下新建名为weka的包;3、在此项目下import–>File System–>选择…/weka/src/main/java/weka,并全部导入; [第三项其他的教程略有不...

2018-06-02 22:09:27 843

转载 文档编码问题

查看及修改文件的编码格式 ANSI是什么编码?https://wenku.baidu.com/view/44ecbe35aa00b52acec7ca10.htmlWindows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?Sublime Text 3技巧:支持GB2312和GBK编码...

2018-06-01 09:33:36 326

转载 Regression Tree 回归树

1. 引言AI时代,机器学习算法成为了研究、应用的热点。当前,最火的两类算法莫过于神经网络算法(CNN、RNN、LSTM等)与树形算法(随机森林、GBDT、XGBoost等),树形算法的基础就是决策树。决策树因其易理解、易构建、速度快的特性,被广泛应用于统计学、数据挖掘、机器学习领域。因此,对决...

2018-05-26 16:46:12 2829 1

转载 将小文件嵌入到html页面中的方法

data:image/jpg;base64Data URI scheme。Data URI scheme是在RFC2397中定义的,目的是将一些小的数据,直接嵌入到网页中,从而不用再从外部文件载入。比如上面那串字符,其实是一张小图片,将这些字符复制黏贴到火狐的地址栏中并转到,就能看到它了。 在上面的Data URI中,data表示取得数据的协定名称,image/png 是数据类型名称...

2018-05-24 12:51:24 3255

原创 计算学习理论博客待整理

PAC learning 到底在做什么? 30分钟了解PAC学习理论——计算学习理论第一讲

2018-05-20 23:16:33 918

原创 Java的解释执行与编译执行

理解Java的几个编译器前端编译器:把.java文件转变成.class文件。包括Sun的Javac、Eclipse JDT中的增量式编辑器(ECJ)后端运行期编译器(JIT编译器,Just In Time Compiler):把字节码转成机器码。包括HotSpot VM的C1、C2编译器静态提前编译器(AOT编译器,Ahead Of Time Compiler):把*.java编译成本...

2018-05-16 22:22:58 5346

原创 Weka中的有监督的离散化方法

参考:机器学习-变量离散之MDLP对应分析Weka中weka.filters.supervised.attribute.Discretize 涉及的其他类包括weka.filters.Filter 分析的宏观代码Discretize disc=new Discretize()disc.setInputFormat(data)Instances afterDiscretize=Fil...

2018-05-11 15:33:53 3866

原创 MySQL 5.7.22加压缩版安装方法

2018-05-09 23:32:09 355

原创 HD Tune中的各种信息表示的含义

Benchmark基准选项主要是用来测试硬盘的读写速度,可以查看硬盘的性能,选择读取,点击开始就可以开始测试。有两项因素影响硬盘的性能,「存取时间(access time)」与「平均数据传输率(data transfer rate)」。「存取时间」愈短愈好,指得是硬盘对于我们发出的命令到全动作完成所需要的时间,自然是越小越好。由于硬盘每天都有着成千上万次的读写动作,这项因素就显得格外重...

2018-05-02 18:34:38 16253

原创 研究生学习生活规划

参考: 研究生期间设想与规划如何确定适合自己的研究领域?(小故事)有一个草坪铺路的故事可以用来回答这个问题。保护草坪是很难的,因为草坪上的路往往并不是按人的方便性来修的。有一次一个设计师承接了一个项目,交付使用后在这个建筑物的周围全部铺上了草坪,没有路,任人去踩,几个月后,草坪上就分明出现了几条道:有粗有细,然后他就此基础上修路,也有粗有细,结果可想而知。在开始的时候,你可以没有...

2018-05-01 19:07:25 3128

原创 Python调用Java与Java中调用Python

Python中调用Java参考: JPype:实现在python中调用JAVA1.安装首先系统中Python和Java版本最好都是32位或者都为64位,否则可能出现错误。pip install jpype1可能需要安装VC for python27:https://www.microsoft.com/en-us/download/confirmation.aspx?id=...

2018-05-01 10:18:05 10208

原创 如何蹭网不被发现

1.方法一出于某种原因,你可能不想别人通过局域网网上邻居里看到自己的电脑,其实你可以隐藏自己的电脑,让别人在局域网中找不到你。下面是操作方法:单击“开始→运行”,在打开的“运行”对话框中输入“cmd”打开命令行窗口,输入“net config server /hidden:yes”,再回车就可以了。这样别人就无法从网上邻居中直接看到你的计算机,只有通过在资源管理器地址栏中输入“\计算机名”...

2018-05-01 08:15:57 21935 2

原创 Weka中ROC和AUC通过调用API实现

Weka中实现计算ROC的是ThresholdCurve类的getCurve函数(1)getCurve函数@param 一般是十折交叉得到的predictions @param 正例的类标记,多元分类问题,设置某个类别为正例,其他类别就是负例 @return datapoints if (pred.actual() == classIndex) { totPo...

2018-04-30 22:38:04 1996

原创 Weka中的Evaluation类源代码分析

使用的数据是最简单的weather.nominal.arff,使用的分类模型是NaiveBayes1.在构造函数中进行了如下操作:m_ClassPriors[numClasses]统计构造函数传入的data的各个类的先验概率,有一个平滑处理,在统计之前每个m_ClassPriors[i]都赋值为1,防止出现某个类先验概率为0的情况出现。m_MarginCounts = new doub...

2018-04-30 20:09:39 727

原创 第三章——发现群组

cnblog的订阅源:http://feed.cnblogs.com/blog/sitehome/rss cnblog的首页:https://www.cnblogs.com/ 将两者用浏览器打开后,可以发现有很多的相似之处,订阅源中的每一个entry就对应首页中的一篇博客...

2018-04-27 21:11:52 226

原创 Java内存的相关问题

为什么java获取的最大堆内存和设置的不一致Java 内存溢出(java.lang.OutOfMemoryError)的常见情况和处理方式总结Sublime Text 3 配置java运行环境Java OutOfMemory异常清单 —— 在自己的机器上制造内存溢出...

2018-04-27 16:32:59 112

原创 VisualVM——Java程序监控工具

自从 JDK 6 Update 7 以后已经作为 Oracle JDK 的一部分,位于 JDK 根目录的 bin 文件夹下(jvisualvm.exe),无需安装,直接运行即可。使用SizeOf测定JVM中对象占用内存...

2018-04-27 14:41:11 158

原创 第九章 高阶分类:核方法与SVM

用Bing Map服务代替Yahoo的Geocoding API Bing Map的相关网站: Bing Map 开发者中心 publice21@outlook Bing Map 的MSDN Bing Map 的MSDN 另一个文档 根据Bing Map修改后的部分代码:BingKey="AudmvxyrHM35ktbN5bLBPtVL24Yst22RTfIyRSxzr45r7aY9...

2018-04-27 12:26:45 307

原创 Weka分布式实验

File协议 startRemoteEngine.shjava -Xmx1024m -classpath ../db_drivers/mysql-connector-java-5.1.46.jar;remoteEngine.jar;../weka3.7.13.jar -Djava.security.policy=remote.policy weka.experiment.RemoteE...

2018-04-26 16:39:37 538

原创 Ubuntu安装MySQL

sudo apt-get install mysql-server会提示你设置密码,如果安装时没有设置密码的解决办法参考ubuntu安装mysql 时未提示输入密码udo apt isntall mysql-clientsudo apt install libmysqlclient-dev安装成功后可以通过下面的命令测试是否安装成功:sudo netstat -tap |...

2018-04-26 10:46:42 146

原创 免费的开源数据挖掘工具

Orange,RapidMiner,Weka,JHepWork,KNIM,五个免费开源的数据挖掘软件

2018-04-25 23:45:13 730

原创 Ubuntu服务器安装桌面

Ubuntu14.04 server 安装桌面从零开始配置Ubuntu Server 14.04 图形界面、Caffe安装及远程连接Ubuntu 16.04 server 图形界面注意最后修改启动项 如何默认不启动桌面,等需要时再启用。 /etc/default/grub GRUB_CMDLINE_LINUX_DEFAULT=”” 改为 “text”,然后upda...

2018-04-25 12:54:34 4878

原创 Xshell5评估期已过

正在使用的xshell 5不能使用,提示xshell 5评估期已过,重新安装还是不行。其实xshell 5有免费版的,即Home & school 版本。卸载原程序,下载安装免费版本的xshell 5即可。免费版本的链接:http://www.netsarang.com/download/free_license.html...

2018-04-25 12:38:08 1464

原创 UCI数据集转化为Arff数据集

以Adult数据集为例 将adult.data.txt文件改为csv格式,用Weka Explorer打开adult.data.csv然后保存为arff文件。 将adult.test.txt文件也作如上操作,会出现错误: |1x3 Cross validator25, Private, 226802, 11th, 7, Never-married, Machine-op-inspc...

2018-04-25 07:38:43 1724

原创 计算机辅助翻译CAT——OmegaT

轻松愉快的辅助翻译工具OmegaT的简单使 OmegaT - 开源跨平台的电脑辅助翻译工具软件入门与下载 (Win/Mac/Linux)

2018-04-18 13:44:56 1982

转载 ROC and AUC

参考: ROC和AUC介绍以及如何计算AUC 多分类下的ROC曲线和AUCROC曲线首先ROC分析的是二元分类模型,也就是输出类别只有两种值的分类模型。对于其他的多类分类模型可以做相应的转换,本文后面再作分析。ROC曲线的特点:ROC曲线的横轴是False postive rate,纵轴是True positive rate一个特定分类模型在一个测试数据集上只会得到一个FP...

2018-04-17 13:23:29 379

原创 本科论文查重

降低重复率的方法(1) 网上的资源都是相互有着关联的,要是直接把原话拿来用是很容易就被检查出来的。可以在写的时候变化一下,换个关键词,用意思相同的词来替换原文中的词语。也可以变一下句子的结构,用自己的话重新改写一下,这样一来,意思虽然是一样的,但是论文查重就不会检查出飘红来,再不行的话,可以直接把飘红的那句删掉。要是非得要用的话,可以借助一些翻译软件,就是说你可以把那段话先翻译成英语,然后自己...

2018-04-16 21:02:43 1173

原创 一个简体字对应多个繁体字的例子

干:對應三個繁體字:(干)涉,(乾)燥,(幹)部; 后:對應兩個繁體字:(後)面,皇(后); 系:對應三個繁體字:唔(系),關(係),聯(繫); :對應兩個繁體字:(歷)史,日(曆); :對應兩個繁體字:時(鐘),(鍾)意; 板:對應兩個繁體字:老(闆),木(板); 表:對應兩個繁體字:手(錶),外(表); 丑:對應兩個繁體字:(醜)怪,子(丑)寅卯; 范:對應兩個繁體字:模(範)...

2018-04-15 22:51:07 5018

原创 关于前端Web技术的几点——网络爬虫的技术储备

阅读大型 JavaScript 源码时有什么好用的工具?web前端开发分享-css,js工具篇

2018-04-14 20:07:54 794

原创 爬取JS动态加载的页面

参考知乎:https://www.zhihu.com/question/21471960/answer/154098407 爬取网页上的评论:http://music.163.com/#/song?id=86375 请求评论数据的参数:params 和 encSecKey ,同时在Name栏目可以清楚地看到处理该参数的 js 文件为 core.js 美化JS代码后搜索这两个参数 ...

2018-04-14 19:30:37 15091

标准模板库自修教程与参考手册 STL进行C++编程.zip

标准模板库自修教程与参考手册 STL进行C++编程(第二版)高清pdf,文字和代码高清版本,书籍浅显易懂非常适合入门STL的学习

2019-07-11

《Python深度学习》中英文及源代码2018

keras之父Francois Chollet的最新作品,deep learning最佳入门与进阶的指南,包括中文版和英文版以及配套源代码,均为高清文字版本,非扫描版

2018-11-18

Deep Learning with Python-Francois Chollet配套源代码

Deep Learning with Python-Francois Chollet的配套源代码

2018-11-18

Deep Learning with Python-Francois Chollet

keras之父Francois Chollet的最新作品,deep learning最佳入门与进阶的指南

2018-11-18

tensorflow 官方文档中文版

tensorflow官方文档的中文翻译版,适合作为初学tensorflow的指南

2018-11-06

manchine learning yearning 中文版

吴恩达(andrew ng)的新书Machine learning yearning 的中文翻译版

2018-11-06

C++写的机器学习的库

一个用C++写的机器学习的库,作者是Ron Kohavi,是SGI的一个开源项目

2018-06-11

《精通Hadoop》源代码

《精通Hadoop》Mastering Hadoop 人民邮电出版社,源代码

2017-11-14

lab38综合实战-搜索引擎

《大数据实验手册》实验38-综合实战-搜索引擎 包含CreateIndex和Demo

2017-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除