自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(73)
  • 收藏
  • 关注

转载 【AI】如何处理偏斜类

并不一定,因为患有癌症的,很有可能仅仅占据人群的 0.5% ,而一直预测 y = 0 ,也就是预测大家都没有患癌症,就能得到 99.5% 的精准度。如果你告诉一个病人说:“你患了癌症”,他们会非常的震惊,因为这是一个非常坏的消息,对人的打击非常大。这样的情况下,能够相对准确地预测癌症的情况,错误的预测就减少了,那么我们会得到比较高的查准率。所谓的召回率,就是那些真正患有癌症的病人,有多少我们能够准确发现他们的病情。所谓的查准率,就是那些我们预测他们患有癌症的病人,有多少是真正患有癌症的。

2024-04-05 09:00:03 9

翻译 14 超参数优化 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

有 19 个参数,而所有这些参数的所有组合,以及它们可以承担的所有值,都将是无穷无尽的。还必须注意的是,如果要进行 k 折交叉验证,则需要更多的循环,这意味着需要更多的时间来找到完美的参数。使用这两种方法,你可以为各种模型找到最优参数,只要它们有拟合和预测功能,这也是 scikit-learn 的标准。这样,我们是在最小化精确度的负值,但事实上,我们是在最大化精确度。大多数模型参数都是实数,不同参数的组合可以是无限的。最后,我们可以看到,5折交叉检验最佳得分是 0.889,我们的网格搜索得到了最佳参数。

2024-03-24 16:07:07 15

翻译 13 评估指标 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

说到机器学习问题,你会在现实世界中遇到很多不同类型的指标。有时,人们甚至会根据业务问题创建度量标准。逐一介绍和解释每一种度量类型超出了本书的范围。相反,我们将介绍一些最常见的度量标准,供你在最初的几个项目中使用。在本书的开头,我们介绍了监督学习和非监督学习。虽然无监督学习可以使用一些指标,但我们将只关注有监督学习。这是因为有监督问题比无监督问题多,而且对无监督方法的评估相当主观。如果我们谈论分类问题,最常用的指标是:说到回归,最常用的评价指标是了解上述指标的工作原理并不是我们必须了解的唯一事情。我们还必须知

2024-03-24 16:04:49 12

翻译 12 组织机器学习项目 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

如果你所做的项目能让其他人理解并使用,而无需咨询你的意见,那么你就节省了他们的时间和自己的时间,可以将这些时间投入到改进你的项目或开发新项目中去。model_dispatcher.py 从 scikit-learn 中导入了 tree,并定义了一个字典,其中键是模型的名称,值是模型本身。我们现在已经取得了一些进展,但如果我们看一下我们的训练脚本,我们仍然受到一些东西的限制,例如模型。关于许可证的详细介绍超出了本书的范围。:这是一个标记符文件,您可以在其中描述您的项目,并写明如何训练模型或在生产环境中使用。

2024-03-24 13:20:42 9

翻译 11 组合和堆叠方法 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

之后,我们在折叠 2 上从头开始训练模型,并在折叠 1 上进行预测。现在,为了合并这些模型,我们将折叠 1 和折叠 1 的所有预测数据合并在一起,然后创建一个优化函数,试图找到最佳权重,以便针对折叠 2 的目标最小化误差或最大化 AUC。例如,如果你有一个 AUC 非常高的随机森林模型和一个 AUC 稍低的逻辑回归模型,你可以把它们结合起来,随机森林模型占 70%,逻辑回归模型占 30%。提升模型的工作原理与装袋模型类似,不同之处在于提升模型中的连续模型是根据误差残差训练的,并倾向于最小化前面模型的误差。

2024-03-24 11:29:29 5

翻译 10 特征选择 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

在前一种方法中,我们从一个特征开始,然后不断添加新的特征,但在 RFE 中,我们从所有特征开始,在每次迭代中不断去除一个对给定模型提供最小值的特征。如果我们使用线性支持向量机(SVM)或逻辑回归等模型,我们会为每个特征得到一个系数,该系数决定了特征的重要性。没有比这更简单的了。当我们进行递归特征剔除时,在每次迭代中,我们都会剔除特征重要性较高的特征或系数接近 0 的特征。请记住,当你使用逻辑回归这样的模型进行二元分类时,如果特征对正分类很重要,其系数就会更正,而如果特征对负分类很重要,其系数就会更负。

2024-03-24 11:25:38 8

翻译 9 特征工程 —— 建立一个自动的机器学习框架,几乎可以解决任何机器学习问题

在处理时间序列数据时,日期时间特征非常重要,例如,在预测一家商店的销售额时,如果想在聚合特征上使用 xgboost 等模型,日期时间特征就非常重要。现在,您可以使用所有其他列,对相关列中没有缺失值的样本进行模型训练,然后尝试预测之前删除的样本的目标列(同一列)。在这种情况下,我们会创建不同类型的特征,例如:使用数值特征时,在对分类列进行分组时,会得到类似于时间分布值列表的特征。特征的数量越多,多项式特征的数量也就越多,而且你还必须记住,如果数据集中有很多样本,那么创建这类特征就需要花费一些时间。

2024-03-24 11:06:21 10

翻译 8 无监督和有监督学习 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

同样,当我们得到猫和狗的图像时,我们事先知道哪些是猫,哪些是狗,如果任务是创建一个模型来预测所提供的图像是猫还是狗,那么这个问题就被认为是有监督的问题。大多数情况下,当人们开始学习数据科学或机器学习时,都会从非常著名的数据集开始,例如泰坦尼克数据集或鸢尾花数据集,这些都是有监督的问题。图 3 显示的是 MNIST 数据集,这是一个非常流行的手写数字数据集,它是一个有监督的问题,在这个问题中,你会得到数字图像和与之相关的正确标签。必须注意的是,有时我们可能会在分类设置中使用回归,这取决于用于评估的指标。

2024-03-24 11:02:22 9

翻译 7 文本分类或回归方法 —— 建立一个自动的机器学习框架,几乎可以解决任何机器学习问题

文本问题是我的最爱。一般来说,这些问题也被称为自然语言处理(NLP)问题。NLP 问题与图像问题也有很大不同。你需要创建以前从未为表格问题创建过的数据管道。你需要了解商业案例,才能建立一个好的模型。顺便说一句,机器学习中的任何事情都是如此。建立模型会让你达到一定的水平,但要想改善和促进你所建立模型的业务,你必须了解它对业务的影响。NLP 问题有很多种,其中最常见的是字符串分类。很多时候,我们会看到人们在处理表格数据或图像时表现出色,但在处理文本时,他们甚至不知道从何入手。文本数据与其他类型的数据集没有什么不

2024-03-24 10:59:11 11

翻译 6 处理分类变量 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

很多人在处理分类变量时都会遇到很多困难,因此这值得用整整一章的篇幅来讨论。在本章中,我将讲述不同类型的分类数据,以及如何处理分类变量问题。什么是分类变量?分类变量/特征是指任何特征类型,可分为两大类:无序变量是指有两个或两个以上类别的变量,这些类别没有任何相关顺序。例如,如果将性别分为两组,即男性和女性,则可将其视为名义变量。有序变量则有 "等级 "或类别,并有特定的顺序。例如,一个顺序分类变量可以是一个具有低、中、高三个不同等级的特征。顺序很重要。就定义而言,我们也可以将分类变量分为二元变量,即只有两个类

2024-03-24 10:52:10 17

翻译 5 图像分类和分割方法 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

说到图像,过去几年取得了很多成就。计算机视觉的进步相当快,感觉计算机视觉的许多问题现在都更容易解决了。随着预训练模型的出现和计算成本的降低,现在在家里就能轻松训练出接近最先进水平的模型,解决大多数与图像相关的问题。但是,图像问题有许多不同的类型。从两个或多个类别的标准图像分类,到像自动驾驶汽车这样具有挑战性的问题。我们不会在本书中讨论自动驾驶汽车,但我们显然会处理一些最常见的图像问题。我们可以对图像采用哪些不同的方法?图像只不过是一个数字矩阵。计算机无法像人类一样看到图像。它只能看到数字,这就是图像。灰度图

2024-03-24 10:43:43 18

翻译 4 可重复代码和模型方法 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

在书中描述这些是不可行的,也是不可取的,所以我将使用不同的媒介来赞美本书的这一部分。请务必记住,要让你的代码和模型对他人可用,并做好文档记录,这样任何人都可以使用你开发的东西,而无需多次询问你。因此,如果您在发布代码时能复制自己的电脑,而其他人在安装您的软件或运行您的代码时也能复制您的电脑,那就再好不过了。包含版本总是最好的,这也是你应该做的。包含版本后,可以确保其他人使用的版本与你的版本相同,而不是最新版本,因为最新版本可能会更改某些内容,如果是这样的话,模型的训练方式就不会与你的相同了。

2024-03-24 10:26:26 9

翻译 3 交叉检验 —— 建立一个自动的机器学习框架,几乎可以解决任何机器学习问题

因此,要在这里建立一个良好的交叉检验系统,必须有分层的 k 折交叉检验,但也必须确保训练数据中的患者不会出现在验证数据中。如果我们有一个非常大的网络来处理一个非常小的数据集(即样本数非常少),我们就会观察到,随着我们不断训练,训练集和测试集的损失都会减少。这意味着在所有的训练折叠中,我们将对除 1 之外的所有数据样本进行训练。在上面的数据集中,我们可以建立一个最大深度(max_depth)非常高的模型,它在训练数据上会有出色的结果,但这种模型并不实用,因为它在真实世界的样本或实时数据上不会提供类似的结果。

2024-03-23 09:48:58 19

翻译 2 无监督和有监督学习 —— 建立一个自动的机器学习框架,几乎可以解决任何机器学习问题

同样,当我们得到猫和狗的图像时,我们事先知道哪些是猫,哪些是狗,如果任务是创建一个模型来预测所提供的图像是猫还是狗,那么这个问题就被认为是有监督的问题。图 3 显示的是 MNIST 数据集,这是一个非常流行的手写数字数据集,它是一个有监督的问题,在这个问题中,你会得到数字图像和与之相关的正确标签。MNIST 是一个有监督的分类问题,我们把它转换成一个无监督的问题,只是为了检查它是否能带来任何好的结果。MNIST 是一个有监督的分类问题,我们把它转换成一个无监督的问题,只是为了检查它是否能带来任何好的结果。

2024-03-23 09:25:06 16

翻译 1 准备环境 —— 建立一个自动机器学习框架,几乎可以解决任何机器学习问题

在我们开始编程之前,在你的机器上设置好一切是非常重要的。为了避免这种情况,你可以在虚拟机中安装Ubuntu,或者在Windows上安装Linux shell。,它是 conda 的最小安装程序。因此,在本书中,使用 pip 安装是最可取的方法。我已经创建了一个编写本书时使用的软件包列表,保存在 environment.yml 中。你可以在我的 GitHub 仓库中的额外资料中找到它。我们将创建一个在本书中一直使用的 conda 环境。在 conda 环境中,安装软件包有两种不同的方式。

2024-03-23 09:22:22 13

原创 通过CocoStudio导出的LoadingBar控件无法设置其percent值

Cocos2dx 3.0CocoStudio 1.5这套工具确实对游戏开发者挺有yo

2014-06-25 01:58:18 1699

转载 cocos2dx中用外部浏览器打开url

i’ve add some code, cross-platform like!and i hope they adopt this in next cocos2dx version.(i’m using cocos2dx 2.0.1)simply call this,CCApplication::sharedApplication().openURL("http://www.go

2014-06-04 20:22:41 2176

原创 Cocos2dx 竖屏中文输入存在问题

各位朋友,本人在使用Cocos2dx 3.0 开发android竖屏游戏时遇到了输入zhongw

2014-06-04 20:11:42 930

原创 PageView初始化时调用scrollToPage(x)显示不正确

PageView在初始化时调用scrollToPage会导致最终显示的页面不是指定的页面,俗称跑偏。 其根本原因在于调用scrollToPage后会设置 _isAutoScrolling = true;而之后在onEnter时会触发updateChildrenPosition重新计算所有页面的坐标,也就是相当于已经滚动过了。 所以当update中开始滚动,结果就必然是错误的了。 

2014-06-04 20:03:35 2933

原创 网络上DesUtil.java关于汉字加密解密出现乱码的问题

代码来自以下链接http://www.oschina.net/code/piece_full?code=18383#30455首先声明的是,代码不是本人写的,感谢一下作者,只不过本人在做一个android客户端,与服务器servlet接口通信的项目时,对协议作了des+base64加密处理,使用了该类,期间遇到了一个比较纠结的问题,就是如果汉字存在于协议中,服务器加密,客户端解密会

2014-02-19 01:03:53 2911

转载 Conversion to Dalvik format failed: Unable to execute dex: java.nio.BufferOverflowException.

Error处理:Conversion to Dalvik format failed: Unable to execute dex: java.nio.BufferOverflowException.分类: Android 动手操作2013-11-12 19:31 4404人阅读 评论(7) 收藏 举报Error处理:Conversion to Dalvik forma

2013-12-05 11:38:23 974

转载 android手机root后remount不成功,但是可以push

#su#mount -o remount,rw -t yaffs2 /dev/block/mtdblock0 /system#chmod 777 /system#exit之后,system目录可以push文件

2013-11-30 16:20:10 1410

转载 Android 漏洞提升权利的

近日,国外安全研究人员揭露多款Android平台下的授权应用管理软件存在3个安全漏洞,利用漏洞可进行root提权,详见链接:http://forum.xda-developers.com/showthread.php?t=2525552。 TSRC也对这3个Android Superuser 提权漏洞进行了分析,具体分析情况请参见下文。 一、Superuser环境变量设置漏

2013-11-22 00:53:41 783

转载 执行具有root权限的java代码

我们知道,当手机被root后,就可以通过su来执行具有root权限的代码了,但这基本只局限在了shell里面的命令。比如我们可以执行 am、pm以及android支持的一些linux命令。一但我们有些个性化需求,这些命令就显的不是那么人性化了。比如杀死100个程序,难道要循环一百次去执行am force-stop吗?显然不是。本文主要想法是自己制作一个类似am、pm的工具来

2013-11-22 00:04:48 1126

转载 Android root权限获取大揭秘

Android root权限获取的教程有很多,为了让大家更进一步的了解root的奥秘所在,灵客风特为您奉献本文,希望对您有所帮助。Android的应用程序入口肯定是Java程序。应用程序的启动者是由系统临时根据Androidmanifest.xml中定义的权限而创建的临时用户。而不像linux那样是使用登陆者的身份启动,从而使得进程具有登陆者的所有权限。这也是Android的安全机制之一。

2013-11-21 14:00:27 756

转载 Spring Quartz参数-CronTrigger配置说明

CronTrigger配置格式:格式: [秒] [分] [小时] [日] [月] [周] [年] 序号说明 是否必填 允许填写的值允许的通配符 1 秒 是 0-59   , - * / 2 分 是 0-59  , - * / 3小时 是 0-23  , - * /

2013-10-28 00:14:37 1383

转载 linux 统计目录下的文件数

linux下如何查询文件数量?   我将linux下某一目录的所有文件ftp到一台windows机器上,我想知道是否下载完全了就必须比较文件夹的大小和文件夹下文件的总数量,在linux下该用什么命令啊?  文件大小可以du -sh /var类似这样的,文件数量 查看文件夹下的文件个数

2013-10-25 00:51:27 1314

原创 MYSQL触发器使用

DELIMITER $$USE `mic_db_out`$$DROP TRIGGER /*!50032 IF EXISTS */ `customerinfo_insert`$$CREATE    /*!50017 DEFINER = 'admin'@'localhost' */    TRIGGER `customerinfo_insert` AFTER

2013-10-19 01:51:04 526

转载 android apk 签名

1.使用公钥和私钥签名 i. 生成公钥 openssl genrsa -3 -out testkey.pem 2048 其中 -3 是算法的参数, 2048 是密钥长度, testkey.pem 是输出的文件 ii. 转成 x509 格式(含作者有效期等) openssl req -new -x509 -key testkey.pem-out testkey.x509.

2013-10-15 18:19:28 912

转载 android 修改ramdisk.img和init.rc && android启动后设置/data权限为770

有时候希望在启动后做点事情,比如在sdcard上建立目录,修改/data的访问权限等,这些都可以放在init.rc中去完成,那么如何来完成呢,最近由于工作的需要,在这方面进行了一些研究,特写于此,供大家参考。      通过下面的例子来讲述,实现一个功能:在android系统启动后,修改/data的访问权限为770.共4步:1、解压ramdisk.img 2、用c语言完成要实现的功

2013-10-12 01:58:37 1374

转载 用gcc编译成可执行程序

#gcc hello.c该命令将hello.c直接生成最终二进制可执行程序a.out这条命令隐含执行了(1)预处理、(2)汇编、(3)编译并(4)链接形成最终的二进制可执行程序。这里未指定输出文件,默认输出为a.out。从上面我们知道GCC编译源代码生成最终可执行的二进制程序,GCC后台隐含执行了四个阶段步骤。GCC编译C源码有四个步骤:预处理----->

2013-10-12 00:29:27 1222

转载 chmod

要配置服务器网站时,要经常接触到这块,对文件和文件夹给予什么样的权限,分配给什么样的用户,让什么样的用户去管理这个文件或文件夹呢,下面来一起看一下吧。Ubuntu的许多操作是在终端中进行的,通过sudo命令管理的文件是由root持有权限的,一般用户是无法改变的。在图形界面上,我们可以通过属性中的权限选项夹进行操作。但是一旦文件的属性显示当前用户没有读写权力时,无法在图形界面上修改权限。

2013-10-11 21:12:35 624

转载 NDK编译C可执行程序

现有这样一个helloworld.c的源文件,如下:#include int main(){printf("Hello world!\n");}如何将它进行编译,并在Android上执行?这就是本文的目标。原理(如果只想明白怎么做的话,可以直接跳过本节。)熟悉Android应用开发的朋友们都知道,Android上的变成都是用Java的!也

2013-10-11 18:58:40 9124 2

转载 init.rc

Android启动后,系统执行的第一个进程是一个名称为init 的可执行程序。提供了以下的功能:设备管理、解析启动脚本、执行基本的功能、启动各种服务。代码的路径:system/core/init,编译的结果是一个可执行文件:init。这个init 的可执行文件是系统运行的第一个用户空间的程序,它以守护进程的方式运行。启动脚本则就是下面要讲的Init.rc。===============

2013-10-11 18:41:37 845

转载 android系统研究

先把软件安装到手机内存,然后用re到data/app找到它移动到system/app(注意权限rw-r-r),重启ok(之后可以清dalvik-cache,重启)。

2013-10-11 18:16:33 640

转载 Linux系统Iptables的常用防火墙配置方法

实验环境介绍:本脚本环境为eth0外网,eth1内网;#!/bin/sh#外网网卡EXT_IF="eth0"FW_IP="61.137.85.21"#内网网卡INT_IF="eth1"LAN_IP="192.168.0.1"LAN_IP_RANGE="192.168.0.0/255.255.255.0"#加载模块,一般

2013-09-24 14:32:37 960

转载 如何保证移动终端安全的接入到企业网络中?

如何保证移动终端安全的接入到企业网络中?返回BYOD网站首页您遇到的问题是这样的么?问题1:员工在公共场所进行移动办公时,通过3G/LTE/公共Wi-Fi接入,网络传输不可信,相对传统固定办公而言安全问题更加突出,尤其是Wi-Fi热点可能存在AP伪造、欺骗、嗅探监听的风险,黑客通过引诱或监视用户上网,进行账号的窃取或者企业机密数据的监听。问题2:员工在内网移动办公时,企

2013-09-24 01:20:48 5498

转载 jsp定时器,web程序定时执行任务

这个类最终功能是每天某个时间点(如每晚22点)执行某一功能。首先,介绍java定时器(java.util.Timer)有定时执行计划任务的功能,通过设定定时器的间隔时间,会自动在此间隔时间后执行预先安排好的任务(java.util. TimerTask)如: 每隔一个小时执行任务 timer.schedule(TimerTask, 0, 60 * 60 * 1000)。

2013-09-23 17:20:29 7264

转载 最新Oracle 和 mysql 的对比参照

Oraclemysql对比版本Release 10.2.0.1.0 XE windowsXP5.0.45-community-nt-log MySQL Community Edition (GPL)当作计算器SQL> select 1+1 from dual;mysql> select 1+1;

2013-09-22 23:47:37 595

转载 Android SDK Manager更新不了的解决办法

android SDK Manager更新不了,出现错误提示:"Failed to fetch URL..."!可以用以下办法解决:使用SDK Manager更新时出现问题 Failed to fetch URL https://dl-ssl.google.com/android/repository/repository-6.xml, reason: Connection t

2013-09-21 20:09:42 3774

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除