自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 资源 (4)
  • 收藏
  • 关注

原创 成为大数据工程师需要哪些技能?(一文秒懂大数据)

2008年,维克托·迈尔-舍恩伯格编写的《大数据时代》开启了科学技术的一个新的篇章,让“大数据”一词变得家喻户晓,人人都在谈论大数据,各科技公司也纷纷引入大数据技术。那么,到底什么是大数据?大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新的处理模式才能获得更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。在《大数据时...

2018-11-29 09:35:20 1901

原创 FinTech领域的风险控制——策略篇

金融市场与风险相互依存,理清金融科技背景下可能面临的风险之后,我们应当积极寻找有效的防范方法和途径。首先,借助信息工具规制金融风险,尤其是互联网金融风险。金融中介服务于资金供给者和资产提供者,金融风险的产生、交易或资产服务都要通过金融中介来完成。因此,金融中介是风险管理和交易的主体。由于金融市场准入门槛高、风险集中、价格形成过程难以预测、监管失灵等问题都源于信息不对称,而区块链、大数据和云计算...

2018-10-19 16:30:25 1769

原创 FinTech领域的风险控制——风险篇

随着移动互联网、人工智能、大数据、云计算、区块链等技术的高速发展,资金的需求方和提供方得以建立更为便捷和紧密的联系,出现了十分丰富的金融业态。这改善了国内小微企业和征信白户在传统金融机构融资难的困境,改变了投资门槛高、小额投资渠道匮乏的现状,也为实现普惠金融起到了巨大的推动作用,推进了供给侧结构性改革。然而,金融科技在快速发展的过程中也不可避免地积累了一些问题和风险,这对金融风控和监管都提出了新的...

2018-10-17 11:32:25 2331

原创 如何构建健全的信用评估体系

信用,就是因为履行诺言而取得的信任,是指依附在人与人之间、单位之间、商品交易之间的一种相互信任的生产关系和社会关系。因为信用的存在,双方得以自觉、自愿地反复交往,消费者甚至愿意付出更多的钱来延续这种关系。信用调查,是指信用机构接受委托后,按照委托事项与目的对相关组织和个人的信用信息进行征集、分类、分析的工作。信用调查是信用评级的基础,信用评级是信用调查的进一步延伸。我国的信用调查体系尚不完...

2018-10-15 15:33:10 5067

原创 小贷公司的风险成因及应对策略——策略篇

小贷公司要以审慎稳健为原则,实现企业与政府的良好互动,有效地防范风险,最终达到社会效益与经济效益双赢的效果。针对风险篇中提到的小贷公司存在的风险,本文总结了相关的应对策略,帮助小贷公司实现稳定健康发展。赋予明确的身份性质小贷公司应明确定位,监管部门应尽快修订政策法规,赋予小贷公司明确合法的金融机构身份,让小贷公司的发展有法可依、有章可循。为此,制定更加权威、详细的法律法规才能明确小贷公司的...

2018-10-11 13:39:04 2103

原创 小贷公司的风险成因及应对策略——风险篇

小贷公司的出现在很大程度上弥补了金融机构信贷的资金缺陷,增加了对中小企业以及农村金融需求的有效供给。但是,由于各方面的原因,小贷公司自诞生起就存在着多种风险。身份定位模糊不清小贷公司作为信贷行业中的新生命正处于摸索阶段,它的身份定位属于“准金融机构”,不过既不能享有金融机构的相关优惠政策,却还会受到金融政策限制以及相关部门的监管。这就导致小贷公司身份模糊、市场定位不明,严重制约了小贷公司的...

2018-10-09 15:27:16 4138

原创 黑产肆虐,AI如何扛起反欺诈大旗

时下,金融欺诈主要来源于网络黑产。据统计,网络黑产的直接从业者已超过40万,上下游人员总计超过170万,黑产手里握有的身份证约有1000万张,造成的欺诈金额每年正以40%的比例增长着。面对肆虐的黑产,金融界最看好的反欺诈手段,就是AI。那么,AI如何利用先进的技术对抗黑产呢?无论是传统反欺诈的方式,还是当下备受关注的AI技术,要想有效地对抗黑产,就必须先搞明白一点,那就是黑产究竟是如何骗贷...

2018-09-29 10:22:38 934

原创 什么是KNN算法?

 KNN(K-Nearest Neighbor)算法是机器学习算法中最基础、最简单的算法之一。它既能用于分类,也能用于回归。KNN通过测量不同特征值之间的距离来进行分类。KNN算法的思想非常简单:对于任意n维输入向量,分别对应于特征空间中的一个点,输出为该特征向量所对应的类别标签或预测值。KNN算法是一种非常特别的机器学习算法,因为它没有一般意义上的学习过程。它的工作原理是利用训练数据...

2018-09-27 10:19:25 121896 3

原创 深度学习的最新研究进展(三)

本文我们将简要讨论其他深度架构,它们使用与深度神经网络类似的多个抽象层和表示层,也称为深度生成模型(deep generate Models,DGM)。Bengio(2009)解释了深层架构,例如Boltzmann machine(BM)和Restricted Boltzmann Machines(RBM)及其变体等。Goodfellow等(2016)详细解释了深度生成模型,如受限和非受限的玻...

2018-09-25 15:09:01 2363

原创 深度学习的最新研究进展(二)

神经网络的功能与人脑相似,它们主要由神经元和连接组成。当我们说深度神经网络时,我们可以假设有相当多的隐藏层,可以用来从输入中提取特征和计算复杂的函数。Bengio(2009)解释了深度结构的神经网络,如卷积神经网络(CNN)、自编码器(AE)及其变体等。Deng和Yu(2014)详细介绍了一些神经网络架构,如AE及其变体。Goodfellow等(2016)对深度前馈网络、卷积网络、递归网络及其改进...

2018-09-19 14:11:24 2271

原创 深度学习的最新研究进展(一)

深度学习是机器学习和人工智能领域的最新趋势之一,为计算机视觉和机器学习带来了深刻的变革。新的深度学习正在不断诞生,甚至已经超越了最先进的机器学习技术。近年来,全世界在深度学习领域取得了许多重大突破。“深度学习”的由来“深度学习”(Deep Learning)一词最初于1986年被引入机器学习概念,2000年时又被用于人工神经网络。深度学习由多个层组成,以学习具有多个抽象层次的数据特征。深度...

2018-09-13 16:26:22 6565

原创 贷前调查必须采集的十大客户信息

贷前调查是信贷风控的第一道防线,信息采集的充分与否将直接决定了信贷机构放款的风险,包括信用风险、市场风险、操作风险等等。那么,贷前调查中,哪些信息是必须采集的呢?本文梳理了贷前调查必须采集的十大客户信息如下:1. 客户背景每家企业的成立都有一定的背景、动机和条件,如创始人具备一定的从业经验、拥有某项专业技术、掌握行业的产品市场资源、行业利润较高等。如果这些条件不成熟,盲目创业投资时的成功率...

2018-09-11 14:02:36 4002

原创 反欺诈之路——黑卡、养卡的识别

许多公司都需要一个商用设备来群发短信,比如邮电局、税务局、海关、银行、证券商、各类交易所、期货经纪公司、工商局以及各类信息呼叫中心等,这台设备就像一个能插入多张手机卡的简易手机,你可以把它理解为“n卡n待”,这种设备,就是猫池。你可以把大量的手机SIM卡插入猫池,通过这台设备来接收短信。根据端口数量的不同,猫池可以插入不同数量的手机SIM卡,少则8张,多则64张。当你把猫池连接电脑,电脑就变成...

2018-09-07 11:21:17 2448

原创 风控的进化——从传统风控到智能风控

对于金融企业来说,风控模型和风控体系需要非常有经验的金融从业人士进行把控。比如,银行风控模型的出发点主要是衡量借款方的还款能力,一般来讲,模型包含了两部分的评判,即客观性的和主观性的。客观性的评判主要依据是可以量化的数据,如公司的年度审计财务报告、银行流水、缴税金额等,这些数据放在已设定好的模型里就能计算出分数或等级,作为参考。但是,光靠客观数据还不够,比如说公司所在的行业是落后的将被淘汰的行...

2018-09-05 13:57:11 18139

原创 机器学习的“进化”

机器学习是一种可以自动建立模型的数据分析方法。它是人工智能的一个分支,其核心思想是系统可以从数据中学习、进行模式识别,并在极少人为干预的情况下进行决策。机器学习起源于模式识别,核心思想是计算机可以摆脱被动执行编程任务的模式,可以主动地从数据中学习。然而,机器学习并不是一门新的科学,而是一门获得了新动力的科学。机器从先前的计算中学习,产生可靠的、可重复利用的决策和结果。同时,机器学习不断迭代...

2018-09-03 11:41:12 945

原创 风控体系的一般架构

谈到互联网金融,风控体系是绕不开的一个话题。那么,什么是风控体系?简单地说,风控体系就是能够达成风险管理量化目标、边界清晰、结构清楚、动态持续的风险管理体系。量化目标:逾期率、坏账率可控是基本要求,检验风控体系有效性需要几个完整的信贷周期,结合公司盈利目标确定逾期率和坏账率的合理区间。边界清晰:所有因风险存在而产生的环节和流程都需要纳入风控体系来进行量化动态管理,风控体系的边界就是风险...

2018-08-31 09:59:57 21098

原创 现金贷风控生命周期——贷中和贷后

上篇我们简单介绍了现金贷风控生命周期中的贷前风控环节,本篇我们继续介绍贷中和贷后风控环节。贷中风控1. 借款申请阶段借款申请,是指选择金额、期限和借款用途的过程。尽管许多现金贷产品中并未体现“借款用途”,但这是一个合规的点。“现金贷”属于个人消费贷,借款只能用于日常消费,不能挪作他用。如果“借款用途”不属于个人消费,那么现金贷平台一般都会拒绝申请。同时,如果“借款用途”属于个人...

2018-08-29 09:43:55 7352

原创 现金贷风控生命周期——贷前风控

对于现金贷而言,主要风险包括欺诈风险和信用风险两个方面。识别欺诈风险的核心手段是信息核实、高危人群拦截和批量识别,侧重点在于是否通过。信用风险的识别主要通过根据收入水平来衡量偿还能力,侧重点在于授信额度和费率。风控的逻辑是,首先获得用户数据,然后设置规则和策略,在此基础上评估用户数据的表现,从而做出通过、不通过、升费率、降费率、提额、降额、催收、计入坏账等选择。用户数据的获得方式主...

2018-08-27 11:06:56 5764

原创 现金贷业务的风控体系

在中国,央行的征信记录只覆盖了3亿人,绝大多数人未被传统金融机构覆盖,征信记录为零,他们都是现金贷的潜在客户。面对如此庞大的人群,风控是决定现金贷健康发展的关键。那么,如何构建现金贷的风控体系?俗话说,知己知彼,百战不殆。要构建风控体系,首先要了解现金贷人群的需求和特点。 现金贷目标客户中国有4亿多发薪日贷和现金贷分期的适配人群,包括白领、服务员、快递员等,他们年龄在18~45...

2018-08-24 10:22:00 8277

原创 如何进行小微信贷风控?

信贷风险控制需要重点把握的是客户的还款意愿和还款能力,还款意愿取决于客户的信用记录和违约成本。信用记录包括央行征信记录和民间征信记录,违约成本取决于家庭情况、企业资产、经营时间和社会关系等。还款能力包括第一和第二还款来源,第一还款来源指的是能否还钱和按时还钱两个方面,能否还钱取决于偿债能力、营运能力和盈利能力,按时还钱取决于现金流情况;第二还款来源指的是保证和抵押。小微信贷的贷前风控包...

2018-08-22 10:07:19 4510

原创 什么是信贷风险控制?

信贷风险控制指的是通过风险识别、计量、监测和控制等程序,对信贷风险进行评级、分类、报告和管理,保持风险和效益的平衡发展,提高信贷的经济效益。信贷风险控制是一项综合性的工作,它贯穿于整个信贷业务流程的始终,包括贷前信用分析、贷中审查控制、贷后监控管理以及贷款安全收回几个环节。信贷风险控制以追求利润最大化为目标,为了在规模、风险、效率和客户体验之间取得平衡,建立相关信贷标准、制度、流程和岗位配...

2018-08-20 10:54:17 5176

原创 互联网反欺诈体系中的常用技术和数据类型

互联网反欺诈常用的技术主要包括数据采集、特征工程、决策引擎、数据分析等几个类别:数据采集:主要应用于从客户端或网络获取客户相关数据的技术方法。值得强调的是,数据采集技术的使用,应当严格遵循法律法规和监管要求,在获取用户授权的情况下对用户数据进行采集。通常,使用以下两种方法进行数据采集。设备指纹:设备指纹是目前在互联网领域被广泛使用的一种技术手段,其在反欺诈体系中的作用也从最早的设备...

2018-08-17 10:45:26 2810

原创 互联网反欺诈体系中的常用方法

反欺诈的方法多种多样,当前互联网反欺诈体系中常用的方法有信誉库、专家规则、机器学习等。信誉库信誉库即传统的黑白名单,通过内部积累、外部获取的各种人员、手机号、设备、IP等黑白名单对欺诈行为进行辨别,是一种实施简单、成本较低的反欺诈手段。与此同时,信誉库也存在着准确度低、覆盖面窄的缺陷和不足,仅可作为互联网反欺诈的第一道过滤网使用。规则系统规则系统是目前较为成熟的反欺诈方法和手段,主...

2018-08-15 10:33:01 4212

原创 面对互联网上的汩汩恶意,如何构建反欺诈体系?

互联网欺诈手法众多、灵活多变,这给反欺诈服务提出了很高的挑战。一般而言,互联网反欺诈存在几个原则:(准)实时性:考虑到用户体验,互联网反欺诈体系必须能够在非常短的时间内对欺诈行为进行认定,并给出判断。对于注册、登录、支付等一些场景,必须能够在用户无感知的情况下对欺诈行为进行检测和判别。自动化:由于(准)实时性的要求较高,决定了互联网业务无法通过人工操作进行反欺诈,必须使用更加高效的自动化反...

2018-08-13 15:12:09 1079

原创 互联网欺诈,金钱利益下的汩汩恶意

什么是欺诈?当你故意告知对方虚假的信息,或者故意隐瞒真实的情况,诱使对方做出错误判断的行为时,你已经在欺诈了。欺诈的本质就是“欺骗”,是通过欺骗达到通过正常途径无法达成的目的。欺诈自古就有,且无处不在,从古时的兵法谋略到现在的P2P跑路,本质上都是欺诈。 互联网欺诈互联网是一把双刃剑。进入互联网时代,技术发展导致全行业的效率不断提升,成本也接连下降。然而,在服务得到提升的同...

2018-08-10 15:12:03 772

原创 常用数据挖掘算法举例(下)

集成学习随机森林随机森林(Random Forest)是利用多棵树对样本进行训练并预测的一种分类器。简单地说,随机森林就是由多棵CART(Classification and Regression Tree)构成的。对于每棵树而言,它们使用的训练集是从总的训练集中通过有放回采样得到的,这意味着总的训练集中的有些样本可能会多次出现于一棵树的训练集中,也可能从未出现于一棵树的训练集中。...

2018-08-08 11:03:39 1238

原创 常用数据挖掘算法举例(上)

朴素贝叶斯 朴素贝叶斯分类法是统计学分类方法,在特征条件独立的前提下,基于贝叶斯定理计算的隶属关系概率进行分类。朴素贝叶斯分类有着坚实的数学基础和稳定的分类效率,同时,分类模型需要估计的参数很少,对缺失数据不太敏感,算法也比较简单。从理论上讲,朴素贝叶斯分类模型与其他分类方法相比的误差率最小,但是实际上并非总是如此,这是因为朴素贝叶斯分类模型假设各属性之间相互独立,然而这个假设在实...

2018-08-06 10:10:57 4888

原创 智能反欺诈算法概览

自20世纪末开始,由于反欺诈领域的数据量大和时效性高的要求,机器学习技术逐步实现应用。1997年,弗拉基米尔·科基纳基(vladimir Kokkinaki)提出了一种基于决策树的模型,其子节点代表不同变量,分叉路径代表不同的条件。2000年,乔恩·本特利(Jon Bentley)使用基因算法搭建了一套逻辑规则,它可以根据最大发生概率将交易行为划分为可疑交易和非可疑交易。2002年,理...

2018-08-03 10:52:57 6156

原创 信贷风控——贷前+贷中+贷后的全方位风控

贷前调查 贷前调查是风控的第一道防线。首先,通过前期掌握的贷款申请人相关信息,全面审查承贷主体的合规性、合法性和有效性。可利用“人行征信系统”“全国企业信用信息公示系统”“全国法院被执行人查询系统”“全国法院失信被执行人查询系统”“中国裁判文书网”以及第三方信用查询渠道,查询申贷人是否涉及民间融资、法律诉讼、集团关联、担保圈、担保链、多行业经营、主业不清等显性、隐性和潜在风险信息,对申...

2018-08-01 10:19:19 35948

原创 半监督主动式机器学习的技术优势:银行金融风控场景分析

风控技术的发展,经历了传统的黑白名单、规则系统,各风控公司都在不断探索新的风控技术和手段。随着人工智能的发展,现在风控领域大量使用有监督机器学习方法,同时,有一些公司在探索和应用更高级别的无监督机器学习。事实上,在有监督和无监督机器学习之间,还有一种半监督机器学习方法,也是慧安金科主打的风控方法,综合了有监督和无监督机器学习的优势,尤其在针对特定场景的风控方面效果非常显著。以银行金融风控场...

2018-07-30 10:35:34 4120

原创 基于个人信用评分的建模分析和授信决策

什么是个人信用评分? 个人信用评分又叫“消费者信用评分”,是评估申贷人或借款人违约风险的一种统计方法。通过统计用户的人口特征、信用记录、行为记录、交易记录等大量历史数据并进行系统分析,挖掘数据中隐含的行为模式和信用特征,开发信用评估模型,对用户的信用进行评估。一些信用记录会影响个人信用评分,包括延迟付款、拖延付款时间、信贷账户数目增减、信贷余额变化、账龄、最近的查询记录等。信用...

2018-07-28 16:41:29 14146

原创 数学模型漫谈

线性回归(Linear Regression)研究的是一个或多个变量与另一个连续型随机变量之间的相关关系的模型。线性回归在进行参数估计时实际上使用了最小二乘估计法。我们通常认为最小二乘法的发明者是高斯,实际上第一个将其发表的人是勒让德。基于最小二乘估计法的线性回归叫作“BLUE”(Best Least Unbiased Estimator),虽然它有很多优点,但是也有一些类似极致敏感的缺点。...

2018-07-26 17:34:39 448

原创 什么是机器学习?(下)

在搜索引擎里输入“什么是机器学习”,就像打开了一个潘多拉盒子,论坛、学术研究,应有尽有,正是由于技术人员对概念和定义的简化,才使我们得以更好地理解什么是机器学习。简单地说,机器学习是一种数据分析技术,它可以教计算机做那些人类和动物生来就会做的事情:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定的方程来建模。随着学习样本数量的增加,算法还能自动适应、提高性能。...

2018-07-24 17:58:15 915

原创 金融风控:通过率与坏账率的博弈

查准率与查全率在机器学习领域,有两个常用的指标:查准率与查全率。它们分别代表什么含义呢?让我们以一个例子来说明。假设有400人申请贷款,已知其中有160人是好人。我们建立一个模型进行训练,训练的结果是把100个人识别成了好人。但是,实际上,这些人中间只有80人是真正的好人,另外20人是漏网之鱼。其中,查准率(precision)=检出相关信息量/检出信息总量=80/100=80%...

2018-07-23 19:57:23 4515

原创 什么是机器学习?(上)

什么是机器学习?在搜索框内输入“机器学习”,检索出了这样的解释:“机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科。机器学习专门研究计算机怎么模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能”。机器真的可以像人一样学习吗?1959年,美国的Samuel设计了一款下棋程序,这个程序具有学习能力,可以在对弈中不断改善...

2018-07-21 10:56:26 1381

原创 数字金融反欺诈技术名词表

1.大数据分析(Big Data Analysis)大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据分析是指运用可视化分析、数据挖掘算法、预测性分析能力、语义引擎、数据质量和管理、数据存储等方法对大数据进行分析的过程。2.设备指纹(Device Fingerpr...

2018-06-30 13:58:20 3605

原创 数字金融欺诈行为名词表

1.盗号(第三方支付)第三方支付账号一般都关联着用户的银行卡、信用卡等信息,且多数第三方支付平台为了保证客户体验,只需首次授权,之后只要登陆网络支付账号就能使用信用卡或者借记卡付款,无须再次关联。所以第三方支付账号一旦被盗,将使用户的财产信息直接暴露在犯罪分子面前。犯罪分子通常通过木马病毒植入、钓鱼网站、拖库撞库等手段盗取用户网络账号。2.洗钱(第三方支付)第三方支付账号一般可以关联多家银行的...

2018-06-30 13:56:01 1602 1

原创 互利网上数字金融典型场景: 消费金融

       消费金融行业发展不断规范,前景依然广阔。艾瑞咨询数据显示,2017年,中国消费金融市场交易规模近2万亿,相较2016年增长128%。从资产端看,消费金融市场分为消费分期和现金贷两类,其中消费分期覆盖网购、租房、汽车、旅游、装修、教育、医美等行业和场景。      随着行业不断发展,专门从事消费金融欺诈的黑色产业也愈加猖獗,不法分子盯上了各类分期购物平台和现金贷平台,想方设法让其...

2018-06-30 13:51:32 3363 1

原创 互利网上数字金融典型场景: 网络营销

        营销欺诈即俗称的“羊毛党”,是指有选择地参与各互联网渠道的优惠促销活动,以相对较低的成本甚至零成本换取物质上实惠的人群。界定羊毛党的关键特征是,多频率、有组织地在单次营销活动中多次获取优惠金额的行为,其实质是由于其薅羊毛的行为侵占了其他用户本应享受的优惠活动,这种行为即是打击的对象。目前,羊毛党已形成15余工种、160余万从业人员、产业规模不低于1000亿元人民币的产业链,分工明确...

2018-06-29 13:09:53 893 2

原创 互利网上数字金融典型场景: 网络借贷

      我国网络借贷行业出现早、发展快。自 2007 年,我国第一家网络借贷平台拍拍贷成立。经过数年的发展,我国 P2P 网贷规模已经成为世界第一。据网贷之家的数据显示,2017 年全年网贷成交量 接近 2.8 万亿元,相比 2016 年增长 0.8 万亿元,接近 2015 年成交量的 3 倍。      网络借贷行业快速发展的同时欺诈行为也层出不穷,据爱钱进网的统计,每 100 个拒贷案...

2018-06-25 10:06:14 977 1

无监督机器学习与半监督主动式机器学习的区别

风控&反欺诈行业技术对比阶段图,从差异化角度说明在不同阶段技术方案的不同。

2018-06-14

黑白名单&规则引擎与半监督主动式机器学习的区别图

风控&反欺诈行业技术对比阶段图,从差异化角度说明在不同阶段技术方案的不同。

2018-06-14

风控&反欺诈行业技术对比阶段图

风控&反欺诈行业技术对比阶段图,从差异化角度说明在不同阶段技术方案的不同。

2018-06-14

AI 大半个世纪的发展史

AI 大半个世纪的发展史,简述了人工智能在这半个世纪内发展阶段中的重要节点。

2018-06-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除