自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 python | codewars

Reversed Stringdef solution(string): return string[::-1]点赞显示机制def likes(names): n = len(names) return { 0: 'no one likes this', 1: '{} likes this', 2: '{} and ...

2020-03-29 22:09:17 218

原创 Quant | JQData使用API简单梳理(二)

聚宽平台实际上提供了两种查询数据的方法,第一种是线上在聚宽平台可以使用的API:jqdata,另外一种则是本地的接口:JQData,是的,你没有看错,只是大小写的不同,搞得一开始我以为完全是同一种。jqdata可以线上通过import jqdata来引入数据接口,本地的JQData则是通过import jqdatasdk来引入。两种数据源唯一的不同就是jqdata对接了聚源数据(一个更高阶的数据源...

2020-03-16 17:47:18 1802 1

原创 量化投资|股票基本面与财务分析

一般分为这五步公司靠什么赚钱分析主营业务分析公司商业模式公司赚钱能力如何盈利能力(ROE等)护城河分析4问:一问:为什么净资产收益率(ROE)高于同行?二问:为什么XX高于同行?三问:为什么毛利率高于同行或者三费(销售管理财务)占比低于同行?四问:既然这个方法能帮助企业赚大钱,竞争对手为什么不去模仿?营运能力存货周转率=营业成本/平均存货。总资产周转率=营...

2020-03-10 21:27:10 822 1

原创 End-to-End Machine Learning Project

End-to-End Machine Learning ProjectLook at the big pictureGet the dataCreate the WorkspaceDownload the DataTake a Quick Look at the Data StructureCreate a Test SetDiscover and Visualize the D...

2020-02-18 22:08:53 136

原创 thinkpython2总结

去年看了Allen Downey的thinkpython的英文版,收益匪浅,后来出了thinkpython2,代码实现也换成了python3,最近就又去简单看了下。最后一章写出了第一版没提到的python更多的功能,在此简单总结下。条件表达式if x > 0: y = math.log(x)else: y = float('nan')#可以改写为y = math.log(...

2020-02-18 17:05:44 399

原创 2020-1-6 学习笔记

样本不平衡问题怎么解决项目中出现了二分类数据不平衡问题,研究总结下对于类别不平衡问题的处理经验:为什么类别不平衡会影响模型的输出?许多模型的输出类别是基于阈值的,例如逻辑回归中小于0.5的为反例,大于则为正例。在数据不平衡时,默认的阈值会导致模型输出倾向与类别数据多的类别。因此可以在实际应用中,解决办法包括:调整分类阈值,使得更倾向与类别少的数据。选择合适的评估标准,比如ROC或...

2020-01-06 10:05:35 207

原创 2020-1-3学习笔记

特征工程有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:金融领域的几大模型:客户流失模型银行客户流失是指银行的客户终止在该行的所有业务,并销号。但在实际运营中,对于具体业务部门,银...

2020-01-03 15:49:58 354

原创 2019-12-19学习日记

集成学习boosting 每个弱分类器的生成是串行的AdaBoostGBDTXGBoost(特征粒度上是并行的)bagging 每个弱分类器的生成是并行的random forestAdaBoostAdaptive Boost 自适应提升GBDTGradient Boosting Decision Tree 梯度提升树新的提升树对残差进行训练...

2019-12-19 10:45:07 85

原创 2019-12-18学习日记

WOEweight of evidence 证据权重WOE是对原始自变量的一种编码形式pyi是这个组中响应客户(风险模型中,对应的是违约客户,总之,指的是模型中预测变量取值为“是”或者说1的个体)占所有样本中所有响应客户的比例,pni是这个组中未响应客户占样本中所有未响应客户的比例,#yi是这个组中响应客户的数量,#ni是这个组中未响应客户的数量,#yT是样本中所有响应客户的数量,#nT...

2019-12-18 17:20:21 91

原创 2019-12-16学习

auc指标和roc曲线aucarea under curve roc 曲线下的面积roc曲线receiver operating characteristic curve 接受者操作特征曲线横轴为FP rate,纵轴为TP rateTP rate和FP rate真正类率 FPR=FP/(FP+TN) 错误预测为正样本的负样本占负样本的比例负正类率 TPR=TP/(TP+...

2019-12-16 17:17:46 272

原创 java中static和final

finalfinal修饰类:该类不可继承final修饰方法:该方法不能被子类覆盖(但它不能修饰构造函数) - -final修饰字段属性:属性值第一次初始化后不能被修改 使用final可以提高程序执行的效率,将一个方法设成final后编译器就可以把对那个方法的所有调用都置入嵌入调用里。staticstatic修饰成员函数则该函数不能使用this对象static不能修饰构造函数、函数...

2019-10-13 10:09:59 90

原创 Ubutu安装二进制压缩文件tar.gz

以Typora的安装为例Install$ cd Downloads/Software$ wget https://typora.io/linux/Typora-linux-x64.tar.gz$ tar -xzvf Typora-linux-x64.tar.gz$$ sudo mv Typora-linux-x64 /opt/$ $ cd /opt/Typora-linux-x64...

2019-10-08 00:08:50 279

原创 异常和多线程

异常、线程第一章 异常异常概念异常体系异常分类异常产生过程解析第二章 异常的处理抛出异常throwObjects类非空判断声明异常throws捕获异常try…catchThrowable类中的3个异常处理方法异常处理注意事项第三章自定义异常自定义异常类finally代码块第四章 多线程并行与并发线程和进程创建线程类线程、同步第一章 多线程...

2019-10-01 11:25:43 103

原创 集合

collection集合概述java提供的一种容器,可以用来存储多个数据数组长度不变,集合长度可变数组储存同一类型的元素,可以存储基本数据类型。集合只能储存对象,而且类型可以不一致。开发中对象比较多时,使用集合进行存储框架介绍常用功能public boolean add(E e):public void clear();public boolean remove(E...

2019-09-29 16:03:33 170

原创 JAVA常用API

API使用方法看包路径看构造方法看方法摘要引用类型的一般使用步骤导包如果使用的目标类和当前类在同一个包下,则可以省略导包语句不写(java.lang包下的内容也不需要导入)创建类名 对象名 = new 类名称();使用对象名.成员方法名()Scanner类(java.util.Scanner)键盘输入数据到程序中的类Scanner in = new S...

2019-09-26 23:52:17 115 1

原创 IDEA的基本知识

项目结构project→module→package(year.month.day)→classpackage命名里面的点代表文件夹的结构(包路径)idea的强大之处psvm就可以输出public static void main语句;sout就可以System.out.println()实时保存,不用ctrl+s自动编译class文件自动创建在out文件夹里...

2019-09-26 18:17:05 549

原创 windows的cmd常用命令

文件路径不区分大小写切换盘符 盘符名称:切换工作位置 cd可以只打位置的一部分,按TAB还可以自动切换位置补全返回上一级 cd…清屏 cls查看当前位置的文件 lsESC:清除当前命令行;F7:显示命令历史记录,以图形列表窗的形式给出所有曾经输入的命令,并可用上下箭头键选择再次执行该命令。ctrl+c 终止...

2019-09-26 17:28:46 204

原创 漫画算法笔记(java实现)

算法概述算法(Algorithm)一系列程序指令,用于处理特定的运算和逻辑问题。衡量算法优劣的标准:时间复杂度空间复杂度数据结构(Data structure)数据的组织管理和储存格式,使用目的是为了高效的访问和修改数据。不同的算法会选用不同的数据结构。线性结构(数组,链表,栈,队列,哈希表)树(二叉树,二叉堆)图其他数据结构时间复杂度T(n)=O(f(n...

2019-09-23 21:06:34 556

原创 java进阶(面向对象编程)

类与对象普通变量对象变量(管理者)类是规范,对象是实体对象 = 属性(数据)+函数(操作) = 成员变量+成员函数封装:把数据和对数据的操作放在一起(外部的操作保护内部的数据)定义类创建对象new VendingMachine();VendingMachine v = new VendingMachine();对象变量是对象的管理者运算符.成员变量和成员函数函数...

2019-09-16 17:47:58 267

原创 案例学习代码

爬虫高级技巧:代理爬虫等python进行数据库操作在线交易行为统计分析(一)在线交易行为统计分析(二)

2019-09-12 20:51:02 162

原创 Pandas知识点

基本操作索引a.iloc[0,2]=a.iloc[0][2] (右边的更常用和标准,因为多层索引的问题)取第一行第三列的数取列用a[“b”]或者a.b切片显式索引(终点也包括)a.loc[1]a.loc[1:2]隐式索引a.iloc[1]a.iloc[1:3]过滤迭代Seriesfor i in a.iteritems(): print(i)#index和v...

2019-09-12 11:44:25 197

原创 pandas数据类型

series(序列)可理解为有索引的ndarray数组创建1.a = pd.Series([2,3,6],index = [“i”,“u”,3])2.字典定义双索引机制Dataframe(数据框)可理解为若干个相同索引构成的序列创建()a=pd.DataFrame(np.random.randn(6,3), index = range(2,8), ...

2019-09-11 22:15:34 170

原创 爬虫高级技巧

设置程序休止时间n为你想要实现的时间间隔import timetime.sleep(n)设置代理#使用urllib.request的两个方法进行代理的设置proxy = urlrequest.ProxyHandler({'https':'47.91.78.201:3128'})opener = urlrequest.build_opener(proxy)User-Agent网...

2019-09-11 00:52:50 633

原创 在线行为中的幂函数和取bin(scipy应用)

scipy的功能特殊函数 (scipy.special)积分 (scipy.integrate)优化 (scipy.optimize)插值 (scipy.interpolate)傅立叶变换 (scipy.fftpack)信号处理 (scipy.signal)线性代数 (scipy.linalg)稀疏特征值 (scipy.sparse)统计 (scipy.stats)多维图像处理...

2019-09-11 00:26:07 244

原创 SQLite和MongoDB

SQLite特点文件型数据库常用于应用程序存储数据,比如浏览器存储用户的资料等GUI: DB Browser for SQLite;访问SQLite就是访问一个文件,使用这个前端的程序来访问Python:import sqlite3,来进行数据库的读取(不需要安装)相关准备请阅读SQLite官方文档,请重点阅读代码示例部分import sqlite3#通过sqlite3.conn...

2019-09-10 20:30:38 1260

原创 利用python进行数据库操作

PyMySQL(pip)conda install PyMySQLCREATE TABLE users (id int(11) NOT NULL AUTO_INCREMENT,email varchar(255) COLLATE utf8_bin NOT NULL,password varchar(255) COLLATE utf8_bin NOT NULL,PRIMARY KEY (...

2019-09-10 20:20:14 187

原创 SQL常用进阶操作

数据过滤与分组聚合DISTINCT:SELECT DISTINCT column1,… FROM tableLIKE(%,_)WHERE column LIKE patternBETWEEN INSELECT column FROM tableWHERE column BETWEEN 4 AND 5MAX,MIN,COUNT,SUM,AVGSELECT MA...

2019-09-06 20:57:33 156

原创 SQL基本查询语句(查增改删)

查SELECT /column FROM tableWHERE conditionORDER BY condition (column desc)LIMIT number(5)增INSERT INTO table(column1,column2…)VALUES(value1,value2…)改UPDATE tableSET column=value1…WHERE condi...

2019-09-06 16:52:47 128

原创 五大常用算法

五大常用算法之一:分治算法http://www.cnblogs.com/steven_oyj/archive/2010/05/22/1741370.html五大常用算法之二:动态规划算法http://www.cnblogs.com/steven_oyj/archive/2010/05/22/1741374.html五大常用算法之三:贪心算法http://www.cnblogs.com/s...

2019-09-05 00:22:42 135

原创 机器学习知识点

1.监督学习线性回归(梯度下降法)逻辑回归(sigmoid函数)神经网络(反向传播,梯度下降)svm(支持向量机)knn (k邻近)决策树(ID3 cart c.54)朴素贝叶斯naive bayesian(要求特征独立)感知机(sign函数)2.无监督学习k-means(method)算法是Lloydpca@集成学习1.bootstrap随机森林2.boosting...

2019-09-05 00:20:40 113

原创 Java入门

package Hello_World;import java.util.Scanner;//为了输入public class HelloWorld { public static void main(String[] args) { // TODO}输入Scanner in = new Scanner(System.in);引用:读入值为一行in.nextLine()、...

2019-09-05 00:08:37 73

原创 待解决的知识点

leetcodexgboostcart

2019-09-04 23:57:24 76

原创 很有用的网站

w3schools 很多web开发的教程easymock 模拟网页的网站

2019-09-04 23:56:43 72

转载 单词本

缩写href hyper reference 超链接src sourceJAVA单词transientvolatilenativevoidsuperinterfacesubclassfinal单词mockproofalt alternativeservlet 小服务程序prettify 美化entropy 无序状态(熵)incurring 导致...

2019-09-04 23:54:08 464

原创 Ubutun常用命令

先sudo passwd root 再su 可获取管理员权限1.基本操作cd 移到路径ls 列出当前位置的所有文件和文件夹mkdir 新建文件夹touch 新建文件rmdir 删除空文件夹rm -rf 删除文件夹以及里面所有内容rm 删除文件cp 拷贝文件到目标路径cp -i 复制(同名会询问)cp -f 强制复制(同名不询问)2.安装与升级wget 下载某个...

2019-09-04 23:51:16 199

原创 python知识点

// 整除操作% 取余操作

2019-09-04 23:48:51 128

原创 numpy知识点(与python比较)

np.sum(axis=1,keepdims = True) 保持原有维度,不然就会默认得到秩为一的数组(即去掉维度为1的那个维度了)assert(a.shape == (1,2)) 正确则跳过,错误则输出assert error使用 a.tolist() 将array转化为list,如果只有一个元素(且只有一个维度)则转化为一个标量np.squeeze()可以将array中维度为1的维度去...

2019-09-04 23:48:08 621

原创 深度学习笔记(吴恩达)

每章框架COURSE1WEEK TWOPreprocessing the dataset is important.You implemented each function separately: initialize(), propagate(), optimize(). Then you built a model().Tuning the learning rate (whic...

2019-09-04 23:44:19 140

原创 Conda常用命令

conda -h conda帮助conda create -n env_name python = version_number 创建环境conda remove env 删除环境source activate (env) 激活环境(默认base)conda install pkgs 安装包conda update pkgs 更新包conda remove pkgs 删除包...

2019-09-04 23:40:30 68

原创 Git基本操作

1.git中HEAD表示指针当前位置2.登录git config --global user.name “username”git config --global user.email “email”3.基本使用git init testgit add .git statusgit commit -m “message”(可以用git add . && git c...

2019-09-04 23:36:34 90

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除