木木爱早起-CSDN博客

原创 python matplotlib 画黑白的柱状图（论文专用）

# -*- coding: utf-8 -*-import numpy as npimport matplotlib.pyplot as pltfrom pylab import *mpl.rcParams['font.sans-serif']=['SimHei']def read(): name_list = ['计算机'.decode("utf-8"),'法律'.decode("...

2018-04-27 14:25:05 10721 1

原创 pandas常见操作集锦

1 apply函数传递多个参数data_df['remark'].apply(segment_sentence, args=(word_list,))多余的参数均在数均在args中

2021-11-10 17:00:39 730

原创 pandas常用操作

1、通过apply(pd.Series)实现将tuple进行分列df = pd.DataFrame({'a':[1,2], 'b':[(1,2), (3,4)]})df[['b1', 'b2']] = df['b'].apply(pd.Series)

2021-11-10 10:33:02 554

原创 stata 回归分析

输出结果( 不显示基准组和忽略组的系数，使用 nobase 与 noomit 的选项)esttab m1 m2 m3 m4 m5 m6 m7 m8 m9 using result-all.rtf, title(Table1) drop(*year) pr2 aic bic scalar(N Year) append nogaps compress nobase noomit

2021-10-08 19:54:13 1668

原创 stata 读取文件

指定文件路径cd D:\code-stata\v5clear all//清除已有的数据读取excel文件import excel using "CSR-All.xlsx" , sheet("Sheet1") firstrow读取csv文件import delimited "CSR-All.csv", encoding(UTF-8)

2021-10-08 11:56:58 6541

按类别求均值，然后创建一个新的变量bysort year industry: egen meanvariable=mean(variable)//year industry ：分组的类别//meanvariable ：新变量的名称//variable ：均值变量//如表所示的样例bysort category: egen mean_variable=mean(variable)缩尾处理处理常见的异常值winsor wage, gen(wage_w)...

2021-10-08 11:35:25 6184 2

原创 web of science 检索技巧

基本格式：如：Keyword ("social media" OR "Facebook" OR "Twitter" OR"Instagram" OR "social networking sites") AND (entrepreneur* OR "SME" OR "small business" OR "small and medium")主题1："social media" OR "Facebook" OR "Twitter" OR"Instagram" OR "social network

2020-12-25 21:05:30 3721

原创 Web of Science+VOSViewer探索研究热点

一、选择UTD信息管理两大顶刊Information Systems ResearchMIS QUARTERLY二、选择导出文件三、VOSViewer分析选择要分析的类型（以下为共现关键词，尽量选择Author keywords）四、分析结果...

2020-12-25 16:25:02 4123 1

原创 stata 命令文件和日志文件

stata命令文件和日志文件1、do文件（命令集）打开方式：命令行：doedit执行命令：注释：(双斜杠或者星号)//this is a sample*this is a sample2、log文件（日志）保留所有的输出日志打开：选择日志文件打开（可以选择新建、覆盖已有日志、补充已有日志，smcl格式）命令行输入 log using filename.smcl关闭：命令行输入 log close导出：smcl格式转换成log格...

2020-12-24 20:16:43 13656 1

原创 kaggle 入门

1.注册账号注册账号时需要使用fanqiang，否则无法获取邮箱验证码（邮箱可以使用国内邮箱qq/163等）2.下载数据集需在Account中申请API token

2020-12-15 15:36:52 171 1

原创 python 转换提取文本的日期信息

符：%a 英文星期简写%A 英文星期的完全%b 英文月份的简写%B 英文月份的完全%c 显示本地日期时间%d 日期，取1-31%H 小时， 0-23%I 小时， 0-12%m 月， 01 -12%M 分钟，1-59%j 年中当天的天数%w 显示今天是星期几%W 第几周%x 当天日期%X 本地的当天时间%y 年份 00-99间%Y 年份的完整拼写from datetime import datetimetime_format=datetime.strptime(.

2020-12-09 17:04:28 737

原创信息管理-领域期刊

信息管理领域INFORMATION SCIENCESIF：5.91（2019 Q1）

2020-11-23 19:51:06 503

原创信息管理-领域大佬

中国人民大学信息学院许伟研究方向：金融科技、量化分析、数字经济与区块链、商业分析、智能社会治理、社交媒体挖掘个人主页：http://info.ruc.edu.cn/academic_professor.php?teacher_id=71

2020-11-21 20:59:03 174

原创【生日碰撞和数字签名】

参考：李永乐老师的视频生日碰撞：问题：假定一个班级中有50个人，则有两个人生日相同的概率为多大？【错误方式】如果没有经过严密的数学推导，很多人第一反应为 50/365=10/73，大概七分之一，由此看来发生的概率比较小。【正确方式】实际上，如果按照概率来看：设P为生日不在同一天的概率，则发生的概率为1-P如果有三个人（n=3）的话，则概率P = 365/365 *364/365 * 363/365，以此类推通过公式可以计算得出：当n=10时，P=88.3%，1-P=11.7%当n

2020-11-19 16:51:55 751

原创【Deep Learning】自编码模型Auto-Encoder1

（1）自编码模型基本概念：给定一个Input（vector），通过Encoder（neural network），得到code（vector）的过程（通常情况下code的维度小于input的维度）如何训练：可以将code，连接Decoder（neural network），得到Output（与input相同），通过训练input和output之间的损失函数最小，达到最优效果。与PCA对比：PCA实际上是通过矩阵变换，将input达到降维的目的当然，Auto-encoder也可以是

2020-11-17 16:16:44 1323

原创关于协整

参考：https://ppwq.net/?p=1538协整就是：醉汉牵着一条狗（A Drunk with his Dog）。这句话源自一篇正式发表的论文：Murray, Michael P. (1994). “A Drunk and her Dog: An Illustration of Cointegration and Error Correction” (PDF). The American Statistician. 48 (1): 37–39. doi:10.1080/0003130

2020-11-16 21:16:33 474 1

原创时间序列模型-ARIMA模型

如何理解“差分”：参考：https://zhuanlan.zhihu.com/p/46699931一阶差分：用下一个数值，减去上一个数值二阶差分：在一阶差分的基础上用后一个数值再减上一个数值一次差分的作用：减轻数据之间的不规律波动，使其波动曲线更平稳...

2020-11-16 21:08:41 223

原创机器学习常用函数技巧汇总

1.打乱数据def _shuffle(X, Y): # This function shuffles two equal-length list/array, X and Y, together. randomize = np.arange(len(X)) np.random.shuffle(randomize) return (X[randomize], Y[randomize])

2020-11-04 19:35:37 209

原创机器学习操作流程问题汇总

预处理操作时，如何对训练数据和测试数据作预处理？以标准化为例，先对Training Data进行标准化，此时应保存mean（均值）和std（标准差）结果，在对Testing Data进行预处理时，则使用Training Data保存的mean和std进行标准化def _normalize(X, train = True, specified_column = None, X_mean = None, X_std = None): # This function normalizes spec

2020-11-04 19:21:46 136

原创 matplotlib import matplotlib.pyplot as plt 出现编码错误

用python调用import matplotlib.pyplot as plt出现编码错误，出现以下问题Traceback (most recent call last): File "D:\sklearn包学习\test2.py", line 12, in <module> import matplotlib.pyplot as plt File "F:\python...

2018-04-20 15:53:19 3652

原创使用libsvm分类和预测详细说明（python）

Libsvm使用详细介绍optimization finished, #iter= 162 //iter为迭代次数，nu = 0.431029 //nu是你选择的核函数类型的参数obj = -100.877288, rho =0.424462 // rho为判决函数的偏置项b// obj为SVM文件转换为的二次规划求解得到的最小值nSV = 132, ...

2018-03-17 16:38:01 14146

原创 java 连接access数据错误集锦

在用java操作access数据的问题时出现了各种问题，一路上也是在不断的尝试和摸索，如果有类似的错误希望下面的一些小建议能给大家一点帮助，还有关于那个安装包的access驱动程序的安装包，我的另一篇博客里有第一条：user lacks privilege or object not found：用户没有特权或未找到对象一般是由于你所查找的查找语句中对应数据库的字段名书写错误，比如

2018-01-14 15:56:13 4974 3

原创 java JDK1.8版本及以上连接access数据库

由于学习课程的需要，需要将数据用java存储在access数据库中，但由于教科书上都是通过JDBC-ODBC桥接器的方式，进行连接，此方式只适用于JDK1.7及以下版本。于是在JDK1.8以上版本中，调用Class.forName（"sun.jabc.odbc.JdbcOdbcDriver"）无法建立桥接器，此版本以不支持该方式。既然电脑已经

2018-01-09 12:56:09 4109 2

jsp连接mysql数据库 jar包+代码

jsp连接mysql数据库 jar包+代码，亲测有效，放心使用

2018-05-09

JSP上传图片预览

从电脑里选择图片，图片的格式可以加以限制，选择图片后可实时显示预览