自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 在Mac中python3使用stanfordNLP遇到的问题

解决Mac中python3使用stanfordNLP的问题一、使用问题首先是安装过程:pip install stanfordcorenlp在https://stanfordnlp.github.io/CoreNLP/index.html#download 中安装coreNLP和chinese.model.jar然后解压stanfordcoreNLP,重命名为stanford_nlp后将...

2018-12-18 17:43:02 1273 1

原创 python3将PDF转化为txt文件

python3将PDF转化为txt文件参考:(1)https://github.com/pdfminer/pdfminer.six(2)https://zhuanlan.zhihu.com/p/31017504我在python3.6环境下pip install pdfminer.six,然后执行以下代码,就可以将pdf文件转化为txt文件from pdfminer.pdfinterp i...

2018-11-19 19:44:47 7717

原创 机器学习和深度学习领域最近的一些研究小结(GAN、AutoML、机器翻译)

根据机器之心网站,记录一些我感兴趣的点,之后再查询相关文献或资料进行补充。内容来自:https://www.jiqizhixin.com/categories/theory1、AutoMLAutoML主要用于解决AI应用中数据特征提取和扩增、机器学习和深度学习模型合成以及模型超参调优等,其实现方式包括序贯模型优化、迁移学习、强化学习、元学习、进化算法以及基于连续假设的梯度求导方法(DARTS...

2018-11-09 13:02:10 748

原创 神经网络调参

神经网络的一些调参方法小结1、网格搜索法网格搜索就是将多个参数进行笛卡尔乘积后逐个试验,很费时间。sklearn库有GridSearchCV函数,结合了交叉验证,我还没在神经网络上应用过。2、逐个调参用枚举的方法逐个参数调优,一个参数取最佳值后固定住再进行下一个参数调优,比网格搜索快一些。不过可能有一些参数各自不是最佳值,但组合起来有更好的效果,这种方法就遗漏了这种情况。以下方法摘自机...

2018-11-06 13:37:51 900 1

原创 广告点击率预测问题初探

广告点击率预测问题初探国庆7天参加了一个广告点击率预测的小竞赛,作为只看过机器学习实战的小白,纯粹抱着学习的心态去开眼,果然被大神按在地上虐呢,不过也学到了很多知识。感谢很多大佬都开源并分享了他们的竞赛经验,帮助我入了一点点门。一、数据处理数据有train.txt 训练集和test.txt测试集。每一行数据为一个样本,可分为5类数据,包含基础广告投放数据、广告素材信息、媒体信息、用户信息和上...

2018-10-08 15:50:56 2984 4

转载 (转)如何处理类别不平衡的问题

如何处理类别不平衡的问题原文:https://www.quora.com/In-classification-how-do-you-handle-an-unbalanced-training-set在分类中如何处理训练集中不平衡问题在很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别不平衡问...

2018-09-23 14:25:15 338

原创 Mac安装lightgbm

使用https://blog.csdn.net/weixin_32087115/article/details/81489627提供的方法,成功安装了在此之前一直出现’…does not appear to contain CMakeLists.txt.'的错误

2018-09-22 14:48:24 967

转载 (转)gcc与cmake的关系

gcc与cmake的关系1.gcc是GNU Compiler Collection(就是GNU编译器套件),也可以简单认为是编译器,它可以编译很多种编程语言(括C、C++、Objective-C、Fortran、Java等等)。2.当你的程序只有一个源文件时,直接就可以用gcc命令编译它。3.但是当你的程序包含很多个源文件时,用gcc命令逐个去编译时,你就很容易混乱而且工作量大4.所以出现...

2018-09-22 14:08:18 642

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除