自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(212)
  • 收藏
  • 关注

原创 超级全的停用词整理

,?、。“”《》!,:;?人民末##末啊阿哎哎呀哎哟唉俺俺们按按照吧吧哒把罢了被本本着比比方比如鄙人彼彼此边别别的别说并并且不比不成不单不但不独不管不光不过不仅不拘不论不怕不然不如不特不惟不问不只朝朝着趁趁着乘冲除除此之外除非除了此此间此外从从而打待但但是当当着到得的的话等等等地第叮咚对对于多多少而而况而且而是

2020-09-07 20:10:36 41709

原创 这个人间终究值得

2020.1.18—2020.4.18\color{red}{2020.1.18—2020.4.18}2020.1.18—2020.4.18,整整3个月的时间。鬼知道在这三个月里我经历了什么?但上帝知道呀!漫长的春节2020年1月18号即去年农历腊月24,和老大从长沙\color{red}{长沙}长沙开车回湖北老家过年。万万没有想到,这趟回家居然呆了两个多月,度过了最漫长的一个春节。一个...

2020-04-25 10:12:02 611

原创 Keras3.0重磅来袭

在方法的主体中,实现了一个常规的训练更新,类似于您已经熟悉的内容。重要的是,我们通过计算损失,它包装了传递给compile()的损失函数。else:官方学习地址:https://keras.io/guides/writing_a_custom_training_loop_in_torch/

2024-01-19 11:54:26 404

原创 可视化神器Plotly绘制金融图表

可视化神器plotly绘制金融图表

2024-01-19 11:45:42 435

原创 基于LightGBM的金融信贷数据建模

基于树模型LightGBM的金融信贷数据建模

2024-01-19 11:44:40 449

原创 利用Python实现随机采样

本文详细地介绍基于Python的第三方库random和numpy.random模块进行随机生成数据和随机采样的过程。MORE。

2023-09-15 23:50:45 562

原创 机器学习:10种方法解决模型过拟合

L1 正则化,通常也被称为Lasso 正则化(Least Absolute Shrinkage and Selection Operator),是通过在损失函数中添加 L1 范数(参数绝对值之和)惩罚项,来约束模型的参数。L1 正则化的目标是使模型参数趋向于稀疏,即让一些参数为零,从而实现特征选择和减少模型复杂度的效果。

2023-09-15 23:49:50 1507

原创 机器学习10大必备算法

通过计算每个codebook向量与新数据实例之间的距离来找到最相似的邻居(最佳匹配),然后返回最佳匹配单元的类别值或在回归情况下的实际值作为预测。同时,只有这些离得近的数据点才和超平面的定义和分类器的构造有关,这些点被称为支持向量,他们支持或定义超平面。当然,你尝试的算法必须和你的问题相切合,其中的门道便是机器学习的主要任务。这类事件被称为维度诅咒。在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。

2023-09-15 23:47:56 154

原创 Python深度学习-Keras》精华笔记4:解决深度学习回归问题

公众号:尤而小屋作者:Peter编辑:Peter持续更新《Python深度学习》一书的精华内容,仅作为学习笔记分享。。

2023-09-11 21:59:04 229

原创 《Python深度学习-Keras》精华笔记3:解决深度学习多分类问题

持续更新《Python深度学习》一书的精华内容,仅作为学习笔记分享。本文是第三篇:介绍如何使用Keras解决Python深度学习中的多分类问题。多分类问题和二分类问题的区别注意两点:机器学习中的路透社数据集是一个非常常用的数据集,它包含来自新闻专线的文本数据,主要用于文本分类任务。这个数据集是由路透社新闻机构提供的,包含了大量的新闻文章,共计22类分类标签。In [1]:训练集和标签In [2]:In [3]:数据查看In [4]:Out[4]:In [5]:Out[5]:查看label中

2023-09-11 21:57:42 214

原创 一文讲透机器学习超参数调优!

机器学习超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。超参数是在模型训练之外设置的选项,不会在训练过程中被优化或更改。相反,需要在训练之前手动设置它们,并且对模型的性能有很大的影响。超参数优化库(Hyperparameter Optimization Library)是一种用于自动化超参数优化的软件库或工具。这些库使用不同的算法和技术,以实现自动化超参数搜索和优化过程。超参数优化库通常提供易于使用的接口,允许用户定义要优化的超参数和目标函数。

2023-09-11 21:56:19 757

原创 数据科学家必备的20个Python库

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~小屋里面一直在输出关于数据科学领域的文章,绝大部分都是基于Python,少量的MySQL(MySQL存储数据用)。本文重点给大家介绍Python中科学领域常用的20个库。

2023-09-11 21:54:32 272

原创 科研绘图,别忘Origin!

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~官网地址:https://www.originlab.com/Origin是OriginLab公司出品的较流行的专业函数绘图软件,是专为不同科研领域的科学工作者进行绘图和数据分析而设计的。因此,Origin提供了大量的数据分析和绘图工具,可以满足对不同数据分析、函数拟合和科技作图的需求。

2023-09-11 21:52:57 650

原创 《Python深度学习-Keras》精华笔记2:解决深度学习二分类问题

公众号:尤而小屋作者:Peter编辑:Peter持续更新《Python深度学习》一书的精华内容,仅作为学习笔记分享。运行环境:Python3.9.13 + Keras2.12.0 + tensorflow2.12.0。

2023-08-01 14:19:46 196

原创 《Python深度学习-Keras》精华笔记1:深度学习数学基础及张量

公众号:尤而小屋作者:Peter编辑:Peter持续更新《Python深度学习》一书的精华内容,仅作为学习笔记分享。

2023-08-01 11:10:29 128

原创 10分钟掌握seaborn绘制多子图

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文介绍如何使用seaborn绘制多子图。

2023-08-01 09:48:23 1802

转载 50个绝佳的机器学习数据集

外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,Peter为大家分享一下~

2023-07-31 09:10:46 100

原创 深度学习在Li电池RUL、SOH和电池热管理中的研究进展与应用

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~今天给大家分享一篇关于的文献综述。文献基本信息介绍:本文系统介绍了Deep Learning深度学习的不同方法在锂电池剩余使用寿命(RUL)、健康状态(SOH)和电池热管理(BTM)预测中的应用。本文综述从预测性能、优点和缺点等方面评估了不同的深度学习方法来进行电池估计和预测。此外,本文还讨论了上述应用中影响充放电循环、复杂环境、动态条件和不同电池类型的不同算法的特点、成就、局限性和改进方向。MORE。

2023-07-06 00:15:07 501

原创 20+个小而精的Python实战案例(附源码和数据)

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~

2023-07-02 13:54:37 3506

转载 【无标题】

讲解transformer最好的文章

2023-06-17 14:48:55 80

原创 python进阶:7招展开嵌套列表

后面会考虑非全部列表的数据(比如列表和数字)和多层嵌套。如何快速理解python的extend函数,给个案例。如果有更好的方法,留言区欢迎讨论交流~大家好,我是Peter~

2023-03-01 22:36:20 924

原创 机器学习算法竞赛实战:如何看到机器学习竞赛问题?

更新《机器学习算法竞赛实战》一书的阅读笔记,更多详细的内容请阅读原书。什么场景下需要处理样本不均衡问题?

2023-02-22 23:59:52 210

原创 基于机器学习的用户画像分析

用户画像分析

2023-01-29 17:09:15 781

原创 台湾大学李宏毅:图解卷积神经网络CNN

台湾大学李宏毅老师图解卷积神经网络CNN

2022-10-28 12:01:30 2995

原创 深度学习4大激活函数

深度学习4大激活函数

2022-10-25 17:46:03 803

原创 深度学习框架Keras入门案例

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文介绍3个案例来帮助读者认识和入门深度学习框架Keras。3个案例解决3个问题:回归、二分类、多分类目录为什么选择Keras相信很多小伙伴在入门深度学习时候首选框架应该是TensorFlow或者Pytorch。在如今无数深度学习框架中,为什么要使用 Keras 而非其他?整理自Keras中文官网:Keras 优先考虑开发人员的经验Keras 被工业界和学术界广泛采用Keras 可以轻松将模型转化为产品Ke.

2022-05-07 22:10:33 1522

原创 5000字,通透讲解Pandas读存Excel

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文记录的是如何通过Pandas来读取Excel文件,以及将DataFrame保存到Excel文件中。官网参数详解:https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html参数read_excel函数能够读取的格式包含:xls, xlsx, xlsm, xlsb, odf, ods 和 odt 文件扩展名。支持读取单一sheet或几个shee.

2022-05-02 09:42:21 1110

原创 Python实现词云舞

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文是一个非常完整的Python实战项目,主要内容包含:在此感谢周杰伦的《本草纲目》、刘畊宏教练、百度平台以及参考大佬们的方法,本文仅做个人学习使用。视频下载神器:you-get you-get是一个下载视频的神器,安装之后一行代码即可下载视频you-get [url]you-get https://www.bilibili.com/video/BV1yY4y1i7Pw?t=1079.2&nb.

2022-04-27 14:30:25 881

原创 Pandas+Numpy+Sklearn随机取数

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文记录的是如何使用Python、pandas、numpy、scikit-learn来实现随机打乱、抽取和切割数据。主要的方法包含:sampleshufflenp.random.permutationtrain_test_split导入数据In [1]:import pandas as pdimport numpy as npimport random # 随机模块import plotly_ex.

2022-04-22 22:35:07 1028

原创 机器学习算法:关联规则分析

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~今天给大家分享一个经典的机器学习算法:关联规则分析,从理论到代码到实战,全部拉满。本文主要内容:文章过长,建议收藏经典案例关联分析是一种从大规模的数据集中寻找有趣关系的方法。一个经常被用到关联分析的例子:购物篮分析。通过查看哪些商品经常在一起被顾客购买,可以帮助商店去了解用户的购买行为。经典的啤酒和尿布的案例:某家超市的销售管理人员在分析销售订单时发现,啤酒与尿布这两件看起来毫不关联的商品竟然经常会出现在同.

2022-04-18 00:03:28 5217 3

原创 pandas索引的设置与修改

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文主要是介绍Pandas中行和列索引的4个函数操作:set_indexreset_indexset_axisrename创建索引快速回顾下Pandas创建索引的常见方法:pd.IndexIn [1]:import pandas as pdimport numpy as npIn [2]:# 指定类型和名称s1 = pd.Index([1,2,3,4,5,6,7], dt.

2022-04-17 00:09:48 21357

原创 Pandas索引基本操作

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文主要是记录Pandas中单层索引的一些基本操作。10种索引下面简单回顾下之前学习创建的10种索引:pd.IndexIn [1]:import pandas as pdimport numpy as npIn [2]:# 指定类型和名称s1 = pd.Index([1,2,3,4,5,6,7], dtype="int", name="Peter")s1Ou.

2022-04-15 00:05:22 3075

原创 Seaborn绘制箱型图

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文介绍的是如何使用 seaborn 的 boxplot 方法来绘制箱型图,先看看部分图形的绘制效果:参数绘制图形中的主要参数如下:更多资料可参考官网地址:https://seaborn.pydata.org/generated/seaborn.boxplot.html箱型图箱型图是一种用作显示一组数据分散情况资料的统计图,它能够快速显示数据中的异常值情况,其形状像盒子,因而得名,也称之为盒须图、盒式图、盒装图或.

2022-04-12 23:10:39 9513 2

原创 深度学习实战:基于CNN的猫狗图像识别

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文记录了第一个基于卷积神经网络在图像识别领域的应用:猫狗图像识别。主要内容包含:数据处理神经网络模型搭建数据增强实现本文中使用的深度学习框架是Keras;图像数据来自kaggle官网:https://www.kaggle.com/c/dogs-vs-cats/data数据处理数据量数据集包含25000张图片,猫和狗各有12500张;创建每个类别1000个样本的训练集、500个样本的验证集和500个样本的.

2022-04-09 21:48:08 25540 7

原创 Jupyter Notebook使用技巧:换皮肤

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~Jupyter Notebook一直都是做数据分析的最佳利器。之前写过一篇关于jupyter notebook的详细入门手册,方便大家快速入门。今天介绍一个 Jupyter 的使用技巧:换皮肤启动Jupyter Notebook当我们下载了Jupyter Notebook加入系统环境变量后,可以在任意地方启动它(base) peter:Plotly peter$ pwd # 当前目录/Users/peter/.

2022-04-06 22:50:11 1053

原创 深度学习必知概念

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~本文主要机器学习的一些基本内容,包含:除了分类和回归之外的其他机器学习形式评估机器学习模型的规范流程为深度学习准备数据特征工程解决过拟合处理机器学习问题的通用流程机器学习4个分支监督学习supervised learning最常见的机器学习类型。给定一组样本(通常是人工标准),它可以学会将数据映射到已知目标(也叫标注)。监督学习广泛应用到光学字符识别、语音识别、图像分类和语言翻译。监督学习除了回归和分.

2022-04-03 13:04:14 2132

原创 Facebook开源时序利器-Kats

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~Kats(Kits to Analyze Time Series)是一款轻量级、易于使用、可扩展和通用的框架,用于在Python中进行时序分析,由Facebook开源。TimeSeriesData是Kats中表示单变量和多变量时间序列的基本数据结构,有两种初始化的方法:TimeSeriesData(df):要求包含一个"time"列和任意值列的pd.DataFrame对象TimeSeriesData(time, valu.

2022-04-02 23:10:46 489 1

原创 深度学习实战案例:新闻文本分类

深度学习多分类案例:新闻文本分类公众号:机器学习杂货店作者:Peter编辑:Peter大家好,我是Peter~这里是机器学习杂货店 Machine Learning Grocery~之前介绍过一个单分类的问题。当每个数据点可以划分到多个类别、多个标签下,这就是属于多分类问题了。本文介绍一个基于深度学习的多分类实战案例:新闻文本分类,最终是有46个不同的类别数据集路透社数据集广泛使用的文本分类数据集:46个不同的主题,即输出有46个类别。某些样本的主题更多,但是训练集中的每个主题至少有

2022-04-02 23:08:06 5574

原创 深度学习实战案例:电影评论二分类

第一个深度学习实战案例:电影评论分类公众号:机器学习杂货店作者:Peter编辑:Peter大家好,我是Peter~这里是机器学习杂货店 Machine Learning Grocery~本文的案例讲解的是机器学习中一个重要问题:分类问题。本文是《Python深度学习》一书中的实战案例:电影评论的二分类问题。训练集和测试集这是一个典型的二分类问题。使用的是IMDB数据集,训练集是25000条,测试也是25000条In [1]:import pandas as pdimport nu

2022-04-02 23:07:10 1967

原创 python机器学习3大宝典

公众号:尤而小屋作者:Peter编辑:Peter大家好,我是Peter~今天给大家推荐3本Python机器学习相关的书籍,如果你想提升Python能力,想开启kaggle实战,想了解机器学习神器Scikit-Learn库的使用,建议下载学习~一、流畅的Python一本关于Python进阶的书籍,OREILLY系列的动物书-蜥蜴书,非常经典。整本书主要分为6个部分:序幕:Python数据模型数据结构:数组、字典、集合、文本和字节序列把函数视为对象:深入理解Python中的函数实现的设计模式.

2022-04-02 23:04:05 936

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除