自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

baby_hua的专栏

做自己的搬运工

  • 博客(269)
  • 资源 (3)
  • 收藏
  • 关注

原创 jieba分词词性对照字典

【代码】jieba分词词性对照字典。

2024-04-10 17:19:10 160

原创 20240325_AI小字典

Torch自称为神经网络界的Numpy,因为它能将torch产生的tensor放在GPU中加速运算,就像Numpy会把array放在CPU中加速运算。Torch和Numpy有着很好的兼容性,可以自由的转换numpy的array和torch的tensor。一般是安装两个部分:pytorch和torchvision。前者是Pytorch的主模块,后者是一些库,包括一些网络的预先训练好的model和各种资源官网支持pip和conda两种安装方式;(最好用镜像,自己装过两次,没弄明白。。。

2024-03-26 15:13:06 1051

原创 如何使用torchrun启动单机多卡DDP并行训练

DDP

2023-11-28 18:16:06 1263

原创 TOOLS_JS异步调用的同步处理

【代码】TOOLS_JS异步调用的同步处理。

2023-11-23 14:43:43 120

原创 读书笔记:多Transformer的双向编码器表示法(Bert)-4

Bidirectional Encoder Representations from Transformers,即Bert;

2023-10-10 18:33:00 1221

原创 读书笔记:多Transformer的双向编码器表示法(Bert)-3

Bidirectional Encoder Representations from Transformers,即Bert;

2023-10-10 18:31:13 587

原创 读书笔记:多Transformer的双向编码器表示法(Bert)-2

Bidirectional Encoder Representations from Transformers,即Bert;

2023-09-21 15:01:03 982

原创 读书笔记:多Transformer的双向编码器表示法(Bert)-1

Bidirectional Encoder Representations from Transformers,即Bert;目标是熟练掌握Bert及其变体来执行实际的自然语言处理任务;利用Bert模型超强的理解能力来简化自然语言处理任务;

2023-09-08 10:46:43 858 1

原创 Excel自动化办公——Openpyxl的基本使用

个人感觉,相比Pandas,openpyxl对Excel的操作更为细致,Pandas则更适用于统计计算;

2023-08-18 23:38:04 1039 2

原创 TOOLS_Python获取音域范围

获取基频最值,对比标准音高序列,得到音域范围;基于librosa.pyin方法(

2023-06-13 18:51:11 244

原创 TOOLS_Python标记和保留非静音段的方法实现

1.将非静音段的起始时间输出;2.将其余非静音段合并导出;

2023-06-13 15:13:09 182

原创 Python 多线程、多进程、协程对迭代数据的耗时操作测试

Python 多线程、多进程、协程对迭代数据的耗时操作测试

2023-03-29 13:40:36 391 1

原创 Librosa基础使用

【代码】Librosa基础使用。

2023-03-21 15:12:35 2075

原创 2023-02-01 读书笔记:《有趣的统计》-3-测量世界

该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!75招学会数据分析 —— 2014 Doctor.Bruce Frey。

2023-03-12 21:29:23 400

原创 TOOLS_Pandas groupby 分组聚合常用方法使用示例

注意:下文仅是常用的一些示例,实际操作时可组合使用的方式要多得多!

2023-03-06 15:41:08 512

原创 2023-03-02 读书笔记:《有趣的统计》-2-发现相关性

75招学会数据分析 —— 2014 Doctor.Bruce Frey。

2023-03-02 15:29:40 476

原创 TOOLS_Seaborn相关性可视化分析示例

类似的问题,也可以用多元线性回归方程,在标准化权重之后,对比得出各个变量的影响;

2023-03-02 11:51:18 373

原创 2023-02-01 读书笔记:《有趣的统计》-1-基础知识

75招学会数据分析 —— 2014 Doctor.Bruce Frey。

2023-02-03 19:02:21 234

原创 2023-01-29 学习笔记:常见28种数据分析模型

参与者一般是指市场占有率介于5%~15%之间的企业,这些企业虽然不能对市场产生重大的影响,但是它们是市场竞争的有效参与者;对于数据分析师来说,在你的分析过程中可以使用,但是往往需要行业专家的指点,因为这些模型是弱数据支撑型,你没有行业和专业认知得出的结论难具说服力。SCP 框架的基本涵义是,市场结构决定企业在市场中的行为,而企业行为又决定市场运行在各个方面的经济绩效。RFM模型,衡量用户价值和创利能力,该模型通过一个客户的近期购买行为R、购买的总体频率F和花了多少钱M三项指标来描述该客户的价值;

2023-01-31 18:28:27 1737

原创 SQL实用功能手册

SQL结构化查询语言,是一种访问和处理数据库的计算机语言。

2022-11-18 14:38:58 913

原创 TOOLS_Pandas根据日期列进行分组统计及绘图的使用示例

导入所需要的库。

2022-11-10 15:07:27 1245

原创 计算机基础内容——网络基础

一般的路由器:1个接外网,剩下的4个接内网;可以通过交换机扩展更多的内网接口;可以用交换机来扩展交换机(交换机的层数不宜过多);主力交换机通常被用于扩展;以前没有光线入户的时候一般是通过电话线上网,代替光猫的是”猫“,即调制解调器;用以将电话的模拟信号转换为数字型号;”猫“的另一头就可以直接接网线,与之相连的可以是各种终端,电脑、路由器等;电话线的宽带是6M;现在都是千兆网(与之匹配使用千兆光猫);现在的光猫,也具有路由器的功能;

2022-10-31 18:22:06 459

原创 Python异步编程——asyncio、协程

Python asyncio高性能异步编程。

2022-09-19 15:24:05 1238

原创 数据分析——基础环境和工具

本学习笔记内容来源于网络视频课,多为拼凑内容,但也很实用;涵盖了职业分析、Excel、的常规使用,仅为数据分析入门要求,如果想深入了解,可自阅官方文档;

2022-07-28 16:17:21 401

原创 2022-07-12 读书笔记:《写给所有人的极简统计学》

一直想学习一下数理统计的基础内容,查了下有人推荐了这本书,希望仔细阅读后能有所收获;能够理解并表达出通过统计学运算得出的结论,是一项有用的能力;理解和学习统计学需要一定的数据基础知识;统计数学是必须掌握的数学能力;本书涵盖了学习统计学所需的初中阶基础数学知识,主要目标是为了读者理解,练习题也有必要做做;本书还介绍了这些数学知识在统计学中的应用范围与具体方法;总结来说,通过阅读本书,可以学习到 对收集的数据加以分析的统计方法,以及 从部分数据中推算出整体情况的推测统计的入门知识;统计就是将收集到的数据(数值)

2022-07-12 14:04:24 941

原创 Pytorch实践

Pytorch官网在线文档Torch 意义上类似于TensorFlow中的Tensor,可以看做是能在GPU中计算的矩阵;熟悉numpy的也可以理解为ndarray的GPU版;使用该深度学习框架后,我们所需要做的就是设计任务流程,设计网络框架;CPU版本:pip install torch1.3.0+cpu torchvision0.4.1+cpu -f https://download.pytorch.org/whl/torch_stable.htmlGPU版本:pip install torch1.3.

2022-07-06 14:36:10 3147

原创 2022-06-01 学习笔记:MySQL基础入门及设计解析

MySQL基础使用 及 设计优化

2022-06-01 22:10:12 262

原创 数据分析——Python内容学习【1】

数据分析——Python内容学习【1】该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!简介2022最新版Python数据分析小白教程编程环境基础库:Python3NumpypandasmatplotlibSciPy.org:许多计算方法sklearn:许多建模模型seabornKeras:神经网络数据分析概述利用统计分析方法 提取有用信息 总结与概括;用户行为分析、用户画像、商品画像、商品推荐、市场分析“数据是未来的核心,未来数据量是区

2022-04-12 15:33:51 398

原创 PostgreSQL实用示例

PostgreSQL实用示例参考PostgreSQL参考pass-- 创建表CREATE TABLE "bd_peak_index_song_feature_lib" ( "id" int8 NOT NULL, "features_l" decimal[] NOT NULL, CONSTRAINT "bd_peak_index_song_feature_lib_pkey" PRIMARY KEY ("id"));-- 插入数据INSERT INTO bd_peak_index

2022-03-22 11:50:20 490

原创 2022-02-08 读书笔记:《精通特征工程》1 基础特征工程

《精通特征工程》——速读学习1 基础特征工程该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!time: 2022-02-08学习目标:“通过Python示例掌握特征工程基本原则和实际应用,增强机器学习算法效果”;目录第1章 机器学习流程:数值 模型 特征第2章 简单而奇妙的数值:数值型数据的基础特征工程,过滤 分箱 缩放 对数变换和幂次变换,以及交互特征第3章 文本数据:扁平化、过滤和分块:自然文本特征工程,研究词袋 n-gram 短语检测技术第4章 特征缩放

2022-03-17 11:05:42 686 1

原创 “定点打击”——XPath 使用细则(Just For Selenium WebDriver)(md重制版)

“定点打击”——XPath 使用细则(Just For Selenium WebDriver)(md重制版)该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!Selenium WebDriver中有关元素定位的学习,需要XPath的支持,特此梳理;前言XPath是一门在XML文档中查找信息的语言;XPath可用来在XML文档中对元素和属性进行遍历;(是W3C XSLT标准的主要元素);对XPath的理解是很多高级XML应用的基础;XPath2.0内置函数主要内容目录:

2022-02-24 11:48:11 225

原创 《机器学习》理论——速读学习3 进阶知识

《机器学习》理论——速读学习3 进阶知识该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!time: 2022-01-12学习目标:我需要了解神经网络除了工程化部分之外的更多内容,以便于在实际有效数据中可以获得抽象模型的能力;第11章 特征选择与稀疏学习第12章 计算学习理论第13章 半监督学习第14章 概率图模型(无笔记)第15章 规则学习(无笔记)第16章 强化学习(无笔记)第11章 特征选择与稀疏学习11.1 子集搜索与评价对于一个学习任务来说,

2022-01-13 16:06:58 511

原创 《机器学习》理论——速读学习2 常用方法(3)

《机器学习》理论——速读学习2 常用方法(3)该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!time: 2021-12-24学习目标:我需要了解神经网络除了工程化部分之外的更多内容,以便于在实际有效数据中可以获得抽象模型的能力;第9章 聚类第10章 降维与度量学习第9章 聚类9.1 聚类任务无监督学习中,训练样本的标记信息未知,目标是通过对无标记训练样本的学习来揭示数据内在的性质及规律,为进一步数据分析做基础;此类问题研究最多的就包括“聚类(cluster

2022-01-12 16:24:51 590

原创 《机器学习》理论——速读学习2 常用方法(2)

《机器学习》理论——速读学习2 常用方法(2)该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!time: 2021-12-21学习目标:我需要了解神经网络除了工程化部分之外的更多内容,以便于在实际有效数据中可以获得抽象模型的能力;第6章 支持向量机第7章 贝叶斯分类器第8章 集成学习第6章 支持向量机6.1 间隔与支持向量给定训练样本集,分类学习是在样本空间中找到一个划分超平面,将不同类分开;但是这样的划分超平面可能有多个,寻找的话,直观上应该找所有划分超

2021-12-24 11:46:28 683

原创 《机器学习》理论——速读学习2 常用方法(1)

《机器学习》理论——速读学习2 常用方法(1)该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!time: 2021-12-09学习目标:我需要了解神经网络除了工程化部分之外的更多内容,以便于在实际有效数据中可以获得抽象模型的能力;第4章 决策树第5章 神经网络第4章 决策树4.1决策树(decision tree),也称判定树(学习方法or学习得到的树),是一种常见的机器学习方法;以一个二分类问题为例,可以看做是对“当前样本属于正类吗?”这个问题的决策或判

2021-12-21 17:36:54 887

原创 日常Linux操作命令使用手册

OS查看操作系统:cat /etc/issueGPU查看GPU 利用率:nvidia-smi文件和空间查看linux文件目录的大小和文件夹包含的文件数查看磁盘使用情况:df -h统计总数大小 du -sh xmldb/ du -sm * | sort -n //统计当前目录大小 并按大小 排序 du -sk * | sort -n du -sk * | grep guojf //看一个人的大小 du -m | cut -d "/" -f

2021-12-20 16:10:07 2778

原创 《机器学习》理论——速读学习1 基础知识

《机器学习》理论——速读学习1 基础知识该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动!Time: 2021-12-05学习目标:我需要了解神经网络除了工程化部分之外的更多内容,以便于在实际有效数据中可以获得抽象模型的能力;目录清华-周志华 2016年出版的,从时间上看,算是比较古老的一本书;从目录上看,内容涵盖了模型设计和评估设计的主要算法,应该比学习视频中所能学习到的更加深入和深刻;也包含了神经网络、特征工程的内容,监督学习、半监督学习、强化学习等内容也有讲

2021-12-09 18:39:17 987

原创 2021-12-02 学习笔记:Python魔术方法

Python魔术方法2021-11-30 学习内容整理魔术方法:以两个下划线开头、两个下划线结尾的方法,常见的如__init__;魔术方法会在类或对象的某些事件发生后自动执行,如果希望在这些事件节点定制化一些特殊功能,可以对这些方法进行重写;python中常见的魔术方法:构造与初始化类的表示访问控制比较操作容器类操作可调用对象序列化构造与初始化__init__方法可以定义一个对象的初始化操作;实际在实例化一个类的时候,还有一个__new__的方法会被调用;在对象生命周

2021-12-02 18:41:58 812

原创 2021-10-22 学习笔记:和弦对照信息表

和弦对照信息表2021-10-13以自然C大调音阶举例(查了好久,总结的表,能理解的话,对和弦也就够用了,欢迎指正)十二平均律音阶CDb(C#)DEb(D#)EFF#(Gb)GAb(G#)ABb(A#)BC音阶频率261.626277.183293.665311.127329.629349.228369.994391.995415.305440.000466.164493.883523.251十二平均律音名小二度大二

2021-10-22 16:57:18 2415

原创 2021-10-22 学习笔记:FastAPI基础使用指南

2021-10-22 学习笔记:FastAPI基础使用指南已经第三针疫苗了,祝所有人平安!简单使用路径参数查询参数请求体查询参数和字符串校验路径参数和数值校验请求体参数请求体 —— 多个参数请求体 —— 字段请求体 —— 嵌套模型模式额外信息数据类型Cookie参数Header参数响应模型其他模型响应状态码常用的http状态码表单数据上传文件处理错误覆盖默认异常处理器路径参数配置jsonable_encoderPydantic 的

2021-10-22 16:34:22 1932 1

Sound exChange Doc

Sound exChange Doc

2023-09-06

Transformer应用实践(补充)

紧接着学习之后的一小部分内容梳理;

2023-06-09

Transformer应用实践(学习篇)

将B站作为一个学习软件的简单实践,将某培训机构的关于Transformer实战的教程,对照实操,对Transformer有了更清晰的认识(最终的训练评估代码执行报错,未能解决,略有遗憾),将学习过程整理成册备阅;

2023-06-09

Crypto——哈希函数和各种加密算法

下文主要是JS的实现及使用案例,JS实现可以方便的被Java、Python等进行调用;如果正在使用Pyhton,可以直接使用`pycrypto`库(配合python自带的`base64`一起使用);

2022-09-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除