自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(197)
  • 资源 (3)
  • 收藏
  • 关注

原创 【Vit】Vision Transformer 入门与理解

注意上图中有些细节遗漏,全流程应该是:先把输入进行 patch_embedding 变成 visual tokens,然后和 class_token 合并,最后 position_embedding。看图就比较明白了,VIT只用了Encoder的部分,把每一个图片裁剪成若干子图,然后把一个子图flatten一下,当成nlp中的一个token处理。其实有了 Transformer 的基础后,直接看代码就知道VIT是怎么做的了。

2024-04-11 17:18:57 368

原创 【zotero】搭配onedrive同步设置

登陆后记得取消文件同步的两个勾勾,不然后期会很占用储存空间的。

2023-12-06 18:42:28 151

原创 【PPspliT】ppt转pdf-保留过渡动画

http://www.maxonthenet.altervista.org/ppsplit.php再次打开ppt,就能在上方的选项栏里头看到了:

2023-11-23 11:21:55 827

原创 【英语】标题首字母大小写规则

在阅读英文资料时,最常接触的英语标题大写方式有两种,一种是全部字母大写,另一种是部分单词首字母大写。如:THE TRUE COST OF BEING LAST IN LINE ——《哈佛商业评论》The Case of the Offensive Band Name (the本不应该大写,这里大写是因为首字母) ——《读者文摘》其中,前一种较少用,而后一种最为常用。为何?小站认为原因在于前一种多用于强调,而不太利于阅读。

2023-10-26 11:36:23 1652

原创 【md】使用大全

align可以是 left、center、right。

2023-10-14 01:51:34 101

原创 【matplotlib】降维 可视化

参见:sklearn.manifold。

2023-09-30 20:29:31 193

原创 【VSCode】自动生成Jupyter(ipynb)文件的目录

然后就出来咯~

2023-09-14 21:56:50 618 1

原创 【python】正则表达式

本文介绍正则表达式常用的用法。

2023-08-20 17:07:18 124

原创 【爬虫】Requests库的使用

这个库比我们上次说的 urllib 可是要牛逼一丢丢的。通过它我们可以用更少的代码,模拟浏览器操作。不多说,直接上手代码。

2023-08-18 00:34:00 1086

原创 【爬虫】Urllib让我们的 python 假装是浏览器

了解了 urllib 之后,我们就用 python 代码来模拟请求吧!

2023-08-16 01:05:33 726

原创 【pytorch】torch.nn.utils.rnn的pad_sequence、pack_padded_sequence、pad_packed_sequence、PackedSequence

nn.utils.rnn.PackedSequence是nn.utils.rnn.pack_padded_sequence的亲戚,两者输出的结果都一样,都是将序列进行pack,得到。第一个是PackedSequence对象,而标准RNN返回的是所有序列,每个位置的隐向量输出,形状是[batch_size,seq_len,hidden_size]。第二个一模一样,是RNN每一个序列的最后一个位置的隐向量输出,形状是[batch_size,hidden_size]。类型的变量,只是输入的参数不一样。

2023-07-04 23:57:18 611

原创 【pytorch】lstm基本用法&参数讲解

【代码】【lstm】基本用法&参数讲解。

2023-07-04 13:36:45 811

原创 【python】__init__.py 文件的作用

可以为空,也可以定义包的属性和方法,但其必须存在,其它程序才能从这个目录中导入相应的模块或函数。文件,那么它就变成了一个包(package)。可以看到,几乎每个文件夹下都有。,一个目录如果包含了。

2023-07-04 12:41:20 174

原创 【Langchain】GPT的高效插件

本文讲述了langchain的常用功能

2023-06-30 15:37:49 891

原创 【LLM】语言模型微调 fine-tune

本文讲了LLM微调

2023-06-26 10:32:33 704

原创 【NLP】常见的tokenize(分词)方式——Byte Pair Encoding (BPE)

参见:https://zhuanlan.zhihu.com/p/424631681

2023-06-17 21:13:58 882

原创 【GPT LLM】跟着论文学习gpt123

本文讲述了gpt模型的发展历程、原理和内部构造

2023-06-17 16:46:17 918

原创 【LLM GPT】李宏毅大型语言模型课程

gpt的讲解

2023-06-14 17:13:33 1524

原创 【Difussion Model】扩散模型的理解和编程实现

本文讲述了扩散模型的原理和代码实操。

2023-06-02 19:02:14 1510

原创 【pytorch】模型剪枝 model pruning

torch.nn.utils.prune 是pytorch用于修剪模型的工具包,其通过 修改将模型某一层的参数进行限定,然后再使用 prune.remove 函数进行修剪,一般来说,修剪参数值较小的参数,模型的性能也不会发生太大变化。但是要注意,本文介绍的都是非结构剪枝,就是哪些被裁剪为0的参数,在经过模型重新训练以后,会重新进行迭代更新,对于结构剪枝,使用本文的方法不适用,建议采用 github 上面的一些库来进行实现。

2023-04-09 21:56:38 641 1

原创 【迁移式的目标检测】一种通用目标检测算法

传统的物体检测算法受限于繁琐的人工标注,在开放世界中出现新类别后往往需要“从头来过”,即使只增加一个新类别,也要完整过一遍标注、训练、部署整个流程,严重限制了其通用性,这显然不“科学”。向大家介绍一篇今天新出的非常有意思的 CVPR 2023 的论文,相比于传统的目标检测算法,训练时标注了几个类别,就只能检测几个类别,这篇论文属于通用目标检测的范畴。3)为了应对训练中的新挑战,作者还提出了提出的解耦训练方式和概率校准,进一步提高了对新类别的泛化能力。(好吧,这个世界限制了UniDetector的发挥~)

2023-03-23 10:15:17 558

原创 【pytorch】self.register_buffer()的作用:定义为不可训练的模型参数

PyTorch中定义模型时,有时候会遇到 self.register_buffer(‘name’, Tensor)的操作,该方法的作用是定义一组参数,该组参数的特别之处在于:模型训练时不会更新(即调用 optimizer.step() 后该组参数不会变化,只可人为地改变它们的值),但是保存模型时,该组参数又作为模型参数不可或缺的一部分被保存。而 register_parameter() 和它是相反的功能。

2023-03-12 13:04:19 593

原创 【pytorch】nn.Embedding()

翻译过来的意思就是词嵌入,通俗来讲就是将文字转换为一串数字。因为数字是计算机更容易识别的一种表达形式。我们词嵌入的过程,就相当于是我们在给计算机制造出一本字典的过程。计算机可以通过这个字典来间接地识别文字。词嵌入向量的意思也可以理解成:词在神经网络中的向量表示。num_embeddings (python:int) – 词典的大小尺寸,比如总共出现5000个词,那就输入5000。此时index为(0-4999)

2023-03-11 16:03:56 514

原创 【transformer】入门与理解

本文介绍了transformer。

2023-03-06 22:41:01 456

原创 【github】生成免密token

在 git 某个项目时,登陆github账号后出现了一个问题:remote: Support for password authentication was removed on August 13, 2021.意思是不支持命令行的账号密码登录了,本文提供利用token的解决方案。

2023-03-05 13:53:59 689

原创 【pytorch】torch.clip() & torch.clamp() 数值裁剪

这两个函数用法一样,效果也一样。

2023-02-15 20:03:23 9170

原创 【python】time包的使用

Python 程序能用很多方式处理日期和时间,转换日期格式是一个常见的功能。Python 提供了一个 time 和 calendar 模块可以用于格式化日期和时间。时间间隔是以秒为单位的浮点小数。Python 的 time 模块下有很多函数可以转换常见日期格式。

2023-02-09 10:41:51 1038

原创 【python】json和字典的相互转换

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。

2023-02-09 10:23:28 9165

原创 【python】repr() 将对象转化为str格式;避免转义字符

以下是 repr() 方法的语法: object – 对象。返回一个对象的 string 格式。例如我有一个字典data,如果需要把其转化成str格式,可以用 输出str格式的字典:可以看到输出多了一个双引号,而且效果和一样。有时候我有一串字符串,里面包含形如 这样类似转义字符但是我本意不是转义字符,这时候用 就可以实现忽略转义字符的转化:

2023-02-09 10:04:16 1048

原创 【python】多线程的基本使用 _thread包

Python中使用线程有两种方式:函数或者用类来包装线程对象。调用 _thread 模块中的start_new_thread()函数来产生新线程。语法如下:function - 线程函数。args - 传递给线程函数的参数,他必须是个tuple类型。kwargs - 可选参数。

2023-02-09 09:39:31 610

原创 【Coursera】处理来自不同分布的数据集

两个数据集不是来自同一分布的,有着不同的数学期望、方差,这样会导致训练集效果很好,但是模型在测试集上的效果很差,这时候需要调整一下训练策略了。ps:这不同于过拟合,本文讲的原因在于训练集和测试集的分布不同。

2022-12-11 00:02:27 1394

原创 【pytorch】利用 model.children() 对模型进行拆解;提取复杂嵌套模型的某一层

可以看到,模型一共有三个大层,分别命为:‘avgpool’,‘features’,‘classifier’。而每一个大层里面又嵌套了很多小层(子层)。以往,我们只能够通过一个个引用来进行调用大层或者小层(子层),例如:也可以通过list()

2022-12-10 18:54:21 2189

原创 【测试】111111111111111111111111111111

11111111111111111111111111111111111111111111

2022-12-09 12:20:35 1337

原创 【python】os.system() & os.popen() 在 python 执行 cmd 指令

而是一个16位的数,它的高位才是返回码。使用os.system返回值是脚本的退出状态码,该方法在调用完shell脚本后,返回一个16位的二进制数,低位为杀死所调用脚本的信号号码,高位为脚本的退出状态码。os.system()返回值为256,十六位二进制数示为:00000001,00000000,高八位转成十进制为 1 对应 linux命令返回值 1。通过 os.popen() 返回的是 file read 的对象,对其进行读取 read() 的操作可以看到执行的输出。一般来说,返回 0 表示运行成功。

2022-12-09 12:18:31 10887

原创 【VSCode】配置 conda 创建的环境到 VSCode

conda 创建的虚拟环境在 spyder 上可以跑代码,但是到了 VSCode 就会报错。

2022-11-20 20:44:21 9211 2

原创 【VSCode】代码高亮的调整

默认在dark的背景下,代码选中后高亮的效果是浅浅的白色,那么如果我想实现如下效果该怎么操作呢?然后在搜索中输入:workbench.colorCustomizations。打开,并把以下代码插入。注意,颜色是可以选择的~

2022-11-11 21:51:29 14750 2

原创 【VSCode】关闭讨厌的语法检查、语法自动检查、代码错误自动提示、错误提示

刚下载完 VSCode 使用的过程中,会发现导出提示语法错误(但是明明是没错的),非常讨厌:为什么会这样呢?因为编辑器无法识别这是python文件,所以导致其出现乱报错的情况,解决办法如下:搜索language,选择python,然后选择“Jedi”:

2022-11-11 21:15:02 17733 4

原创 【pyinstaller】将py文件打包成可执行exe文件

将py文件打包成可执行exe文件。

2022-10-28 22:04:47 18259

原创 【python】进程的查看和结束

包括进程的打印和删除。

2022-10-28 20:49:04 18791

原创 【python】获取当前时间(年月日时分秒)

需要用到 time 包,这个包python自带,无需另外下载。想要哪个,就在字符串里输入哪个就行了,它会自动匹配的。

2022-10-28 10:31:49 23971

论文写作注意事项、总结和技巧

本文讲述了如何写出清晰、简洁、有条理的论文,以便读者能够更好地理解你的研究成果。

2023-03-22

中国计算机学会推荐国际学术会议和期刊目录-2019 (1).pdf

博客 https://blog.csdn.net/weixin_42468475/article/details/120261983 中的资源

2021-09-13

crime_dataset.zip

Crime数据集一共有128列数据,其中,处理后的features可以是99列,也可以是122列,label这一列为回归数据,为0到1的98个取值,可以根据需要改编成分类型数据集。加载该数据集的方法请参见:https://blog.csdn.net/weixin_42468475/article/details/108714940

2021-03-30

Exploiting Unintended Feature Leakage in Collaborative Learning.pdf

论文Exploiting Unintended Feature Leakage in Collaborative Learning

2020-04-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除