Joejwu-CSDN博客

原创拉扎维模拟CMOS集成电路设计西交张鸿老师课程P10~13视频学习记录

但是在一些先进工艺，或者高速的IO电路中，确实可能存在速度饱和的问题，此时就需要采用更长的L等措施；为了获得经过的复制电流值，将消耗更大的输出电压范围，如下，一个阈值电压500-700mv，太大了；之前说过的，一山不容二虎，此时需要迁就电流小的，所以M4就没法提供Id4想要的大电流；还提到一点，就是薄氧管和厚氧管，一般数字的选择前者，模拟的选择后者；大信号，分析输出范围，希望在该共模电平下，所有管子都在饱和区；所以还是那个问题，Id4想增加，Id2想减小；共模波动，CMRR，共模抑制比；

2023-10-29 14:01:57 772

原创拉扎维模拟CMOS集成电路设计西交张鸿老师课程P6~9视频学习记录

利用叠加法计算完之后，可以发现，小信号其实可以只加在差动对的一边，而另一边保持不变，此时增益减半？Vp点电压并非是理想的保持不变，而是会出现微小波动，原因如左上角的图中所示；Id与Vgs的曲线是个抛物线，所以相同的电压变化，带来的电流变化是不一样的，所以自然存在一定的电压波动；左下角的图中绿色的线，就是Vp的电压变化情况，其频率翻倍；因此可以通过这个结构与特点来做倍频器；

2023-10-29 13:31:03 416

原创拉扎维模拟CMOS集成电路设计西交张鸿老师课程P2~5视频学习记录

但是如果是nmos，则如果是deep nwell，则可以继续连接源，如果不是，则此时还是连接到地，但这时候就存在衬偏效应；在一开始，我们主要关注的是放大器的三个特性，即DC的摆幅，小信号的增益，输入、输出阻抗；如果是电流型放大器，此时需要的是输入阻抗为0，输出阻抗为无穷大；这种结构的CS放大器，和负载为电流源的放大器类似，都是高增益的；无穷大的驱动能力（在电压型放大器中，就需要的输出阻抗为0）；此时电流的公式与BJT的Ice类似，都是指数率的关系；上面还有亚阈值区的三个特点，噪声大，速度慢，低功耗；

2023-10-29 13:10:07 473

原创概念解释（2）

1. **Dummy Fill：** 在芯片制造过程中，由于不同的电路层在尺寸上可能会有差异，因此可能会导致在某些区域出现过多的空白。是的，除了在集成电路版图中可能会使用 "dummy AA" 之外，还可能使用其他类型的 dummy 结构，以帮助解决制造和设计方面的问题。它主要用于芯片和封装之间的连接和信号分配，允许将芯片上的引脚重新分布到封装的不同区域，以适应不同封装形式和尺寸。SPF 文件中的寄生参数是基于电路布局和版图抽取的结果进行提取的，它们描述了元件之间的相互作用和电磁耦合。

2023-08-31 00:09:10 1119

原创概念解释（1）

Poly电阻是指在集成电路制造中使用的多晶硅（poly-Si）材料形成的电阻器。多晶硅是一种形态介于单晶硅和非晶硅之间的硅材料，它具有较高的电阻性能，因此可以用来制作电阻器。多晶硅通常用于制造尺寸较大、电阻值较高的电阻元件，而不是用于微小尺寸、低电阻值的电阻。在集成电路制造过程中，多晶硅被沉积或者掩膜形成在硅衬底或其他层上。然后，使用光刻和腐蚀等工艺步骤来定义和形成多晶硅区域，从而形成电阻器。多晶硅具有一些特性，包括：1. 高电阻性：多晶硅的电阻值相对较高，适用于高电阻值的电阻器。

2023-08-31 00:06:51 383

原创电路分析基础学习(上)第7章

二阶电路是指由电容、电感和电阻等元件组成的电路，其中涉及到了二阶微分方程的描述。二阶电路可以描述电流和电压随时间的变化规律，特别是在交流电路中具有重要的应用。典型的二阶电路包括RLC电路，它由电感（L）、电容（C）和电阻（R）组成。在RLC电路中，电感和电容会导致电流和电压的二阶导数出现，因此二阶微分方程是描述该电路行为的数学模型。二阶电路的微分方程可以通过基尔霍夫定律和元件的特性方程来推导。

2023-07-11 21:48:14 1331

原创电路分析基础学习(上)第6章

一阶常系数微分方程是指形式为dy/dx + ay = b的微分方程，其中a和b是常数。一阶常系数微分方程是一种常见的微分方程类型，它描述了一个变量y关于自变量x的变化率与y本身之间的关系。这种微分方程的一阶表示了一个线性关系，其中包含常数项和一阶导数。用一阶微分方程来描述的电路称为一阶电路；一阶电路是指电路中仅包含一个电感器（电感元件）或一个电容器（电容元件）的电路。它是电路理论中的基础部分，用于描述电流和电压随时间变化的关系。一阶电路的行为可以通过微分方程来描述。

2023-07-11 12:45:07 1200

原创电路分析基础学习(上)第5章

电容是电路中的一种被用于存储电荷和电能的被动元件。它由两个导体之间的电介质（通常是绝缘材料）分隔开来，形成一个电场。当在电容器的两个导体之间施加电压时，电场会在电介质中产生，并导致电容器储存电荷。电容的单位是法拉（Farad），常用的子单位有微法（μF）、纳法（nF）和皮法（pF）。电容器的电容值表示了电容器存储电荷的能力。较大的电容值意味着电容器可以存储更多的电荷，较小的电容值意味着电容器只能存储较少的电荷。电容器的电容值可以通过以下公式计算：C = Q/V。

2023-07-10 16:25:19 262

原创电路分析基础学习(上)第4章

李瀚荪版电分第二版。

2023-07-08 20:14:23 621

原创电路分析基础学习(上)第3章

李瀚荪版电分第二版基础概念在书中均有详细解释，因此此处仅记录在第3章学习过程中的一些疑惑之处-----------------------------------------------------------------------------------------------------------------------------版。

2023-07-06 19:48:45 583

原创电路分析基础学习(上)第2章

NPN型晶体管由N-P-N型的结构组成，电流流动方向从发射极到集电极；而PNP型晶体管由P-N-P型的结构组成，电流流动方向从集电极到发射极。为什么在这些偏置的情况下，晶体管呈现出这样的工作状态呢？

2023-07-05 01:54:55 349

原创深度神经网络知识蒸馏算法基础理论

鉴于此，在本文后续的研究中，所选择的学生模型均为剪枝后的模型，而教师模型则为该剪枝模型在未剪枝情况下的完整模型。同时，如之前博客中知识蒸馏算法的相关研究现状一节中所述，目前知识蒸馏方法主要分为了三类，即基于相应的、基于特征的以及基于关系的知识蒸馏三种，鉴于基于特征的蒸馏方法需要在网络模型中添加连接器，而基于关系的蒸馏方法则大多需要构建关系矩阵，应用在复杂的目标检测认识模型上时，计算冗余且耗时较长，鉴于此，后文相关研究中将选择基于响应的知识蒸馏方法。，以增强蒸馏损失的比重来加强蒸馏效果。

2023-07-03 20:58:24 389

原创深度神经网络剪枝算法基础理论

卷积核剪枝与Kernel剪枝也同样有联系，如前所述，卷积核剪枝首先会筛选出当前层中不同要的卷积核，随后剪枝，但需要注意到，该层的卷积核剪枝还会影响到下一层的卷积核中的Kernel，因为下一层卷积核的Kernel数是与上一层的输出通道数对应的，两者需要同时改变。在结构化剪枝方案中，根据评估指标来源所划分的两类剪枝方法，即参数驱动的与数据驱动的方法，鉴于数据驱动的剪枝方案多依赖于训练数据，并根据不同的输入数据计算对应的梯度或损失值等来作为评估依据，相较于参数驱动的方法往往存在更多的计算；

2023-07-03 20:55:41 496

原创深度神经网络量化算法基础理论

参考之前博客中的量化分级，本文将主要关注Level3的量化方法，即通过在训练过程中模拟量化，来尽可能地降低由量化带来的精度损失，其属于量化感知训练一类，本小节将介绍的即为量化感知训练方法的一些基础理论。最后从量化粒度的角度，可将量化分为逐通道量化与逐层量化，例如在卷积层中，同一层的每个卷积核(Filter)拥有独立的量化参数则为逐通道量化，若每个卷积核共享同一组量化参数，则为逐层量化。为便于理解，下面将通过[67][158]中的量化方案来阐述相关概念，其中非对称量化的计算如式2.6中所示。

2023-07-03 20:52:41 482

原创 YOLO v5目标检测模型

mAP的计算则是在某个设置的交并比阈值下，该数据集上所有类别的平均精度AP的平均值，例如常见的mAP50表示的是在交并比阈值设置为0.5时，所有类别平均精度的均值，而mAP50:95则表示的是交并比阈值从初值0.5开始，以0.05为步长增长到0.95的情况下，得到的10个mAP的均值。同理，40×40的特征图适用于检测中等大小的目标。Mosaic增强主要用来提高小目标的检测效果，在中，定义的小目标大小为低于32×32像素值的，中目标大小为低于96×96，高于32×32的，大目标为高于96×96的；

2023-07-03 20:41:39 2405

原创深度卷积神经网络基础理论

本文将介绍深度卷积神经网络中最常见的几种层（算子），分别包括全连接层、卷积层、BN层、池化层以及激活函数层，主要包括这些层在卷积网络中发挥的作用以及该算子的计算方式。

2023-07-03 20:07:16 292

原创模型压缩算法国内外研究现状综述

剪枝类型参考文章评估指标简介参数驱动[99][100][101][102]基于权值的L1/L2范数[103][104][105]基于BN层的γ参数[106][107]基于BN层的γ参数衍生的缩放因子[108]基于卷积核的谱聚类[109]基于卷积核的几何中位数[110]基于卷积核的相似度数据驱动[111]基于后一层的统计信息[112][113][114]基于激活值最小重构误差[115]基于剪枝前后特征图熵值大小[116]

2023-07-03 19:57:05 1398

原创目标检测算法国内外研究现状综述

结合图1.1可以看到，近20年来目标检测领域的技术路线主要可分为两个阶段，即以传统检测方法为主的第一阶段，以及基于深度学习的第二阶段。为了完整阐述目标检测技术路线的演变过程，下面将按照这两个阶段以及第二阶段中的分类情况顺序介绍相关算法的特点。需要注意的是，在本节中出现的mAP(mean Average Precision)，即平均精度，均为mAP50。图1.1 目标检测算法近20年来发展路线图。

2023-07-03 19:24:19 7664

原创电路分析基础学习(上)第1章

李瀚荪版电分第二版，基础概念在书中均有详细解释，因此此处仅记录在第1章学习过程中的一些疑惑之处

2023-07-03 18:50:32 583

原创 Transpose转置SRAM(TSRAM)论文阅读简记

1、A 0.62mW Ultra-Low-Power Convolutional-NeuralNetwork Face-Recognition Processor and a CIS Integrated with Always-On Haar-Like Face Detectorisscc2017下图即为TSRAM的具体结构，添加了一个解耦MOS管，其源端、漏断分别连接到图中所示的蓝色与红色线；与正常SRAM一样采用行读取模式时，这两根线分别为H_RDWL与H_RDBL;此时进行读取，则H

2022-04-07 12:36:13 837

原创 ISSCC2021 基于SRAM的存内计算16.3阅读记录

Note：因为只是笔者的阅读记录，所以内容组织上较为混乱！（如有错误，可评论指出！谢谢！）1、FoM指的是品质因子，Figure Of Merit一般来说，FOM值越大，性能就越高；本文中给出的计算公式FoM (IN-precision × W-precision × output-ratio × output-channel × EF/tAC)2、MACV即MAC value3、电容C = 电荷量Q/电压V；4、一个想法，结合SBCS部分的操作展开，这里为了得出每个

2021-11-12 11:18:10 1469

原创 2020ISSCC 基于SRAM的存内计算15.5阅读记录

Note：因为只是笔者的阅读记录，所以内容组织上较为混乱！1、2's complement此即二补数，是一种用二进制表示有号数的方法，也是一种将数字的正负号变号的方式，常在计算机科学中使用。在中国大陆地区通常称作补码。一个数字的二补数就是将该数字作位反相计算（即一补数），再将结果加 1，即为该数字的二补数。在二补数系统中，一个负数就是用其对应正数的二补数来表示。2、ppt图里面的MACV字母下面的12~20代表的意思是，在HMACRB模块输出的值的位宽，当输入激活值与权值都是4bit的

2021-11-12 11:13:04 1297

原创 yolov5s、yolov5nano结构图

yolov5s(上)yolov5nano（下）

2021-11-12 11:04:16 1257

原创 python if not

在python中None, False, 空字符串"", 0, 空列表[], 空字典{}, 空元组()都相当于False ，即：not None == not False == not '' == not 0 == not [] == not {} == not ()在python中not是逻辑判断词，用于布尔型True和False，not True为False，not False为True，以下是几个常用的not的用法：(1) not与逻辑判断句if连用，代表not后面的表达式为Fals..

2021-10-13 16:21:01 397

原创卷积神经网络通道剪枝算法小结

一、剪枝分类目前常见的模型剪枝算法主要分成两类，即非结构化剪枝与结构化剪枝；在不少的神经网络加速器中已经应用了这些剪枝算法，早期常见的是非结构化剪枝，例如MIT的韩松组的前几年的相关工作中就有此类应用，但是在设计中采用的特殊数据格式和额外的编码/解码会带来额外的硬件开销；这在基于传统系统架构的情况下，利用非结构化剪枝或者可以为NN模型的计算起到加速的作用，但是在存内计算架构下，基于ReRAM或SRAM这类紧耦合的电路结构中将很难去利用网络中存在的稀疏特征； ...

2021-10-10 15:58:33 6755 2

原创基于SRAM或ReRAM的存算一体化架构及其常见稀疏方案

存算一体化架构设计以各种传统工艺（如SRAM、NorFlash）或新型忆阻器工艺（如FeRAM、ReRAM、PCM和MRAM）制作器件构建存储阵列，将神经网络权值参数直接存储在阵列内部，并以模拟信号的形式并行执行大规模矩阵乘法。以典型的存算一体化硬件架构为例，向量以电压形式驱动阵列字线（行），利用电压乘以电导（按照DNN的权值对忆阻器阻值进行编程）等于电流，并且电流在位线（列）自然汇聚相加的电流定律，一次读操作即可完成向量与矩阵的乘加操作。这种方法不但提高了矩阵乘法的并行度，而且避免了反...

2021-10-10 14:59:57 1840

原创浮点运算量FLOPs与算力单位FLOPS

概念FLOPS：注意全大写，是floating point operations per second的缩写，意指每秒浮点运算次数，理解为计算速度。是一个衡量硬件性能的指标。FLOPs：注意s小写，是floating point operations的缩写（s表复数），意指浮点运算数，理解为计算量。可以用来衡量算法/模型的复杂度。单位换算1 MFLOPs(mega) = 10^6 FLOPs，即：100万次浮点运算1 GFLOPs(giga) = 10^9 FLOPs，即：10亿次

2021-09-20 10:56:26 14904 1

原创 YoloX_s网络模型

YoloX_s输出的网络结构如下：YOLOX( (backbone): YOLOPAFPN( (backbone): CSPDarknet( (stem): Focus( (conv): BaseConv( (conv): Conv2d(12, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False) (bn): BatchNorm2d(32, e

2021-09-08 16:07:02 2292

原创 YoloX的demo测试、训练、评估记录

1 准备工作1.1 clone官方仓库以下工作建立在已经掌握了使用anaconda搭建环境的基础上！然后克隆下来yolox的官方仓库，如下：git clone [email protected]:Megvii-BaseDetection/YOLOX.git 如果无法直接clone，也不用慌，直接下载就行了，和克隆下来一样，只不过后期官方更新了的话，需要自己重新下载更新就是了！1.2 搭建环境cd YOLOX pip3 instal...

2021-09-08 15:59:24 8555 20

原创查看Linux上挂载GPU的相关信息

Linux查看显卡信息：lspci | grep -i vga使用nvidia GPU可以：lspci | grep -i nvidiaLinux查看Nvidia显卡信息及使用情况Nvidia自带一个命令行工具可以查看显存的使用情况：nvidia-smi或者可以使用命令（可以自动实时刷新GPU的使用情况）：nvidia-smi -l如果要周期性地输出显卡的使用情况，可以用watch指令实现（命令行参数-n，后边跟的是执行命令的周期，以s为单位。所以下面的命令表示，

2021-08-24 16:40:12 999

原创基于Transformer的目标检测领域最新进展

本文为检索该领域文章后做的简单记录，没有模型结构的详细介绍，不过其中两三篇文章已是目前目标检测领域的SOTA（截止到21年8月）！a、End-to-End Object Detection with Transformers：最早将Transformer带入到目标检测领域的文章，名叫DeTR，在coco数据集上可以达到44.9的准确率，与Faster R-CNN相当；模型的主要结构是先用一个常见的CNN网络提取2D的特征，然后将输出的特征图展平，当作序列输入给Transfo...

2021-08-16 23:22:03 6384 3

转载深度学习中的动量momentum

训练网络时，通常先对网络的初始权值按照某种分布进行初始化，如：高斯分布。初始化权值操作对最终网络的性能影响比较大，合适的网络初始权值能够使得损失函数在训练过程中的收敛速度更快，从而获得更好的优化结果。但是按照某类分布随机初始化网络权值时，存在一些不确定因素，并不能保证每一次初始化操作都能使得网络的初始权值处在一个合适的状态。不恰当的初始权值可能使得网络的损失函数在训练过程中陷入局部最小值，达不到全局最优的状态。因此，如何消除这种不确定性，是训练深度网络是必须解决的一个问题...

2021-07-27 17:06:09 1008

转载深度学习：什么是端到端的训练或学习？

传统的图像识别问题往往通过分治法将其分解为预处理，特征提取和选择，分类器设计等若干步骤。分治法的动机是将图像识别的母问题分解为简单、可控且清晰的若干小的子问题。不过分步解决子问题时，尽管可以在子问题上得到最优解，但子问题上的最优解并不意味着就能得到全局问题的最后解。深度学习提供了一种端到端的学习范式，整个学习的流程并不进行人为的子问题划分，而是完全交给深度学习模型直接学习从原始数据到期望输出的映射。对深度模型而言，其输入数据是未经任何人为加工的原始样本形式，后续则是堆叠在输...

2021-07-24 15:21:48 597

转载 TOPS GOPS MOPS处理器算力单位

TOPS是Tera Operations Per Second的缩写，1TOPS代表处理器每秒钟可进行一万亿次（10^12）操作。与此对应的还有GOPS（Giga Operations Per Second），MOPS（Million Operation Per Second）算力单位。1GOPS代表处理器每秒钟可进行十亿次（10^9）操作，1MOPS代表处理器每秒钟可进行一百万次（10^6）操作。TOPS同GOPS与MOPS可以换算，都代表每秒钟能处理的次数，单位不同而已。在某些情况下，还

2021-07-21 19:36:29 421

原创什么是overlay？如何定制overlay？

---------------------------------------------------------------------------------------------------------------------------------什么是Overlay？PYNQ很重要的一个概念是overlay:Overlay,又称为硬件库，是用来扩展用户应用的可编程/可配置FPGA设计.Overlay能够用来加速软件应用或者为了某一特定应用定制化硬件平台...

2021-07-20 10:02:49 2479

原创 ZCU102上PYNQ镜像系统的移植

本文仅简单记录笔者镜像PYNQ系统的过程，其中会给出当时参考的相关文章或博客！NOTE：核心要点，按照网上大多教程，最后仅制作了boot.bin以及image.up两个启动文件

2021-06-18 18:09:37 1062

原创 ZCU102/104SD启动卡制作（分区、挂载等操作）

ZCU102通过SD卡启动，在CSDN上能下载的几个别人制作好的镜像，通过烧写工具烧到SD卡中后，板子仍然无法正常启动，后查询方知，可能因为板子批次的不同，导致之前版本的镜像系统与板子的不匹配，故需要...

2021-06-18 17:38:54 1516

原创 python中用matplotlib画出sigmoid、Tanh、Relu、Leaky Rule、ELU函数曲线图

import mathimport matplotlib.pyplot as pltimport numpy as npimport matplotlib as mplmpl.rcParams['axes.unicode_minus'] = Falsedef sigmoid(x): result = 1 / (1 + math.e ** (-x)) return resultdef tanh(x): # result = np.exp(x)-np.exp(-...

2021-06-18 17:13:05 3021

原创常用激活函数：Sigmoid、Tanh、Relu、Leaky Relu、ELU优缺点总结

1、激活函数的作用什么是激活函数？　　在神经网络中，输入经过权值加权计算并求和之后，需要经过一个函数的作用，这个函数就是激活函数（Activation Function）。激活函数的作用？　　首先我们需要知道，如果在神经网络中不引入激活函数，那么在该网络中，每一层的输出都是上一层输入的线性函数，无论最终的神经网络有多少层，输出都是输入的线性组合；其一般也只能应用于线性分类问题中，例如非常典型的多层感知机。若想在非线性的问题中继续发挥神经网络的优势，则此时就需要通过添加激活函数来对每一层的输出

2021-06-18 16:59:11 13985 1

ISSCC2020-Digest.pdf

Yolo相关论文.rar

zcu102镜像.txt

空空如也