- 博客(15)
- 资源 (3)
- 收藏
- 关注
原创 端到端可变码率压缩算法 QVRF: A Quantization-error-aware Variable Rate Framework for Learned Image Compression
本文作者从一个朴素的思想出发,提出了一个简单有效的可变码率压缩算法QVRF。QVRF仅使用一个单变量实现量化误差的可控。QVRF只需要将现有的固定码率编码模型通过简单的代码修改并加以微调即可实现可变码率,该算法大大的减少了网络训练的成本,减少模型的体积,同时也有助于端到端图像/视频/点云等相关压缩方法的落地。
2023-05-05 20:10:55 457
原创 解决网络训练验证过程中显存增加的原因
最近在训练网络时发现网络训练了几个epoch之后就会出现OOM一开始以为是内存不够,后来才发现是在网络训练过程中,显存会不断的增加。针对以上的问题,查找资料总结了三种有用的方式训练过程过程中,保存参数加.item()原代码:def train_one_epoch( model, criterion, train_dataloader, optimizer, epoch, clip_max_norm): model.train() device = next(model
2021-11-13 13:49:06 5179 2
原创 python YUV420视频转图像帧
YUV420p视频转成多帧图像import osimport cv2import numpy as npfrom typing import Listdef YUVvideo2IMGs(file, savepath, height, width ): """ Convert the YUV video to RGB images and save the images at the target folder Args: file: input yuv f
2021-11-11 10:02:14 4848
原创 CVPR2021 8篇Image compression文章分析
这里整理了CVPR2021中8篇与图像压缩相关的文章,分析其创新点和工作量。How to Exploit the Transferability of Learned Image Compression toConventional Codecs针对问题: 卷积神经网络的计算量大,现有的codec计算量小,速度快。Codec结合gan对压缩后的图像做一个滤波处理从而用较低的编码成本获取获得纹理信息丰富的结果。Hybrid Codec 不可微,所以这里引入了一个surrogate codec从而提供
2021-08-20 16:51:35 2890
原创 Google compress 安装
对于使用深度学习进行图像压缩的同学来说google的compress是绕不过去的一个坎这里记录一下google compression的安装过程代码来源本篇中包含四篇文章的代码End-to-end optimized image compressionJoint autoregressive and hierarchical priors for learned imagecompressionChannel-wise autoregressive entropy models for le
2021-08-12 14:59:32 535
原创 range-coder使用
Range coder的原理Range coder的原理部分可以参考熵编码算法Range encoding工程原理和实现比特流原理参考Range Coder编码比特流本篇文章谈一谈range-coder的使用问题代码参考根据range coder的原理,我们在编码前需要提前知道编码数据的累计概率分布from range_coder import RangeEncoder, RangeDecoderfrom range_coder import prob_to_cum_freq, cum_fre
2021-07-22 21:01:58 1540 2
原创 基于pytorch的图像填充
最近遇到一个任务需要把原来832×624,624×832,624×624 的图像扩充为832×832的图像变为这个任务属于image inpainting 领域的一个任务,但本文这里使用了一个简单的卷积网络,实现目的,损失函数使用了MSE网络结构import torch.nn as nnimport torchvision.models as modelsclass LFpaddingNet(nn.Module): def __init__(self, input_size=128):
2021-06-24 11:33:42 815
原创 CompressAI基于pytorch框架的图像压缩使用
CompresssAI介绍CompressAI 是将四篇基于深度学习端到端图像压缩代码从tensorflow搬移到了pytorch上,提供了完整的实例代码和使用教程,具体可以看CompressAI的Github官方库,同时提供了与传统图像编码方式的对比。CompressAI对图像压缩领域的新手来说是一个比较好的入手方向。项目地址:CompressAI项目使用教程四篇端到端图像编码算法代码:《End-to-end Optimized Image Compression》《Variational I
2021-06-07 22:13:13 8362 19
原创 Tensorflow2.4环境配置
ubuntu 18.04 下 tensorflow 环境配置1. 显卡要求显卡计算能力要求 capability>3.5查询:https://developer.nvidia.com/zh-cn/cuda-gpus2.驱动程序驱动程序对应的cuda驱动>=CUDA Version 11.0,最好11.2通过nvidia-smi查看驱动版本,版本过低需要升级Cudatoolkit版本11.0,Cudnn 8.0Conda install cudatoolkit=11.0 c
2021-03-06 16:31:12 389
原创 Lytro Power Tool使用记录
1.下载下载Lytro Power Tool2.主要功能这个软件主要有两大功能(1) 通过安卓调试桥(ADB,Andorid debug bridge)来控制Illum的内部参数,例如焦距,曝光,颜色矫正矩阵,gama,白平衡,曝光模式,快门速度,孔径大小等参数,来达到控制拍摄参数的目的。具体可以参考例子1.但是,这个模块不建议做。原因有两点:(a) 不熟悉相机参数,自己设置效果还不如选择自动模式;(b)某些参数超过阈值,会对相机的操作系统和硬件造成永久损伤。建议:熟练了所有参数的范围和使用方法
2021-02-27 15:44:00 775
原创 安装Anaconda后不能安装和建立环境
使用Anaconda不能建立环境的问题主要问题:json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 41 (char 40)详细问题:无论是建立环境还是安装数据库均会出现以下情况:Collecting package metadata (current_repodata.json): failedTraceback (most recent call last):
2020-08-29 21:04:37 1667 3
原创 ILLUM 光场相机矫正
近期在使用Lytro公司的ILLUM相机拍摄近处物体时发现畸变很严重,已经到了肉眼可以看到明显畸变的地步。在接下来的过程中我将向大家展示如何对ILLUM相机进行相机畸变的修正以及所遇到的问题 第一步:按照LFToolbox中描述的那样,在对应的相机序列号下建立一个PlenCalSmallExample的文件夹,然后再PlenCalSmallExample文件夹下建立一个01文件夹(...
2019-11-27 12:52:30 603 1
原创 matlab实现透视变换
这篇博客讲讲透视变换的原理和实现,透视变换也叫投影变换,仿射变换是透视变换的特例。主要是透视变换能保持“直线性”,即原图像里面的直线,经透视变换后仍为直线。下面给出数学推导:透视变换矩阵变换公式为:其中透视变换矩阵:要移动的点,即源目标点为: 另外定点,即移动到的目标点为: 这是一个从二维空间变换到三维空间的...
2019-11-12 15:35:07 6917 18
转载 canon的matlab代码
网上大神代码 如下:fs = 44100; % sample ratedt = 1/fs;T16 = 0.125;t16 = [0:dt:T16];[temp k] = size(t16);%十六分之一拍内抽样点数t4 = linspace(0,4T16,4k);%四分分之一拍内抽样点数t8 = linspace(0,2T16,2k);%八分之一拍内抽样点数[temp i] = s...
2019-03-15 22:47:37 1511
Lytro_Power_Tools_Beta_1.0.1_User_Manual .pdf
2020-09-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人