- 博客(80)
- 资源 (11)
- 收藏
- 关注
原创 SUPERBIN技术周刊第10期
中南大学张昊:我非常期待基于AI的图像视频编码技术的创新;miloyip总结的游戏程序员学习路线;浅墨的游戏程序员学习笔记;图形学书单;使用OpenCV实现目标跟踪
2022-01-16 15:09:30 4326
原创 MIT 18.01 Single Variable Calculus(单变量微积分)课堂笔记【6】——近似和求最值
MIT18.01 单变量微积分课堂笔记。线性近似与二阶近似;求函数最大值最小值。
2022-01-09 15:13:45 1153
原创 SUPERBIN技术周刊第9期
DirectX 12发布新功能:视频硬件编码;AMF v1.4.23版本更新;1.3 技术干货 | 视频直播关键技术和趋势;如何在UE4中使用 AMD FSR 1.0;GPU性能分析工具Radeon GPU Profiler和GPUView;视频精修一帧要花2小时?美图影像研究院的AI只要5.3毫秒!
2021-12-26 12:00:38 2430
原创 Learning Spatio-Temporal Transformer for Visual Tracking——精读笔记
本篇精读笔记,对原文重要部分做了严格翻译,如摘要和总结。对正文部分做了提炼,对重点部分突出标注。对参考文献做了分类。本文内容较长,如果时间有限可以直接跳到感兴趣的小节阅读。
2021-12-08 19:40:32 1976
原创 SUPERBIN技术周刊第8期
本期内容概要:初识DirectML;DirectML 1.8 版本更新内容;视频大时代下基础架构的演进;Android直播开发之旅(2):深度解析H.264编码原理;Stylevision:基于 WebRTC、FFmpeg、Tensorflow 的实时风格变换;Distractor-aware Siamese Networks for Visual Object Tracking——论文精读;苹果AR头显明年登场!目标10亿部,搭Mac电脑级芯片
2021-12-05 13:04:10 300
原创 初识DirectML
DirectML是微软发布的一套基于DirectX12的机器学习底层推理API。本文对DirectML做了初步介绍,它的优点来源。和其他推理引擎WinML、ONNXRuntime、TensorRT也做了比较。
2021-12-04 22:30:36 11818
原创 Distractor-aware Siamese Networks for Visual Object Tracking——论文精读
近年来,Siamese网络以其均衡的精度和速度在视觉跟踪领域引起了巨大关注。但大多数Siamese跟踪方法所使用的特征只能区分前景和非语义背景。语义背景一直被认为是干扰因素,阻碍了Siamese跟踪器的鲁棒性。本文提出了一种基于干扰感知的Siamese网络,用于精确的长时跟踪。
2021-11-30 21:25:02 3075
原创 SUPERBIN技术周刊第7期
本期内容包括:数学中常数e的定义和解释;推荐GitHub上一个视频智能插帧论文集;整理了GTC2021游戏相关领域PPT;RealBasicVSR;ffmpeg做视频编辑;常用图像处理算法以及开发库;Debug构建和Release构建的区别。
2021-11-28 13:40:34 3659
原创 MIT 18.01 Single Variable Calculus(单变量微积分)课堂笔记【5】——指数与对数求导
指数求导公式的推导过程,以及对数微分法。
2021-11-23 20:46:48 949
原创 SUPERBIN技术周刊第6期
本期内容概览:算法竞赛入门经典第三章例题代码;用mpv实现多视频同步播放;pytorch模型导出成ONNX格式:支持多参数与动态输入;介绍一篇GTC2021演讲《3D Reconstruction for Game Development》;推荐音视频相关文章,《拥抱智能,AI视频编码技术的新探索》
2021-11-21 14:36:57 3944
原创 pytorch模型导出成ONNX格式:支持多参数与动态输入
pytorch格式的模型在部署之前一般需要做格式转换。本文介绍了如何将pytorch格式的模型导出到ONNX格式的模型,以及如何支持多参数的输入与动态输入。
2021-11-20 22:08:40 13732 6
原创 SUPERBIN技术周刊第5期
本期内容概要:单变量微积分课堂笔记4;一道算法题解POJ-2663;视频智能插帧论文RIFE精读笔记;GTC2021黄仁勋主题演讲;推荐几篇音视频干货技术文。
2021-11-14 14:53:58 2186
原创 MIT 18.01 Single Variable Calculus(单变量微积分)课堂笔记【4】——求导法则,隐函数微分和反函数求导
求导法则:加减乘除;链式法则;隐函数微分法;反函数求导;课堂笔记思维导图
2021-11-14 11:56:15 917
原创 RIFE: Real-Time Intermediate Flow Estimation for Video Frame Interpolation——精读笔记
RIFE是一种用于视频插帧(Video Frame Interpolation, VFI)的实时中间流估计算法(Real-time Intermediate Flow Estimation)。RIFE提出的IFNet神经网络可以由粗到精(coarse-to-fine)直接估算中间流,速度也更快。设计了一种特权蒸馏机制来训练中间流模型,可以大大提高性能。
2021-11-13 20:43:44 5728
原创 SUPERBIN技术周刊第4期
本期内容概览:微积分笔记极限和连续,求导四则运算和三角函数求导;算法竞赛书籍推荐;视频智能插帧初探;元宇宙概念想法;Windows平台动态链接库加载路径搜索机制详解。
2021-11-07 12:47:36 2305
原创 视频智能插帧:初探
本文简要介绍了从2017年到2021年的视频智能插帧领域的论文。视频智能插帧主要分为两大流派:基于核的方法和基于光流的方法,还有一些其他小众的方法,比如基于阶段的,或者直接合成的。还有一些有趣的工作是将视频插帧和超分、去糊等结合在一起。
2021-11-07 12:13:15 2820
原创 MIT 18.01 Single Variable Calculus(单变量微积分)课堂笔记【3】——求导四则运算和三角函数求导
求导四则运算和三角函数求导本接重点讲解了两个三角函数求导公式的证明:f′(sin(x))=cos(x)f'(\sin(x)) = \cos(x) f′(sin(x))=cos(x)f′(cos(x))=−sin(x)f'(\cos(x)) = -\sin (x)f′(cos(x))=−sin(x)其中用到了两个辅助证明的公式:limΔx→0cosΔx−1Δx=0\lim_{\Delta{x} \rightarrow 0}\frac{\cos \Delta{x} - 1}{
2021-11-06 13:47:50 262
原创 MIT 18.01 Single Variable Calculus(单变量微积分)课堂笔记【2】——极限和连续
导数物理解释接上节极限和连续课程地址MIT OpenCourse讲义视频
2021-11-02 22:53:38 261
原创 SUPERBIN技术周刊第3期
软件开发编译googletest的坑CMake编译出错,遇到找不到MSbuild.exe的问题。解决办法是找到MSBuild.exe的路径,加入环境变量中。git push不上去的坑先设置代理:在C:/user/user_name/.gitconfig文件中添加代理:[http]proxy = socks5://127.0.0.1:1080[https]proxy = socks5://127.0.0.1:1080然后在push的时候又遇到输入账号密码时报错:remote: Supp
2021-10-31 10:42:09 1079
原创 MIT 18.01 Single Variable Calculus(单变量微积分)课堂笔记【1】——导数,斜率,速度和变化率
1. 什么是导数?1.1 导数的几何解释导数是切线的斜率。1.2 导数的物理解释脑图
2021-10-30 16:30:44 552
原创 Video Frame Interpolation via Adaptive Convolution——基于自适应卷积的视频插帧【笔记】
关键词Video Frame InterpolationFrame InterpolationVideo InterpolationVideo Frame Interpolation via Adaptive Convolution视频插帧一般包括两步:运动估计(motion estimation)和像素合成(pixel synthesis)。本文将这两步合成为一步。用卷积核同时捕捉到输入帧之间的局部运动以及像素合成的参数。我们的方法使用了一个深度全卷积神经网络(deep fully conv
2021-10-26 19:49:03 1187
原创 SUPREBIN技术周刊——第2期
本技术周刊是以周为单位作为里程碑,记录一个程序员视角下的所见,所学,所想。兴趣领域包括:数学,算法,图形,图像,音视频,AI,游戏,软件开发技术,操作系统,开源,以及生活杂记等。“不积跬步,无以至千里;不积小流,无以成江海。”希望与君共勉。读书分享一下这本《COM技术内幕》的读书笔记。我觉得用思维导图的方式展示,可以快速的抓住这本书的重点,不必拘泥于个别看不懂的细节。等日后需要用到某个知识点的时候,再回头仔细去看。这本书写的中规中距吧,难度上篇简单,适合刚入门的时候读。...
2021-10-24 11:41:36 176
原创 龙芯多媒体技术生态从平台优化实践说起——公开课笔记
思维导图在线版https://www.xmind.net/m/tD5FxH原版https://github.com/jb2020-super/supermind.git文本版
2021-10-24 11:21:35 2150
原创 COM技术内幕——思维导图
COM技术内幕第1章 组件1.1 使用组件的优点1.1.1 应用程序定制一个应用程序可以由多个组件组成,而一个组件可以被多个应用程序使用1.1.2 组件库基础的组件可以放入组件库,在需要使用的时候拿过来用很方便1.1.3 分布式组件组件可以放在远程主机上调用1.2 对组件的需求1.2.1 动态链接可以在运行时改变组件1.2.2 信息封装组件将内部的实现方法和细节封装,用户通过接口调用语言无关组件可以被多种语言调用版本
2021-10-23 21:39:02 187 4
原创 SUPERBIN技术周刊——第一期
本技术周刊是以周为单位作为里程碑,记录一个程序员视角下的所见,所学,所想。兴趣领域包括:数学,算法,图形,图像,音视频,AI,游戏,软件开发技术,操作系统,开源,以及生活杂记等。“不积跬步,无以至千里;不积小流,无以成江海。”希望与君共勉。数学程序员的数学——傅里叶变换作为音视频开发程序员,编解码的原理是必须了解的。而编解码原理中,傅里叶变换(Fourier Transform)是一个必学的数学知识。当然,网上可以搜索到的讲傅里叶变换的文章已经非常多,专门的书籍也有很多。而本文总结搜集了众多网上相关资
2021-10-17 10:42:58 1568
原创 程序员的数学——傅里叶变换
作为音视频开发程序员,编解码的原理是必须了解的。而编解码原理中,傅里叶变换(Fourier Transform)是一个必学的数学知识。当然,网上可以搜索到的讲傅里叶变换的文章已经非常多,专门的书籍也有很多。而本文,主要总结搜集了众多网上相关资源,筛选出了其中质量较高的作为以后学习的参考
2021-10-16 15:53:24 603
原创 关于创办个人技术周刊的想法
今天真的是比较神奇的一天。自从公司取消了中午午休,90%的下午我都会打瞌睡。真叫做:“中午不睡,下午崩溃”。但是出奇的是,今天下午精神确异常的好。早上在看一篇很难的论文,简直看不下去,一头雾水。而下午确居然看下去了。在边翻译边看的情况下,居然看了一大半。而此刻,头脑延续了下午的清醒。居然产生了想办个人技术周刊的想法。仔细想想为什么会萌生这种想法,也就不足为奇了。关于技术周刊,我之前一直有关注音视频技术周刊,质量相当好,也学到了很多音视频相关的知识和资讯。非技术类的,我几年前刚接触理财的时候关注了银行螺丝
2021-10-15 21:02:23 126
原创 集成显卡被独立显卡屏蔽解决办法
问题最近刚配的一台新电脑遇到了一个问题。在装上3090显卡之后,系统无法识别到Intel的集成显卡。主板型号是微星 Z590-A PRO(MS-7D09)。不管是在设备管理器的显示适配器中,还是在任务管理器的性能页面中,都无法看到Intel的集成显卡。而将3090独立显卡拆掉之后,就又可以识别出来了。解决方法重启电脑,按Del键进入BOIS。依次进入Settings -> Advanced -> Integrated Graphics Configuration。将 IGD Multi-M
2021-06-03 17:30:54 18747
原创 MediaFoundation系列——AMD卡AVC编码器问题
问题描述在使用基于MediaFoundation框架的转码时,会遇到当使用AMD的AVC硬件编码器时,输出的结果会有很严重的马赛克和画面闪烁。解决方法在配置AMD的AVC硬件编码器属性时,需要额外设置最大宏块处理速度(MF_VIDEO_MAX_MB_PER_SEC)这个参数。这个参数可以通过查询编码器的参数得到。怎么实现创建SinkWriter;在IMFSinkWriter::SetInputMediaType调用之后,调用 IMFSinkWriter::GetServiceForStream
2021-01-30 10:54:56 858 3
原创 SRCNN中的PSNR计算问题
最近用pytorch训练了一个SRCNN模型,然后在跟原始论文(Learning a Deep Convolutional Network for Image Super-Resolution)中的数据比较的时候,发现差别很大。比如说使用Set5数据集中的baby这张图片,使用Bicubic先缩小两倍,然后再放大两倍,论文里面得到的PSNR是37.07 dB。这跟我用python版本实现得出来的结果差别很大。我使用torchvision.transforms中的Resize方法只得到了35.7453 d
2020-12-29 20:49:05 1338
原创 SRCNN笔记二
1. 综述原文:Image Super-Resolution Using Deep Convolutional Networks这一篇与更早之前的另一篇很相似(Learning a Deep Convolutional Network for Image Super-Resolution)。不同之处是,本篇增加了以下几个重点:在非线性映射层(non-linear mapping layer)引入更大的filter尺寸,并探索增加层数。同时处理三个颜色通道, YCbCr或RGB。通过实验证明比单通道
2020-12-25 18:04:11 324
GTC-2021.7z
2021-11-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人