自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 【笔记】mlir linalg dialect设计基本原理

高层图IR -> code gen中间的ir表达,用于硬件无关的高层优化。使用loop 或者Control flow来表达切分和融合,op具体的语义仍然一致保留。transformation的过程中,语义的正确性和性能提升解耦。第一次迭代保证语义正确,后序迭代提升性能时,只需要关心语义等价,且性能提升即可。和vector dialect结合,linalg作为structured op,表示操作对应内存里的数据,将操作和内存表达隔离。

2023-08-25 17:56:04 248

原创 并行程序设计导论课程笔记

B站硬核课程加州大学伯克利分校 CS 194 并行程序设计导论 Introduction to Parallel Programming。

2023-08-09 10:57:37 131

原创 编译器设计笔记

编译器设计,课程笔记

2022-06-30 17:49:14 376 1

原创 MLIR Tutorials

MLIR Tutorial

2022-06-22 15:20:28 523

原创 MLIR toy笔记

MLIR 学习笔记

2022-06-07 17:56:15 407

原创 cublas cudnn优化笔记

cublas cudnn opt

2022-02-24 19:13:20 1197

原创 Effective C++ 读书笔记

effective c++ & more effective c++

2021-12-20 20:39:38 700

原创 TensorRT采坑api

文章目录TensorRT链接采坑 APInvinfer1::INetworkDefinitionaddReduce内存管理总结TensorRT链接官方API链接:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/采坑 APInvinfer1::INetworkDefinitionadd各种layer的文档写的真的是,一言难尽addReduce头文件和文档注释://! \param input The input tensor

2021-07-23 10:39:17 2194 1

原创 图片中字符级别的定位(论文阅读笔记)

WordSup: Exploiting Word Annotations for Character based Text Detection主要思想是,现存的字符级别的标定太少,引入弱监督来调整字符坐标的定位。 分为2大部分,character detector部分,得到的输出是字符对应的坐标。Text structure analysis部分,得到的是词的坐标(如果为词)。1 C...

2018-08-15 16:06:55 2865

原创 利用SWIG将c++编译成python可调用的包

利用SWIG将c++编译成python可调用的包基本操作可见官方指南:http://www.swig.org/Doc1.3/Python.html 下面主要为实际复杂点的情况(windows10):此文为官方指南的补充,需要配置swing、python27或36对应的VS文件内容huizi_loc.cpp 文件内容:typedef struct{ //此处想输出一个数组...

2018-07-31 15:44:34 857

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除