- 博客(10)
- 收藏
- 关注
原创 【笔记】mlir linalg dialect设计基本原理
高层图IR -> code gen中间的ir表达,用于硬件无关的高层优化。使用loop 或者Control flow来表达切分和融合,op具体的语义仍然一致保留。transformation的过程中,语义的正确性和性能提升解耦。第一次迭代保证语义正确,后序迭代提升性能时,只需要关心语义等价,且性能提升即可。和vector dialect结合,linalg作为structured op,表示操作对应内存里的数据,将操作和内存表达隔离。
2023-08-25 17:56:04 248
原创 并行程序设计导论课程笔记
B站硬核课程加州大学伯克利分校 CS 194 并行程序设计导论 Introduction to Parallel Programming。
2023-08-09 10:57:37 131
原创 TensorRT采坑api
文章目录TensorRT链接采坑 APInvinfer1::INetworkDefinitionaddReduce内存管理总结TensorRT链接官方API链接:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/采坑 APInvinfer1::INetworkDefinitionadd各种layer的文档写的真的是,一言难尽addReduce头文件和文档注释://! \param input The input tensor
2021-07-23 10:39:17 2194 1
原创 图片中字符级别的定位(论文阅读笔记)
WordSup: Exploiting Word Annotations for Character based Text Detection主要思想是,现存的字符级别的标定太少,引入弱监督来调整字符坐标的定位。 分为2大部分,character detector部分,得到的输出是字符对应的坐标。Text structure analysis部分,得到的是词的坐标(如果为词)。1 C...
2018-08-15 16:06:55 2865
原创 利用SWIG将c++编译成python可调用的包
利用SWIG将c++编译成python可调用的包基本操作可见官方指南:http://www.swig.org/Doc1.3/Python.html 下面主要为实际复杂点的情况(windows10):此文为官方指南的补充,需要配置swing、python27或36对应的VS文件内容huizi_loc.cpp 文件内容:typedef struct{ //此处想输出一个数组...
2018-07-31 15:44:34 857
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人