- 博客(513)
- 资源 (28)
- 收藏
- 关注
原创 #define 和 #include 的工作方式,作用域和穿透力
因为编译和预处理的单位都是一个c语言源文件,先逐条递归刷#include,所以 #define 会随着#include而进入到 c源文件c.c中,然后再从上到下逐条刷#define。b.h 中 #include “a.h”c.h 中 #include "b.h"c.c 中 #include “c.h”那么, c.c 中可以使用宏 M 么?a.h 中 #define M 3。
2024-04-16 12:36:07 247
原创 cmake -S<sourceCodeDir> -B<buildDir> --check-build-system ... 示例与作用
projectx项目的源码文件夹:/home/jim/projectx构建目录为: /home/jim/projectx/build完整示例:cmake -S/home/jim/projectx -B/home/jim/projectx/build --check-build-system CMakeFiles/Makefile.cmake 0cmake:调用CMake命令行工具。-S /home/jim/projectx:使用-S选项指定源目录的路径。这是项目的源代码所在的目录,通常包含一个CMakeL
2024-04-15 14:45:49 430
原创 Mamba 论文翻译
当下,给大多数令人兴奋的深度学习方面的应用赋能的基础模型,几乎普遍是基于Transformer 架构和其核心的注意力模块。很多次二次时间复杂度的架构,例如,那些线性注意力、门控卷积和循环模型,还有结构状态空间模型(SSM),已经被开发用来处理长序列上 Transformer 的计算低效问题,但在处理重要的形态问题上,例如语言处理,这些模型的性能都不如 注意力模型那么优秀。我们找到了这类模型的一个重要的缺陷,它们在基于内容的推理上是很无能的,我们这对于此做了几个改进。
2024-04-15 10:33:13 189
原创 源码安装 clr - hip runtime
git clone --recursive https://github.com/ROCm/HIP.gitcd HIP/git checkout rocm-6.0.2pwdexport HIP_COMMON_DIR=${PWD}cd ../git clone --recursive https://github.com/ROCm-Developer-Tools/clr.gitcd clr/git checkout rocm-6.0.2mkdir build_dcd build_d/cma
2024-04-14 18:04:54 190
原创 教程备忘 一文搞定 cmake 全部技巧之 app 和 lib 的 cmake 系统
文件:hello.cpp add_impl.cpp sub_impl.cpp CMakeLists.txthello.cpp。
2024-04-14 12:58:32 238
原创 mamba 模型对 gpgpu 体系结构提出的新挑战
这个模型虽然还没有跟Transformer 一样大行其道,但做为潜在的竞争者,mamba也表现不俗;虽然深度学习领域不一定会广泛采用mamba架构,但做一个预防性的 gpgpu 架构挑战调研还是有必要。主要回答的问题,当前的 gpgpu 架构是否足以应付 mamba;如果希望做成一些硬件架构上的应对,那么应该对 gpgpu 微架构哪些升级呢。
2024-04-13 15:32:53 274 1
原创 warp 上的 Jacobi 旋转法计算 Hermitian 矩阵特征值和特征向量的 cuda 实现
Jacobi旋转的 cuComplex数据类型上的实现。
2024-04-11 12:27:16 172
原创 移植 amd blas 到 cuda 生态
如果是在conda环境中,需要deactive conda 环境;不带Tensile的编译。未完待续... ...
2024-04-11 11:20:02 194
原创 CPU 的 Vector ISA extension 可以充当 CUDA warp 的 VALU 么
2, risc-v 的 vector ISA extension。1, x86_64 的 AVX 指令。3, cuda warp 程序。
2024-04-11 01:08:07 105
原创 计算 Hermitian 矩阵的特征值和特征向量 cusolver 示例 DnCheevj
计算Hermitian 矩阵的特征值,使用Jacobi 旋转法,每次调整两个对称元素为0,通过迭代,使得非对角线上的值总体越来越趋近于0.示例扩展了 nv 的 cusolverDsyevj 的示例由于特征向量是正交的,故V*V^c = E,以此作为正确性的验证准则。
2024-04-08 16:14:17 210
原创 LLM 的下一站 Mamba,取代 Transformer,虽然在争议
虽然业界大佬对Mamba有点争议,但是直觉而言,Mamba会取代 Transformer 成为LLM的基础模型算法。
2024-04-03 01:05:45 184
原创 开源 riscv 的一些实现和资料链接
1,hardware design2,an implement3, book4, 蜂鸟开源5,内容比较丰富6,7,design a sim for riscv8,9,collectionwhat?
2024-04-02 01:10:38 662
原创 编译 amd gpu 核心态驱动 rocm kmd linux kernel
AMD 开源了专门的 ROCm 的kmd Linux Kernel,
2024-03-31 19:03:41 425
原创 AMD hipcc 生成各个gpu 微架构汇编语言代码的方法示例
为了简化逻辑,故假设 vector 的 size 与运行配置的thread个熟正好一样多,比如都是512之类的.
2024-03-30 18:24:39 403
原创 clang-query 的编译安装与使用示例
作用:检查一个程序源码的抽象语法树,测试 AST 匹配器;帮助检查哪些 AST 节点与指定的 AST 匹配器相匹配;
2024-03-23 19:26:44 317
原创 Toy 语言到 LLVM IR 实现源码注释
本运行测试是在llvm-18环境测试,更低的版本也没问题,指示如前所述,更改一句源码为dump()即可。对从程序源代码到AST的转换部分做了注释。
2024-03-13 20:23:03 217
原创 LLVM-3.5 —— 01记,编译 LLVM 3.5.0 clang and clang-query
包括编译:clang clang-tools-extra。
2024-03-11 18:52:58 476
原创 记录一个编译的LLVM 含clang 和 PTX 来支持 HIPIFY 的构建配置
【代码】记录一个编译的全套LLVM 含 PTX 支持 HIPIFY 的构建配置。
2024-03-07 18:23:22 273
原创 gdb 调试 llvm 源代码,以 llvm AST 抽象语法树 clang_visitChildren 为例
Makefile:与上一篇的Makefile相似。遍历ast,寻找函数名,并打印。
2024-03-05 13:10:38 258
原创 一些 LLVM 教程和文档链接
基于LLVM 3.0:Documentation for the LLVM System at SVN headLLVM 作为库的使用方法:Using The LLVM LibrariesLLVM C++ 的编程规范:LLVM Coding Standards
2024-03-02 18:23:33 203
原创 ubuntu22.04 成功编译llvm和clang 3.4.0,及 bitcode 函数名示例,备忘
make -j#会出错,找不到clang/Config/config.h。有三四个这样的文件,将其中的clang/Config/config.h。llvm/Config/config.h即可。
2024-03-01 19:39:26 443
原创 clang llc llvm-link llvm-config 应用示例
另一种,先生成字节码,再链接字节码,然后将链接成功的 字节码文件生成为 obj文件,最后将obj文件链接成可执行程序。
2024-03-01 12:44:46 325
bash-shell matrix-computations llvm-cook loader-linker sparse-ma
2024-01-23
Linux kernel 高并发开发
2024-01-14
mpi学习教程等-都志辉-配合下文https环境搭建
2023-12-29
代数多重网格理论资料 AMG AMGX原理
2023-09-28
opencl 学习资源pdf and source code
2023-05-22
常用数值算法集C语言与 Numerical Methods Using Matlab 4th Ed Mathews
2023-04-12
比利时的 鲁汶大学 计算机系教授 Philip Dutré 的全局光照教程,和他与合作者在 2002年 SIGGRAPH ppt
2022-09-17
LLVM IR MLIR: Scaling Compiler Infrastructure for Domain Specifi
2022-05-06
SSA_LLVMCookBook_DirectMethodSparseLinearSystem
2022-05-05
llvm_cookb_LLVM_IR骨架语法领进门资料.7z
2021-04-25
带几何解释的线性代数讲义
2020-12-02
英中双语版_flex与bison_pdf.7z
2020-11-03
FIRRTL_spec_2020Oct_EditionPDF.7z
2020-10-19
chisel官方教程20201010版本.7z
2020-10-11
Digital Design With Chisel_20201010edition.7z
2020-10-11
Downloads.zip
2020-07-21
bootia32.efi
2018-04-07
python27_d.lib python27_d.dll python27_d.pdb
2017-09-13
tbb2017_20170226oss_win.zip
2017-03-22
NS基础与安装---NS2 是一款开放源代码的网络仿真软件
2008-11-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人