自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(513)
  • 资源 (28)
  • 收藏
  • 关注

原创 动态链接库的符号表优化 及 gcc 标志的使用 -MF -MD -MP

Makefile。

2024-04-16 15:00:52 307

原创 #define 和 #include 的工作方式,作用域和穿透力

因为编译和预处理的单位都是一个c语言源文件,先逐条递归刷#include,所以 #define 会随着#include而进入到 c源文件c.c中,然后再从上到下逐条刷#define。b.h 中 #include “a.h”c.h 中 #include "b.h"c.c 中 #include “c.h”那么, c.c 中可以使用宏 M 么?a.h 中 #define M 3。

2024-04-16 12:36:07 247

原创 cmake -S<sourceCodeDir> -B<buildDir> --check-build-system ... 示例与作用

projectx项目的源码文件夹:/home/jim/projectx构建目录为: /home/jim/projectx/build完整示例:cmake -S/home/jim/projectx -B/home/jim/projectx/build --check-build-system CMakeFiles/Makefile.cmake 0cmake:调用CMake命令行工具。-S /home/jim/projectx:使用-S选项指定源目录的路径。这是项目的源代码所在的目录,通常包含一个CMakeL

2024-04-15 14:45:49 430

原创 Mamba 论文翻译

当下,给大多数令人兴奋的深度学习方面的应用赋能的基础模型,几乎普遍是基于Transformer 架构和其核心的注意力模块。很多次二次时间复杂度的架构,例如,那些线性注意力、门控卷积和循环模型,还有结构状态空间模型(SSM),已经被开发用来处理长序列上 Transformer 的计算低效问题,但在处理重要的形态问题上,例如语言处理,这些模型的性能都不如 注意力模型那么优秀。我们找到了这类模型的一个重要的缺陷,它们在基于内容的推理上是很无能的,我们这对于此做了几个改进。

2024-04-15 10:33:13 189

原创 源码安装 clr - hip runtime

git clone --recursive https://github.com/ROCm/HIP.gitcd HIP/git checkout rocm-6.0.2pwdexport HIP_COMMON_DIR=${PWD}cd ../git clone --recursive https://github.com/ROCm-Developer-Tools/clr.gitcd clr/git checkout rocm-6.0.2mkdir build_dcd build_d/cma

2024-04-14 18:04:54 190

原创 教程备忘 一文搞定 cmake 全部技巧之 app 和 lib 的 cmake 系统

文件:hello.cpp add_impl.cpp sub_impl.cpp CMakeLists.txthello.cpp。

2024-04-14 12:58:32 238

原创 mamba 模型对 gpgpu 体系结构提出的新挑战

这个模型虽然还没有跟Transformer 一样大行其道,但做为潜在的竞争者,mamba也表现不俗;虽然深度学习领域不一定会广泛采用mamba架构,但做一个预防性的 gpgpu 架构挑战调研还是有必要。主要回答的问题,当前的 gpgpu 架构是否足以应付 mamba;如果希望做成一些硬件架构上的应对,那么应该对 gpgpu 微架构哪些升级呢。

2024-04-13 15:32:53 274 1

原创 源码安装 AMD 的 gpu BLAS

安装 ROCm。

2024-04-12 13:25:28 243

原创 can not find libclang_rt.builtins-x86_64.a

make -j35。

2024-04-11 19:00:58 199

原创 warp 上的 Jacobi 旋转法计算 Hermitian 矩阵特征值和特征向量的 cuda 实现

Jacobi旋转的 cuComplex数据类型上的实现。

2024-04-11 12:27:16 172

原创 移植 amd blas 到 cuda 生态

如果是在conda环境中,需要deactive conda 环境;不带Tensile的编译。未完待续... ...

2024-04-11 11:20:02 194

原创 CPU 的 Vector ISA extension 可以充当 CUDA warp 的 VALU 么

2, risc-v 的 vector ISA extension。1, x86_64 的 AVX 指令。3, cuda warp 程序。

2024-04-11 01:08:07 105

原创 cuda / c/c++ 中返回一个浮点数的符号

大于等于0的正浮点数,返回 1.0f;小于0的负浮点数,返回 -1.0f;

2024-04-10 00:37:39 113

原创 AMD Tensile 简介与示例

按照知其然,再知其所以然的认知次序进行。

2024-04-09 01:00:06 470

原创 计算 Hermitian 矩阵的特征值和特征向量 cusolver 示例 DnCheevj

计算Hermitian 矩阵的特征值,使用Jacobi 旋转法,每次调整两个对称元素为0,通过迭代,使得非对角线上的值总体越来越趋近于0.示例扩展了 nv 的 cusolverDsyevj 的示例由于特征向量是正交的,故V*V^c = E,以此作为正确性的验证准则。

2024-04-08 16:14:17 210

原创 可以领课程证书的 open course

可以领 Havard 课程证书的 open course。

2024-04-04 17:04:23 106

原创 LLM 的下一站 Mamba,取代 Transformer,虽然在争议

虽然业界大佬对Mamba有点争议,但是直觉而言,Mamba会取代 Transformer 成为LLM的基础模型算法。

2024-04-03 01:05:45 184

原创 开源 riscv 的一些实现和资料链接

1,hardware design2,an implement3, book4, 蜂鸟开源5,内容比较丰富6,7,design a sim for riscv8,9,collectionwhat?

2024-04-02 01:10:38 662

原创 编译 amd gpu 核心态驱动 rocm kmd linux kernel

AMD 开源了专门的 ROCm 的kmd Linux Kernel,

2024-03-31 19:03:41 425

原创 编译amd 的 amdgpu 编译器

【代码】编译amd 的 amdgpu 编译器。

2024-03-30 21:27:25 400

原创 AMD hipcc 生成各个gpu 微架构汇编语言代码的方法示例

为了简化逻辑,故假设 vector 的 size 与运行配置的thread个熟正好一样多,比如都是512之类的.

2024-03-30 18:24:39 403

原创 一个 hipsolver 特征值示例

先起个头,未完待续....

2024-03-28 00:43:37 254

原创 等待 load data 指令完成的 wait 指令的实现原理

未完待续 ... ...起个头... ...

2024-03-25 11:55:27 222

原创 clang-query 的编译安装与使用示例

作用:检查一个程序源码的抽象语法树,测试 AST 匹配器;帮助检查哪些 AST 节点与指定的 AST 匹配器相匹配;

2024-03-23 19:26:44 317

原创 dlopen dlsym dlerror dlclose 示例

【代码】dlopen dlsym dlerror dlclose 示例。

2024-03-21 14:22:29 172

原创 编译安装 linux 6.6 依赖记录

将 .config 中的如下选项设置为空:

2024-03-19 01:21:56 300

原创 Toy 语言到 LLVM IR 实现源码注释

本运行测试是在llvm-18环境测试,更低的版本也没问题,指示如前所述,更改一句源码为dump()即可。对从程序源代码到AST的转换部分做了注释。

2024-03-13 20:23:03 217

原创 LLVM-3.5 —— 01记,编译 LLVM 3.5.0 clang and clang-query

包括编译:clang clang-tools-extra。

2024-03-11 18:52:58 476

原创 基于 llvm 3.5 的C++示例重构工具 IzzyRefactor 编译与测试

还未测试,存个档,未完待续。未完待续 ... ...

2024-03-09 20:45:40 375

原创 std::vector 的那些构造函数示例

【代码】std::vector 的那些构造函数示例。

2024-03-08 19:48:06 367

原创 记录一个编译的LLVM 含clang 和 PTX 来支持 HIPIFY 的构建配置

【代码】记录一个编译的全套LLVM 含 PTX 支持 HIPIFY 的构建配置。

2024-03-07 18:23:22 273

原创 手工将一个 llvm IR 汇编代码解析成为 bitcode 文件

sum.c。

2024-03-06 18:02:22 365

原创 llvm AST consumer 示例

Makefile。

2024-03-05 19:13:55 206

原创 gdb 调试 llvm 源代码,以 llvm AST 抽象语法树 clang_visitChildren 为例

Makefile:与上一篇的Makefile相似。遍历ast,寻找函数名,并打印。

2024-03-05 13:10:38 258

原创 LLVM clang_tokenize 的示例

如同上篇make -j32。

2024-03-04 15:40:39 322

原创 备忘 clang diagnostic 类的应用示例 ubuntu 22.04

系统的ncurses环境有些问题。

2024-03-04 14:09:01 515

原创 源码安装 ncurses6

加入计划安装在 /home/hanmeimei/ncur/local。如果计划安装在 非系统默认目录,可以自己配置。

2024-03-04 02:08:58 260

原创 一些 LLVM 教程和文档链接

基于LLVM 3.0:Documentation for the LLVM System at SVN headLLVM 作为库的使用方法:Using The LLVM LibrariesLLVM C++ 的编程规范:LLVM Coding Standards

2024-03-02 18:23:33 203

原创 ubuntu22.04 成功编译llvm和clang 3.4.0,及 bitcode 函数名示例,备忘

make -j#会出错,找不到clang/Config/config.h。有三四个这样的文件,将其中的clang/Config/config.h。llvm/Config/config.h即可。

2024-03-01 19:39:26 443

原创 clang llc llvm-link llvm-config 应用示例

另一种,先生成字节码,再链接字节码,然后将链接成功的 字节码文件生成为 obj文件,最后将obj文件链接成可执行程序。

2024-03-01 12:44:46 325

bash-shell matrix-computations llvm-cook loader-linker sparse-ma

bash_shell matrix_computations llvm_cook loader_linker sparse_matrix block_Jacobi_svd regular_expression

2024-01-23

llvm编译器cookbook 中英 SSAbook

llvm编译器cookbook 中英 SSAbook

2024-01-14

Linux kernel 高并发开发

深入理解并行编程V2.0 中英文,示例源码网址: example source code: https://github.com/paulmckrcu/perfbook/tree/master

2024-01-14

mpi学习教程等-都志辉-配合下文https环境搭建

使用openmpi搭建mpi环境 https://blog.csdn.net/eloudy/article/details/135293911 另含: 链接器与加载器 gpu优化

2023-12-29

实分析 I II 英文版 可结合中文纸质书一起阅读

实分析 I II 英文版 可结合中文纸质书一起阅读

2023-10-20

代数多重网格理论资料 AMG AMGX原理

代数多重网格理论与算法and its application AMG AMGX 多份中英文资料,全面系统地说明了 多重网格算法的原理和历史脉络等

2023-09-28

opencl 学习资源pdf and source code

opencl programming guide opencl programming by example and source code opencl 2.1 spec

2023-05-22

常用数值算法集C语言与 Numerical Methods Using Matlab 4th Ed Mathews

常用数值算法集C语言 源程序源码 与 Numerical Methods Using Matlab 4th Ed Mathews pdf英文版

2023-04-12

Realistic Ray tracing pdf and source codes

Realistic Ray tracing pdf and source codes

2022-09-17

比利时的 鲁汶大学 计算机系教授 Philip Dutré 的全局光照教程,和他与合作者在 2002年 SIGGRAPH ppt

比利时的 鲁汶大学 计算机系教授 Philip Dutré 的全局光照教程,和他与合作者在 2002年 SIGGRAPH ppt

2022-09-17

RoofLine 理论的出处、起因、理论和示例

RoofLine 理论的出处、起因、理论和示例

2022-05-09

LLVM IR MLIR: Scaling Compiler Infrastructure for Domain Specifi

LLVM Language Reference Manual 即 LLVM IR MLIR: Scaling Compiler Infrastructure for Domain Specifi

2022-05-06

SSA_LLVMCookBook_DirectMethodSparseLinearSystem

static single assignment book, LLVM Cook book, Direct method sparse linear system solver suite sparse theory

2022-05-05

并行计算稀疏线性系统求解

并行计算稀疏线性系统求解

2022-03-07

x264-164.tar.gz

x264 c语言源代码

2022-01-02

pexports-0.44.tar.gz

dll -> lib

2022-01-02

cuda_matrix_inverse.7z

计算逆矩阵并且验证计算结果,用cuda实现

2021-12-18

llvm_cookb_LLVM_IR骨架语法领进门资料.7z

llvm cook学习资料——LLVM IR语言核心概念入门 核心内容汇总,基本应用命令入门,先用再分析,然后才能进一步结合编译原理看llvm编译器clang的实现代码。

2021-04-25

automata theory language.7z

automata理论资料,内容详实,解决了编程语言的设计,编译器的开发,自然语言语言翻译理论,习题链接,

2021-04-24

带几何解释的线性代数讲义

带几何解释的线性代数讲义,讲解了解析几何以及线性代数工具下的几何定义,几何意义扩展线索下的代数定义,Euclidean Space,酉空间定义,正定矩阵的定义

2020-12-02

英中双语版_flex与bison_pdf.7z

Flex and bison are tools designed for writers of compilers and interpreters, although they are also useful for many applications that will interest noncompiler writers. Any application that looks for patterns in its input or has an input or command language is a good candidate for flex and bison.

2020-11-03

FIRRTL_spec_2020Oct_EditionPDF.7z

The ideas for FIRRTL (Flexible Intermediate Representation for RTL) originated from work on Chisel, a hardware description language (HDL) embedded in Scala used for writing highly-parameterized circuit design generators.

2020-10-19

chisel官方教程20201010版本.7z

资源许可证允许自由传播、修改,甚至是商业用途。 许可证网址: https://creativecommons.org/licenses/by-sa/4.0/ Share — copy and redistribute the material in any medium or format 因此可以放心自由使用

2020-10-11

Digital Design With Chisel_20201010edition.7z

资源许可证书:可以自由传播、改变、甚至是商业用途。 https://creativecommons.org/licenses/by-sa/4. Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) This is a human-readable summary of (and not a substitute for) the license. Disclaimer. You are free to: Share — copy and redistribute the material in any medium or format

2020-10-11

Downloads.zip

B3 和 B4 两个版本 WISHBONE System-on-Chip (SoC)Interconnection Architecturefor Portable IP Cores Brought to You By OpenCores

2020-07-21

Downloads.7z

SystemC from the Ground up (2nd edition) pdf and examples source code

2020-07-18

bootia32.efi

ubuntu遇到32位EFI UEFI。如果安装ubuntu时提醒找不到bootia32.efi,那么将此文件放入U盘的/EFI/BOOT/中。会发现其中只有**64.efi

2018-04-07

CImg 2.0.5_pre092517

cimg.h 这个头文件在里面,以前对这个lib不熟悉,由于CGAL的原因才用到的。

2017-09-28

libQGLViewer-2.6.3.zip

这个版本有些难找,所以挂在这里。请先尝试网络下载。用于cgal开发所用,其他版本的没有编译通过。cgal

2017-09-28

python27_d.lib python27_d.dll python27_d.pdb

从Python2.7.13源码 手工编译的 python27_d.lib python27_d.dll python27_d.pdb,vs2015 win10 64bit,因为vtk支持python的需要。本想免费,但至少要填1分。

2017-09-13

能通过一张照片(2D)得到3D的模型吗

能通过一张照片(2D)得到3D的模型吗

2017-06-30

tbb2017_20170226oss_win.zip

tbb2017年最新版64bit,分数怎么自动跳到了50分了呀,还需要手动改正过来。是为了给其他tbb资源一些机会么?那也挺好的,可以都积累一些分数,方便互相下载

2017-03-22

龙书DirectX9.0\3D游戏开发编程基础 源代码 d3dUtility.cpp

代码是全的,d3dUtility.cpp等全套书的所有c++源码

2016-11-22

NS基础与安装---NS2 是一款开放源代码的网络仿真软件

NS2 是一款开放源代码的网络仿真软件,最初由UC Berkeley 开发而成。他最初为了研 究大规模网络以及当前和未来的网络协议交互行为而开发。它为有线和无线网络上的TCP、 路由和多播等协议的仿真提供了强有力的支持。

2008-11-05

linux动态链接机制研究及应用

linux动态链接机制研究及应用 一篇科技论文,专注与linux内核机制

2008-11-04

这是面向对象数据库科技论文

现在流行的数据库管理系统产品主要都是基于关系模型的。但是,下面这些论文是关于面向对象数据库的。哈哈

2008-10-30

基于OODB技术的GIS空间查询和空间分析模型研究

科技论文,关于面向对象的数据库在地理信息系统中的应用。主要关于数据库技术。

2008-10-30

麒麟使用手册_国产LINUX操作系统

麒麟(kylin)是第一款国产操作系统,这里是它的使用手册内容介绍详尽,200多页的pdf

2007-06-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除