- 博客(13)
- 资源 (2)
- 收藏
- 关注
原创 一种不能进行gpu加速的折中方法
做了大概半个月的项目,发现给出的要求是即使优化到极致也是无法做到的,心累。 重新对项目做了评估讨论,倒是很像openMPI,是对一包包数据进行处理的。最后讨论的结果是使用多进程多核进行处理,经过一周的开发,发现在服务器端来做这种处理得到了十分良好的效果,只是会出现很长时间CPU占用率100%,内存也有明显的上升。于是对项目主控端加入了新的线程,对CPU使用率和内存进行检测来控
2016-08-15 23:27:21 541
原创 占位符
一晃又到了周末了,本打算每周都要写一写项目中的收获的,可这一周参加公司应届生培训了,没有什么收获,羞羞,所以拿这篇来占位了。算来接触的也就OpenMP了。就占位符了
2016-08-07 21:39:39 727
原创 CUDA规约前缀求和问题
CUDA规约前缀求和问题 前缀求和问题算是个比较常见的问题了,这周项目中遇到了个这样的问题,查找数组a中所有值为M的元素,用数组b将依次存储这些元素的下标。 这也算是比较经典的前缀求和的问题了。
2016-07-31 00:50:02 2894
原创 关于CUDA实现最值问题
一转眼一周就过去了,算来入职已经半个月了,项目也进行了十来天,感觉这一周受到最纠结的莫过于寻最值问题了。 听起来寻最值应该是个很简单的问题,当时的思路是这样的,并行规约寻最值,并记录下标,于是有了第一版的程序: __global__ void Max_Reduce(int *d_array, int array_len, int *max_value
2016-07-23 21:51:36 3720 2
原创 工作随笔1
毕业了,来到北京工作也有十天了(七月八号入职,今天七月十八号),整体感觉北京很大,随便走个地方就需要三四十分钟以上,北京也很小,没钱刚毕业的我们十四个人住在了一间套间宿舍(有一天我下床的时候不小心踩到了下铺兄弟的脑袋)。 好了,不说这些,记录些自己的工作收获吧。 这是我从事的第一份工作----软件工程师(GPU算法加速)。感觉人生就是这么奇怪,往往有心栽花花不发,无
2016-07-18 23:27:56 509
原创 STM32通过SIM800L向yeelink端上传数据
忙了一个多月,终于完成了一套系统的开发,笔者参与完成了SIM800L向yeelink端上传数据,以及Andriod客户端的开发,视频制作等。装置演示视频地址为:http://v.youku.com/v_show/id_XMTI2NTM5OTA2NA==.html另外我们还做了一套更小的板子,因为外观设计等问题,需要等待。好了,废话不多说,来说一说SIM800L上传数据到yeelin
2015-06-23 11:48:16 8150 2
原创 关于CUDA6.5中newdelete的解读
最近在检查自己项目中存在的问题,涉及到了new 和 delete 的问题,于是查找CUDA6.5中的simple,中间有关于newdelete的例子,我本想随意参考一下吧,没想到,这次参考倒是让我研究了整整一天多的时间 这里贴出部分代码:templateclass Vector : public Container {public: // Con
2015-04-28 21:37:04 1332
原创 关于CUDA操作中的原子问题
好久不写博客了,慢慢的感觉自己懒散好多,废话不说,看看关于原子操作吧 关于CUDA的书一本接着一本,算来看了好多本,在做CT重建中FDK,也算是有个结果了吧,不过后期优化还没有做,想看看关于CUDA的一些simple,那就从第一个开始吧,结果第一个是关于CUDA的动态并行的,也就是递归调用的,项目名字叫cdpSimplePrint,调试结果分析,发现原子操作的结果并不是自己以前认为的。
2015-04-02 11:40:02 2165
原创 S3c6410在RVDS2.2下裸机浮点问题
最近在使用S3c6410裸机的时候用到浮点型时候程序一直无结果输出,网上查了很久,说需要设置VFPv2;VFPEnable EQU (0x40000000) ;VFP使能设置;------------------------------------ ; 启用通过协处理器访问VFP控制寄存器;---------
2013-05-01 17:26:13 507
转载 关于ARM的22个常用概念
几年逛论坛,看到一篇这样的文章,觉得不错,适合新手了解,就粘过来了.1.ARM中一些常见英文缩写解释MSB:最高有效位;LSB:最低有效位;AHB:先进的高性能总线;VPB:连接片内外设功能的VLSI外设总线;EMC:外部存储器控制器;MAM:存储器加速模块;VIC:向量中断控制器;SPI:全双工串行接口;CAN:控制器局域网,一种串行通讯协议;PWM:
2013-04-15 17:00:49 482
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人