自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

DigBug的专栏

All you need is an ARCHITECT

  • 博客(47)
  • 资源 (1)
  • 收藏
  • 关注

原创 异构并行

 1. 异构体系结构计算机体系结构的发展在追逐摩尔定律的过程中在慢慢演进。并行与异构的并行,是今后体系结构发展的未来。1.1 并行-计算机体系结构的变迁并行,是人们在直觉上对计算机性能的一种改进措施。无论是从最底层面的指令集层并行,还是到高层的设备层面并行,这些措施早在几十年前已经被科学家广泛关注和研究,并在近十年获得高速发展。CPU行业:片上并行是近几年发展的潮流。如In

2009-04-27 16:34:00 4342

原创 众核技术报告会归来

来自Intel的消息:特邀讲者:吴甘沙 高级主任研究员 英特尔中国研究中心编程系统实验室演讲题目:Intel众核体系结构Larrabee以及数据并行编程模型CtLarabee:Larabee是Intel第一款Many Core处理器,目标是TFLOPS。讲演人并没有明确说明Larabee的目的,从wikipedia来看,Larabee被归类为GPU;但讲演人说明每个核心都可

2009-04-27 16:33:00 3197

原创 OpenCL,我看行

不是每个程序员都关心并行计算,也难怪,这个世界充斥着大量不可并行的01,这苦了HPC的程序员,如果你的公司很忧伤的裁了你,你会像我这样很忧伤的学Java么? 说Cell B.E死了这句话不知道对不对,最起码IBM裁了这个部门,人们纷纷跑去做L2 support或者有幸去做pNext去了。一直不太明白IBM为什么把Cell B.E死死的焊在blade上,而不是像Mercury那样做成PCIe

2009-03-23 22:59:00 3582 3

转载 zz, trends with the support by Nation in Telecom fields

  发改委批准46个项目纳入新一代宽带网络专项 .moduleSingleImg01 img{border:1px solid #D1E3F4} -->  新浪科技讯 11月21日消息,国家发改委公告批示同意46个项目纳入新一代宽带及网络通信产业化专项,这些技术均面向2020年未来技术的预研,大部分项目与当前的3G建设并无直接关联。  今年2

2008-11-21 18:08:00 2166

原创 解决Outlook运行慢的问题

"C:/Program Files/Microsoft Office/OFFICE11/OUTLOOK.EXE"  /noextensions /recycle ,即加参数noextensions。如果加/safe可启动安全模式,但Reading Pane会不能自动加载,有点不爽。应该是扩展的问题,造成浏览缓慢。

2008-04-20 11:00:00 6970

原创 VM, TLB及hugetlbfs

VM是计算机体系结构中非常重要的一部分。其中涉及CPU、操作系统等。除了一些嵌入式和某些Cray公司的CPU,现代CPU几乎全部使用了VM的概念。在CPU内部,与之相对应的两个部件分别为MMU和TLB。本文介绍VM,TLB及Linux系统中常会用到的hugetlbfs。下面首先介绍何谓VM。众所周知,计算机的存储由register, cache, memory和disk形成hiberarchy

2007-05-11 14:06:00 3825

原创 What is SWIG

SWIG is a software development tool that connects programs written in C and C++ with a variety of high-level programming languages. SWIG is used with different types of languages including common scri

2007-03-26 14:14:00 1038

原创 查看rpm包内容

 rpm2cpio | cpio --list -i

2007-03-19 18:07:00 3369

原创 Google Ad

google_ad_client = "pub-4532376899019933";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";google_ad_channel = "";//-->  src="http://pagead2.goo

2007-03-18 01:59:00 1340

转载 Cell体系结构及其实现

  第1页:引言      Cell Broadband Engine(以下简称为Cell BE)处理器是对Cell Broadband Engine Architecture(以下简称为CBEA)的首次尝试应用,Cell BE是由索尼、东芝、IBM联合开发的,除了主要运用于索尼的下一代PS3游

2007-03-15 22:17:00 6733

转载 硬件基础-cpu篇

BGA(Ball Grid Array,球状矩阵排列)  CMOS: Complementary Metal Oxide Semiconductor,互补金属氧化物半导体  CISC(Complex Instruction Set Computing,复杂指令集计算机)  COB(Cache on board,板上集成缓存)  COD(Cache on Die,芯片内集成缓存)  CPGA(Cer

2007-03-02 13:01:00 3725

转载 IBM Unlocks the Cell

IBM Unlocks the CellLast week, the DOEs National Nuclear Security Administration selected IBM to design and build the worlds first supercomputer that will use both Cell Broadband Engine (Cell BE

2007-03-01 17:18:00 1691

转载 IBM将向Cell处理器开放源软件库

Cell处理器的三家开发商IBM、东芝和索尼准备公布完整的Cell芯片规范和软件库,希望以此来聚集Cell处理器开放源代码社区的人气。索尼的Playstation 3(PS3)就采用了Cell处理器。这三家合作伙伴都希望这一多内核芯片能不仅仅应用于索尼自己的系统,而且还能应用到从HDTV到超级计算机的多种应用。  IBM设计团队的负责人表示,目前IBM还不打算在其自己的系统中采用基于Cel

2007-03-01 00:54:00 1927 1

转载 解读多核心Cell处理器:游戏主导发展方向?

一、引言  过去两个星期中发生了几件非常有趣的事情: 由于Intel在关于它们的多核心微处理器构架的将来计划上变得比以前更公开了,Intel的Spring IDF 2005变成了一个多核心CPU的节日。Intel的计划中有10款以上的多核心CPU设计,而它们在IDF上解释得很清楚了。 在GDC 2005上,AGEIA宣布它们已经开发了一个物

2007-03-01 00:03:00 6490

转载 揭开次世代处理器革新风暴前奏——Cell处理器

从纸面变成现实——历时五年的研发计划2000年年中,日本索尼、东芝以及美国IBM开始探讨下一代游戏机处理器的构想,并于秋季达成了共识。次年3月,这三大巨头宣布正式启动位于美国得州奥斯汀的联合开发实验室——STI Design Center(位于IBM奥斯汀实验室ARL的三楼),一个新的Power PC联盟——STI(SONY,Toshiba,IBM)正式诞生。这个实验室研究的项目进展似乎非常顺

2007-02-28 17:29:00 6128

转载 CPU cache

A CPU cache is a cache used by the central processing unit of a computer to reduce the average time to access memory. The cache is a smaller, faster memory which stores copies of the data from the mos

2007-02-28 14:22:00 3621

转载 CPU 的Cache 和Latency

CPU 速度的进展,一直比记忆体的速度进展要来得快。在 IBM PC XT 的时代,CPU 和记忆体的速度是差不多的。不过,后来 CPU 的速度就愈来愈快。再加上 DRAM 需要 refresh 才能保存资料的特性,DRAM 很快就跟不上 CPU 的速度了。现在的 CPU 都利用了 pipeline 的方式,可以每个 cycle 都 issue 一个(甚至多个)指令,再加上现在的 CPU 时脉也比

2007-02-28 14:20:00 5814

原创 Tag, Tag group and Tag mask in Cell BE

Tag用来标识一次DMA操作。每次DMA操作都会有一个tag。相同tag的DMA操作形成一个tag group。而tag mask用来判断该group(无论该group存在多个还是一个DMA操作)是否操作完成。对于一次DMA操作而言,存在一个上限16KB,因此对于超过16KB的连续内存读取必须使用多次DMA操作(即:mfc_get中的大小参数不能超过16K)。在这种情况下,Tag group便

2007-02-28 12:59:00 1632

转载 使用truss、strace或ltrace诊断软件的"疑难杂症"

本文通过三个实际案例演示如何使用truss、strace和ltrace这三个常用的调试工具来快速诊断软件的"疑难杂症"。简介进程无法启动,软件运行速度突然变慢,程序的"Segment Fault"等等都是让ÿ个Unix系统用户头痛的问题,本文通过三个实际案例演示如何使用truss、strace和ltrace这三个常用的调试工具来快速诊断软件的"疑难杂症"。truss和strace用来

2007-02-26 01:50:00 1126

转载 心目中的编程高手

(1)MIT BBS上说微软电话面试的一道题就是“Who do you think is the best coder,and why?”。我觉得挺有意思的,也来凑个热闹。排名不分先后。Bill Joy, 前任Sun的首席科学家,当年在Berkeley时主持开发了最早版本的BSD。他还是vi和csh的作者。当然,Csh Programming Considered Harmful 是另一个

2007-02-07 13:29:00 924

转载 [ZT] 源代码就是设计

    这是一篇Jack Reecves在1992年写就的檄文,今日重读,联想到最近正在研读的《应用MDA》和《产生式编程》等书,感触颇深。我们以前从传统软工思想中接受的很多思想,其实看待问题的角度都过于狭隘了。其实软件开发和人类几千年来的一直发展着的工程技术并没有本质区别,自以为自成一体不过是我们井中望月罢了。GoF从建筑业引入一个模式的概念就掀起如此大的影响,谁知到还有多少他们已经熟悉但我们不

2007-02-07 13:26:00 1258

原创 如何实现128字节对齐的数据结构

在很多机器上,比如Cell,要求数据结构必须128位对齐。这就对数据结构的定义提出了额外的要求。一种较直观的方法是:在数据结构中添加pad字节,使得整个数据结构填充为128位,例如:typedef struct _alf_error_msg{    int error_code;    int error_type;    int extra_error_code;    int error_ha

2007-01-26 15:54:00 3867 3

原创 c语言,打印百分号

如何打印百分号?下面是例子程序printf("The percent is %%%d/n",i);如果i是50,则输出The percent is  %50。即:两个连续的百分号,打印出一个百分号。第三个百分号才再次作为输入输出的参数。

2007-01-26 14:55:00 19038 2

转载 几个重要的RedHat Linux内核文件介绍

在网络中,不少服务器采用的是Linux系统。为了进一步提高服务器的性能,可能需要根据特定的硬件及需求重新编译Linux内核。编译Linux内核,需要根据规定的步骤进行,编译内核过程中涉及到几个重要的文件。比如对于RedHat Linux,在/boot目录下有一些与Linux内核有关的文件,进入/boot执行:ls –l,如图所示。编译过RedHat Linux内核的人对其中的System.map

2007-01-26 14:24:00 2179

转载 和luster学习在Linux创建库函数

Linux下创建库函数      By luster      [email protected]      2001-8-16      1. 介绍      使用GNU的工具我们如何在Linux下创建自己的程序函数库?一个“程序函数库”简单的说就是一个文件包含了一些编译好的代码和数据,这些编译好的代码和数据可以在事后供其他的程序使用。程序函数库可以使整个程序更加模块化,更容易重新编译

2007-01-26 09:55:00 907

转载 long long data type in GCC and what's the meaning of 1LL

ISO C99 supports data types for integers that are at least 64 bits wide, and as an extension GCC supports them in C89 mode and in C++. Simply write long long int for a signed integer, or unsigned long

2007-01-25 15:47:00 1069

转载 乱序执行的简单概念

乱序执行技术为了进一步提高处理速度, Pentium Pro等最新推出的高档微处理器采用了一种乱序执行技术来支持其超标量、超流水线设计。所谓乱序执行技术就是允许指令按照不同于程序中指定的顺序发送给执行部件的一套方法,通过把不能立刻执行的指令搁置在一边而把能立刻执行的后续指令提前处理,可以避免拖延处理器的运行,缩短程序的执行时间。每执行完一条指令时,剩下的指令又重新组合为适当的序列。乱序执行技术必须

2007-01-25 14:47:00 3554

转载 关于CPU流水线详解...高主频≠高性能

为什么Intel处理器主频这么高,而AMD处理器主频都很低?是不是AMD处理器性能不如Intel?我们一般的回答都是,因为Intel处理器与AMD处理器内部构架不同,所以导致了这种情况,还有一种具体一点的回答就是因为Intel处理器流水线长,那到底流水线与CPU主频具体有什么关系呢?今天给大家带来一篇我以前刊登在《电脑报》硬件板块技术大讲堂版面的一篇原创文章。(由于坛子的一些限制,导致文章中图片的

2007-01-25 14:43:00 6605 1

转载 Linux "processor affinity" explained

IBMs DeveloperWorks has published an article describing how the Linux 2.6 kernel supports "processor affinity" -- that is, ensuring that a particular process runs on a particular processor or set of

2007-01-24 23:27:00 1270

转载 关于affinity mask

affinity mask 选项在 Microsoft® Windows NT® 4.0 和 Windows® 2000 中,进行中的活动(线程)可以在处理器间迁移,每次迁移都刷新处理器高速缓存。在系统负荷繁重的情况下,指定一个处理器运行某特定的线程可以提高系统性能,方法是减少处理器缓存重新加载的次数。处理器和线程之间的关联称为处理器亲和力。利用 affinity mask 选项可以在系统

2007-01-24 23:02:00 2392

转载 What's the meaning of the saturation arithmetic

saturation arithmetic Saturation arithmetic is a version of arithmetic in which all operations such as addition and multiplication are limited to a fixed range between a minimum and maximum value.

2007-01-24 18:07:00 1721

转载 TLB miss

The first step in executing a prefetch is translating the virtual data address to a physical address. Address translation is accelerated in modern RISC processors through a ``translation lookaside buf

2007-01-24 09:55:00 2238

转载 Linux内核等待队列机制介绍(转载)

相信很多写程序的人都写过 socket 的程序。当我们 open 一个 socket 之后,接着去 读取这个 socket,如果此时没有任何资料可供读取,那 read 就会 block 住。(这是 没有加上 O_NONBLOCK 的情形),直到有资料可读取才会传回来。在 Linux kernel 里 有一个数据结构可以帮助我们做到这样的功能。这个数据结构就是这里要跟各位介绍的 wait q

2007-01-23 22:18:00 1011

转载 使用diff和patch进行简单的文件版本管理

在Unix系统下,维护源码版本可以使用很多方法,其中最常用的当然是大名鼎鼎的CVS,但实际上,简单的版本维护工作并没有必要使用复杂的CVS等专门的版本维护工具,Unix标配中的diff和patch工具就完全可以完成代码的简单备份和升级工作。diff 以"行"为单位比较两个文本文件(也可以是目录比较),并将不同之处以某种格式输出到标准输出上;patch可以读入这种输出,并按照一定指令使源

2007-01-16 18:38:00 3167

原创 修改PHP+Apache上传文件大小限制

在wiki转移过程中,发现原wiki可以上传3-4M大小的文件,而在新wiki中不能超过2M。于是开始排查。首先检查Localsetting.php文件,这个是wiki的配置文件,其中有$wgUploadSizeWarning = 20000000;这样的字段,但很快发现这个仅仅是警告消息。如果在wiki中选择忽略所有消息,文件还是不能超过2M。继续排查,并上网google。发现是php限制文件上

2006-12-27 17:36:00 6277 1

转载 正午的盘子

        午餐时段,北京上地信息产业园里人声鼎沸。   员工成群结队地从办公大楼里走出来,在旁边各类档次和风味、拥挤不堪的餐馆里开始就餐。他们的面孔看上去都很年轻,大多数都在IT企业工作。这些天性自由、个性十足的年轻人往往有着另类的喜好和加班习惯,大部分人都不喜欢企业的员工食堂,他们喜欢并期待着新鲜玩意儿。   揣摩这些年轻人的口味并不容易。不过,快餐公司“正午的盘子”(简称“盘子”)好

2006-12-26 16:25:00 3697

原创 利用ssh端口转发实现邮件转发

服务器上架设了wiki,需要根据页面修改情况向各个watch其界面的用户提交邮件报告。而该服务器位于BSO后面,级别是restrictive,即:服务器不能发起任何向外部的连接。解决此问题可以有两种方案,一种是降低BSO级别,带来的问题是需要做大量的patch工作,手续流程比较麻烦。二是利用一些tip进行。这里使用了ssh的隧道技术1. smtp服务wiki本身有发送邮件的功能,需要调用PHP的m

2006-12-26 13:58:00 3552

原创 免费打印pdf文件

Aodbe Acrobat 中带有一个 PDF 打印机,可以很方便地将支持打印的文档转换成 PDF 格式,用来拿到有打印机的地方打印,或者在网上与人分享。可 Acrobat 是商业软件,而且很贵,非普通消费者能够承担。不过没关系,我们有同样优秀的免费解决方案:安装 Adobe 公司的 PostScript(PS) 打印机驱动,用来实现打印成PS的功能,而 Ghostscript 可以将 PS

2006-12-21 23:11:00 5495

原创 PHP 5.2 出现的Nesting level too deep - recursive dependency问题

在PHP 5.1下运行很好的PHP,移植到PHP5.2之后出现 Nesting level too deep - recursive dependency的问题。对PHP我是不懂了,但让其正常运行是我的责任,于是google。下面是找到的东西http://www.phpdeveloper.org/news/6691So, youve just upgraded to PHP 5.2 and al

2006-12-21 10:41:00 9686

原创 配置apache和mysql到多用户状态

需要在服务器上架设多个网站,其中一个是本team的wiki。下面是硬盘分区情况:/team1 mounted  by /dev/sdc1/team2 mounted by /dev/sdd1/team3 mounted by /dev/sde1/team4 mounted by /dev/sdf1directories of /team1/team1    /users           

2006-12-20 17:06:00 2575

高性能计算并行编程技术—MPI并行程序设计

MPI并行程序设计,清华老师编写。MPI程序设计入门教程。

2010-05-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除