提出了一种硬件虚拟接口结构(HVIA),从硬件逻辑设计的角度介绍了一个基于HVIA结构系统域网络(HVIA-Net)的实现关键技术,给出了33MHz、64位PCI环境下实际测试的通信性能,并与同类流行的高性能网络进行了性能比较.最后简...
本文提出了一种硬件虚拟接口结构 (HVIA) ,介绍了一个基于HVIA的系统域网络 (HVIA Net) ,并比较了HVIA与VIA的性能
群机系统是高性能计算机研究领域的热点之一,而用于连接群机系统内部结点的系统域网络(SAN)是群机系统研究的关键。本文在分布共享存储器结构的基础上研究高性能专用SAN网络,构建高性能/价格比的群机系统。 ...
卷积神经网络CNN目前作为神经网络的一个重要分支,相比于其他神经网络方法更适合应用于图像特征的学习和表达。随着CNN的不断发展,CNN将面临更多的挑战。CNN参数规模变得越来越大,这使得CNN对计算的需求量变得非常大。...
本文介绍了一个基于硬件虚拟接口结构的系统域网络 (HVIA Net)接口的逻辑实现 ,提出了基于硬缓冲的PCI接口实现技术和超长突发技术 ,并给出了模拟性能
Impacts of NBTI/PBTI on power gated SRAM CNKI文献
A signal probability and activity probability (SPAP) model was proposed firstly, to estimate the impacts of the negative bias temperature instability (NBTI) and positive bias temperature instability ...
黄平 邢座程 《Journal of Central South University》 2013年05期 期刊
关键词: negative / bias / temperature / instability
下载(42)| 被引(1)
本文提出了一种新型的具有升降压功能的DC-DC控制器的设计方案,它工作在PWM/PFM控制方式下,用于对超级电容电池的供电进行控制。文中阐述了DC-DC控制器的发展背景和工作原理,从系统结构上对该芯片进行了研究设计和模拟...
本文提出了一种多线程微处理器微体系结构EDSMT。EDSMT有效结合显示并行指令计算 EPIC和动态同时多线程DSMT技术,通过软、硬件协同的方式充分开发和有效支持多个层次的并行性。EDSMT能够降低硬件设计的复杂性,提高微处...
为了提高算术逻辑部件的性能,采用多米诺逻辑和偏斜逻辑门的电路结构,结合并行前缀加法器的优点,设计实现了一款64位高性能整数加法器.根据需要,设计了一种符号扩展电路,使之能够处理带符号操作数的加减法,符号扩展结...
为使单电子晶体管达到实际应用的地步,开展室温条件下相关研究成为必然。从正统理论出发,推导、计算出室温条件下单电子晶体管能否正常工作的库仑岛临界尺寸:存储器件为6.5nm,逻辑器件为1.5nm;本文还推导和计算出单电...
介绍了一种低功耗TLB结构。这种结构的思想是基于程序局部性原理,结合Block Buffering[1]技术,并对CAM结构进行改造,提出一种预比较TLB结构,实现低功耗的TLB。并且采用Simplescalar 3.0模拟该TLB结构和几种传统的TLB结...
侯进永 邢座程 《国防科技大学学报》 2006年05期 期刊
CUDA技术方便程序员在GPU上进行通用计算,但并没有提供随机数产生的应用接口。为此,本文提出并实现在CUDA开发平台上并行产生均匀随机数算法,测试证明算法可行。在此基础上优化基本遗传算法,并在GPU上并行实现其所有操...
本文提出一种64位加法器的结构。二进制数加法是微处理器最基本的和常用到的操作。加法器的设计实现直接影响着微处理器的性能。并行前缀加法器是加快二进制数加法的通用技术,这种方法执行组间位是否产生和传播进位的...
张艳 邢座程 第十七届计算机工程与工艺年会暨第三届微处理器技术论坛论文... 2013-07-20 中国会议
关键词: 并行前缀加法器 / Sklansky加法器 / Kogge-Stone加法器 / BrentKung加法器
下载(147)| 被引(2)
一种基于FPGA的DDR3 SDRAM控制器设计与实现 CNKI文献
本文介绍了DDR3 SDRAM的基本特点以及工作过程,给出了一种结合AlteraALTMEMPHY IP的DDR3 SDRAM控制器的设计方法,介绍了DDR3 SDRAM控制器的基本结构和设计思想,对各个功能模块进行了详细分析,在设计完成之后对控制器的...
本文提出了卷积码与极化码级联译码算法的改进方案——流水线型译码算法。该译码算法采用矢量重叠SC译码和滑动窗口VB译码相结合的译码方案,能够将面向组的译码方案变为面向流的译码方案,同时在保持算法复杂度不变的情...
数字通信接收机的基本模块包括同步、信道估计与均衡、信道解码等。对OFDM系统而言,同步算法尤其重要,如果存在同步偏差,则可能会破坏子载波的正交性,引入严重的干扰。在了解CFO估计基本原理并对基于CP、训练符号等估...
对超标量处理器的发射队列结构和功能进行分析,实现了一种适用于超标量微处理器的高效能发射队列。该发射队列采用FIFO结构的入队离队形式,通过在发射段增加读寄存器流水段,来减少读端口数目,以此降低面积和功耗。对这...
GPU体系结构的革新和相应开发平台的发展使得GPU广泛地应用于科学计算领域。通过深入地分析GPU体系结构和存储层次的优缺点以及GPU上的关键性能特征,阐明了GPU体系结构、编程模型和存储层次之间的关系。针对GPU异构系...
采用0.13μm标准CMOS工艺,全定制设计实现了一款8 kB(8 k*8 bit)的高速低功耗静态随机存取存储器(SRAM)。分析了影响存储器性能和功耗的原因,并在电路布局上做了改进,将两个3-8译码器进行拆分与重组,降低了互连线的延...
功能模拟是设计高性能微处理器接口ASIC芯片的重要环节,目的是消除ASIC的功能性设计错误。为了更好地对ASIC芯片进行模拟,需要灵活、方便、能够体现微处理器行为的CPU模型,文章将介绍了对一个CPU...