一种动态的变型向量处理器

2022-04-22 来源：客趣旅游网

第３期　２０１４年６月　中嚼鼋；珂．鼍ｆ唧露限哥氟　Ｊｏｕｒｎａｌ　ｏｆ　ＣＡＥＩＴ　Ｖｏ１．９　Ｎｏ．３　Ｊｕｎ．２０１４　ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３－５６９２．２０１４．０３．０１４　一种动态的变型向量处理器　吴晨曦　，杨　惠　２．国防科技大学，长沙４１００７３）　（１．阜阳师范学院数学与计算科学学院，安徽阜阳２３６０３７；　摘要：嵌入式应用中，单指令流多数据流（ＳＩＭＤ，ｓｉｎｇｌｅ　ｉｎｓｔｒｕｃｔｉｏｎ　ｍｕｌｔｉｐｌｅ　ｄａｔａ）结构的向量处理　器在蓬勃发展的同时，也面临着如何高效利用其丰富处理资源的问题。在ＳＩＭＤ的向量结构上，处　理实际应用中无法被向量化运算的部分，尤其是很多非向量化的循环内部往往含有体间相关，使得　ＳＩＭＤ结构的丰富运算资源处于空闲状态。因此，传统的ＳＩＭＤ结构受限于此类应用。提出了一种变　型的向量处理器，在保持传统ＳＩＭＤ处理数据并行应用高效性的同时，能够高效地执行包含循环体间　数据相关的代码段。实验结果表明，它能获得２．４倍的性能加速，而仅仅占用Ｏ．９７％的面积开销。　关键词：单指令流多数据流；指令级并行；数据级并行；向量处理单元　中图分类号：ＴＰ３９　文献标识码：Ａ　文章编号：１６７３．５６９２（２０１４）０３－２９６４）４　Ａ　Ｄｙｎａｍｉｃ　Ｍｏｒｐｈｉｎｇ－ＳＩＭＤ　Ｐｒｏｃｅｓｓｏｒ　ＷＵ　Ｃｈｅｎ—ｘｉ．ＹＡＮＧ　Ｈｕｉ　（１．Ｓｃｈｏｏｌ　ｏｆ　Ｍａｔｈｅｍａｔｉｃｓ　ａｎｄ　Ｃｏｍｐｕｔａｔｉｏｎａｌ　Ｓｃｉｅｎｃｅ，Ｆｕｙａｎｇ　Ｔｅａｃｈｅｒｓ　ｃｏｌｌｅｇｅ，Ａｎｈｕｉ　Ｆｕｙａｎｇ　２３６０３７，Ｃｈｉｎａ；　２．Ｎａｔｉｏｎａｌ　Ｕｎｉｖｅｒｓｉｔｙ　ｏｆ　Ｄｅｆｅｎｓｅ　Ｔｅｃｈｎｏｌｏｇｙ，Ｃｈａｎｇｓｈａ　４１００７３，Ｃｈｉｎａ）　Ａｂｓｔｒａｃｔ：Ｉｎ　ｅｍｂｅｄｄｅｄ　ａｐｐｌｉｃａｔｉｏｎ，ｔｈｅ　ｖｅｃｔｏｒ　ｐｒｏｃｅｓｓｏｒ　ｏｆ　ｓｉｎｇｌｅ　ｉｎｓｔｕｃｔｒｉｏｎ　ｍｕｌｔｉｐｌｅ　ｄａｔａ（ＳＩＭＤ）　ｓｔｒｕｃｔｕｒｅ　ｉｓ　ｄｅｖｅｌｏｐｉｎｇ　ｒａｐｉｄｌｙ，ｗｈｉｌｅ　ｉｔ　ｉｓ　ｆａｃｉｎｇ　ｔｈｅ　ｐｒｏｂｌｅｍ　ｏｆ　ｈｏｗ　ｔｏ　ｕｓｅ　ｉｔｓ　ａｂｕｎｄａｎｔ　ｐｒｏｃｅｓｓｉｎｇ　ｒｅ－　ｓｏｕｒｃｅｓ　ｅｆｆｉｃｉｅｎｔｌｙ．Ｉｎ　ｔｅｒｍｓ　ｏｆ　ｔｈｅ　ｖｅｃｔｏｒ　ｓｔｒｕｃｔｕｒｅ　ｏｆ　ＳＩＭＤ，ｒｅａｌ－ｗｏｒｌｄ　ａｐｐｌｉｃａｔｉｏｎｓ　ｃｏｎｓｉｓｔ　ｏｆ　ｍｏｒｅ　ｔｈａｎ　ｈｉｇｈｌｙ　ｐａｒａｌｌｅｌ　ｉｎｎｅｒ　ｌｏｏｐｓ；ｍａｎｙ　ｏｆ　ｔｈｅｍ　ａｒｅ　ｎｏｎ—ｖｅｃｔｏｒｉｚａｂｌｅ，ｂｅｃａｕｓｅ　ｔｈｅｙ　ｃｏｎｔａｉｎ　ｌｏｏｐ—ｃａｒｒｉｅｄ　ｄａｔａ　ｄｅｐｅｎｄｅｎｃｉｅｓ　ｆｒｏｍ　ｏｎｅ　ｉｔｅｒａｔｉｏｎ　ｔｏ　ｔｈｅ　ｎｅｘｔ，ｌｅａｖｉｎｇ　ｔｈｅ　ｐｒｏｃｅｓｓｉｎｇ　ｒｅｓｏｕｒｃｅｓ　ｉｎ　ｉｄｌｅ　ｓｔａｔｅ．Ｔｈｅｒｅｆｏｒｅ，ｔｒａ—　ｄｉｔｉｏｎａｌ　ｄａｔａ　ｐａｒａｌｌｅｌ　ＳＩＭＤ—ａｒｃｈｉｔｅｃｔｕｒｅｓ　ａｒｅ　ｌｉｍｉｔｅｄ　ｉｎ　ｔｈｉｓ　ｋｉｎｄ　ｏｆ　ａｐｐｌｉｃａｔｉｏｎ．Ａ　ｎｏｖｅｌ　ｄｙｎａｍｉｃ　ｎｏｒ—　ｐｈｉｎｇ—ＳＩＭＤ　ｔｈａｔ　ｅｆｆｉｃｉｅｎｔｌｙ　ａｃｃｅｌｅｒａｔｅ　ｌｏｏｐ　ｄｅｐｅｎｄｅｄ　ｃｏｄｅ　ｓｅｇｍｅｎｔｓ　ｏｎ　ＳＩＭＤｓ　ｉｓ　ｐｒｏｐｏｓｅｄ．Ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ　ｉｔ　ｃａｎ　ａｃｈｉｅｖｅ　ａｂｏｕｔ　２．４ｘ　ａｖｅｒａｇｅ　ｐｅｒｆｏｒｍａｎｃｅ　ｉｍｐｒｏｖｅｍｅｎｔ，ａｔ　ａ　ｃｏｓｔ　ｏｆ　ｏｎｌｙ　０．９７％　ａｒｅａ　ｏｖｅｒｈｅａｄ．　Ｋｅｙ　ｗｏｒｄｓ：ＳＩＭＤ；Ｉｎｓｔｒｕｃｔｉｏｎ　Ｌｅｖｅｌ　Ｐａｒｌｌａｅｌｉｓｍ（ＩＬＰ）；Ｄａｔａ　Ｌｅｖｅｌ　Ｐａｒａｌｌｅｌｉｓｍ（ＤＬＰ）；Ｖｅｃｔｏｒ　Ｐｒｏｃｅｓｓ・　ｉｎｇ　Ｅｌｅｍｅｎｔ（ＶＰＥ）　因为它们包含了循环的体问相关…。受限于ＳＩＭＤ　０　引　言　实际无线通讯和多媒体应用包含了大量结构规　整的内部循环。然而，许多循环是不能够向量化的，　的结构特征，传统ＳＩＭＤ结构不能有效地处理此类代　码段，因为它们没有机制来加速这类循环的数据流　图。在这种情况下，大部分的ＳＩＭＤ运算资源空转。　现有研究中，体系结构和编译工作者往往关注于映射　收稿日期：２０１４－０３—１８　修订日期：２０１４－０４－２６　基金项目：国家自然科学基金资助项目（６１３０１２３６）　２０１４年第３期　吴晨曦等：一种动态的变型向量处理器　２９９　延迟随着ＶＰＥ数量增加而增加时，这就会引发同一　个ＶＰＥ上，不同循环迭代执行之间的资源被闲置。　另外，增宽单个ＶＰＥ内部的功能单元数量，能够开　发更多的细粒度的指令级并行，因而也就减少了　ＶＰＥ之间的中粒度的线程级并行。通过变换功能　单元和ＶＰＥ的中间链接，能够在ｗＮ的配置空间中，　选择不同的ＳＩＭＤ链接方式。　其次，控制产生器需要存储配置ＳＩＭＤ链接的　配置位。每个功能单元Ｆｕ需要７位来指定操作类　型，存储单元需要１位来指定执行加载ｌｏａｄ指令或　存储ｓｔｏｒｅ指令，因而总共需要位配置位。每个功能　单元Ｆｕ可以接受从１到　个可能源输入，因而每　个端口需要位选择位。再者，配置ＶＰＥ和各个功能　单元工作在“ＳＩＭＤ链接执行模式”下，还是“传统　ＳＩＭＤ执行模式”时，需要用到１位全局控制位。因　而总共需要位的配置位。　２．４编译支持　首先，编译在程序中识别出能够映射到新结构　上执行的包含体间相关的循环。一旦编译识别出包　含体间相关的循环，就要检查硬件资源是否足够充　足以支持该循环的映射执行。如果资源不充足，那　么这个被识别出的循环就需要被分裂成一个或者多　个更小的循环，以映射到新结构上执行。其次，编译　还负责分析程序，并识别出循环体内存在的所有的　数据相关和控制相关，并判断循环的相关延迟。编　译还需增加同步指令，从而在循环结束后，将多指令　流汇聚成为单指令流。　３性能和代价评估　建立了时钟精确ＳＩＭＤ　Ａｎｙｓｐ仿真处理器，并基　于５个具有代表性的多媒体应用和无线通讯的核心　算法，进行定量和定性的分析。首先，通过变换ＶＰＥ　内部和之间的网络链接，探索不同的ＳＩＭＤ拓扑结构　获取的性能加速比。如变换ＶＰＥ数量，配置４４，４８，　分别表示单个ＶＰＥ的功能单元个数为４，ＶＰＥ数量分　别为４个或者和８个。这些配置的性能影响，如图５　所示。可以看出８８和４８这两张结构的性能加速比　几乎没有不同，因此，当最大子图深度减半，增加更多　的ＶＰＥ数量不会增加任何性能收益，配置８个ＶＰＥ　更能够节约硬件开销。不同的拓扑结构对功耗影响　的归一化表示，如图６所示。由图６可以看出相比　配置８８，配置４８能够很大程度的节约功耗。　图５不同拓扑结构的性能加速比　１．０２　１　０．９８　０．９６　０．９４　Ｏ．９２　Ｏ．９　０．８８　Ｏ．８６　图６不同的拓扑结构的对功耗影响的归一化表示　通过上述分析，选择最优最有效的配置４８对　ＳＩＭＤ结构进行链接，并选择１２个代表性的应用运行　在新结构上，所获得的性能加速比同级，如图７所示。　带有动态链的Ａｎｙｓｐ，相比非ＳＩＭＤ链接的Ａｎｙｓｐ，获取　平均和最大的加速比分别是２．４倍和３．５倍。在　Ａｎｙｓｐ处理器上，用Ｖｅｆｉｌｏｇ　ＨＤＬ完成１８的链接，采用　Ｓｙｎｏｐｓｙｓ　Ｄｅｓｉｇｎ　Ｃｏｍｐｉｌｅｒ来综合，在ＴＳＭＣ６５　ｎｍ技术　５００　ＭＨｚ下，总共的硬件开销约占内栊　面积的０．９７％。　图７最优配置下的－陛能加速比　４　结　语　研究的目标在于加速包含体间相关的循环（ｄｅ—　ｐｅｎｄｅｎｃｙ—ｌｏｏｐ）在ＳＩＭＤ处理器上的执行。它充分　利用现有的硬件资源，进行简单的链接，从而最小化　硬件开销，并易被简单的应用于现有的ＳＩＭＤ处理　器上。本文提出的机制，基于无线通讯和多媒体应　用评估算法，相较于传统ＳＩＭＤ结构，能够获取的性　能加速比约１．２５倍到３．５倍，在ＴＳＭＣ６５　ｎｍ技术　５００　ＭＨｚ下，总共的硬件开销约为０．９７％。　（下转第３０３页）　２０１４年第３期　罗昌林：基于随机解调器压缩采样的宽带频谱检测方法　３０３　［５］ＱＵＡＮ　Ｚ，ＣＵＩ　Ｓ，ＳＡＹＥＤ　Ａ　Ｈ，ｅｔ　ａ１．Ｏｐｔｉｍａｌ　Ｍｕｈｉｂａｎｄ　４　结　语　研究了一种基于随机解调器压缩采样的认知无　Ｊｏｉｎｔ　Ｄｅｔｅｃｔｉｏｎ　ｆｏｒ　Ｓｐｅｃｔｒｕｍ　Ｓｅｎｓｉｎｇ　ｉｎ　Ｃｏｇｎｉｔｉｖｅ　Ｒａｄｉｏ　Ｎｅｔ—　ｗｏｒｋｓ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｓｉｎａｇｌ　Ｐｒｏｃｅｓｓｉｎｇ，２Ｏ０９，５７　（３）：１１２８—１１４０．　线电宽带频谱检ｉ贝０方法，该方法能够在低于Ｎｙｑｕｉｓｔ　采样率的情况下对款频段进行检测，降低了ＡＤＣ的　［６］ＤＯＮＯＨＯ　Ｄ．Ｃｏｍｐｒｅｓｓｅｄ　Ｓｅｎｓｉｎｇ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｈｅｏｒｙ，２００６，５２（４）：１２８９－１３０６．　负担。仿真结果表明，在频谱满足稀疏的条件下，该　方法能够较准确检测各个信道的信号，完成对款频　［７］ＺＥＮＧ　Ｆ，ＬＩ　Ｃ，ＴＩＡＮ　Ｚ．Ｄｉｓｔｒｉｂｕｔｅｄ　Ｃｏｍｐｒｅｓｓｉｖｅ　Ｓｐｅｃ—　ｔｒｕｍ　Ｓｅｎｓｉｎｇ　ｉｎ　Ｃｏｏｐｅｒａｔｉｖｅ　Ｍｕｈｉｈｏｐ　Ｃｏｇｎｉｔｉｖｅ　Ｎｅｔｗｏｒｋｓ　段的电磁频谱普查。当噪声功率增加时，检测性能　有所降低，因此，该方法比较适合于信噪比不是太低　的情况。另外，与所有压缩采样方法一样，基于ＲＤ　［Ｊ］．ＩＥＥＥ　Ｊｏｕｒｎａｌ　ｏｆ　Ｓｅｌｅｃｔｅｄ　Ｔｏｐｉｃｓ　ｉｎ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓ—　ｉｎｇ，２０１１，５（１）：３７４８．　［８］ＹＥＮ　Ｃ　Ｐ，ＴＳＡＩ　Ｙ，ＷＡＮＧ　Ｘ．Ｗｉｄｅｂａｎｄ　Ｓｐｅｃｔｒｕｍ　Ｓｅｎｓ—　ｉｎｇ　Ｂａｓｅｄ　ｏｎ　Ｓｕｂ—Ｎｙｑｕｉｓｔ　Ｓａｍｐｌｉｎｇ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｅ—　ｔｉｏｎｓ　ｏｎ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ，２０１３，６１（１２）：３０２８—３０４０．　的宽带频谱检测方法也需要在频谱满足稀疏度要求　的情况下才适用。后续研究可以考虑绕过重构环节　［９］ＴＲＯＰＰ　Ａ，ＬＡＳＫＡ　Ｎ，ＤＵＡＲＴＥ　Ｆ，ｅｔ　ａ１．Ｂｅｙｏｎｄ　Ｎｙｑｕｉｓｔ：　Ｅｆｉｆｃｉｅｎｔ　Ｓａｍｐｌｉｎｇ　ｏｆ　Ｓｐａｒｓｅ　Ｂａｎｄｌｉｍｉｔｅｄ　Ｓｉｎａｇｌｓ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｈｅｏｒｙ，２０１０，５６（１）：５２０—５４４．　的检测方法，进一步降低复杂度。　参考文献：　［１］ＳＵＮ　Ｈ，ＮＡＬＬＡＮＡＴＨＡＮ　Ａ，ＷＡＮＧ　Ｃ　Ｘ，ｅｔ　ａ１．Ｗｉｄｅｂａｎｄ　Ｓｐｅｃｔｒｕｍ　Ｓｅｎｓｉｎｇ　ｆｏｒ　Ｃｏｇｎｉｔｉｖｅ　Ｒａｄｉｏ　Ｎｅｔｗｏｒｋｓ：ａ　Ｓｕｒｖｅｙ　［１Ｏ］ＴＲＯＰＰ　Ｊ，ＧＩＬＢＥＲＴ　Ａ．Ｓｉｇｎａｌ　Ｒｅｃｏｖｅｒｙ　ｆｒｏｍ　Ｒａｎｄｏｍ　Ｍｅａｓｕｒｅｍｅｎｔｓ　Ｖｉａ　Ｏｒｔｈｏｇｏｎａｌ　Ｍａｔｃｈｉｎｇ　Ｐｕｒｓｕｉｔ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｈｅｏｒｙ，２００７，５３（１２）：４６５５－　４６６６．　［Ｊ］．ＩＥＥＥ　Ｗｉｒｅｌｅｓｓ　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ，２０１３，２０（２）：７４—８１．　［２］ＡＸＥＬＬ　Ｅ，ＬＥＵｓ　Ｇ，ＬＡＲＳＳＯＮ　Ｅ　Ｇ，ｅｔ　ａ１．Ｓｐｅｃｔｒｕｍ　Ｓｅｎｓｉｎｇ　ｆｏｒ　Ｃｏｇｎｉｔｉｖｅ　Ｒａｄｉｏ：Ｓｔａｔｅ一０ｆ－ｔｈｅ—ａｒｔ　Ａｎｄ　Ｒｅｃｅｎｔ　Ａｄｖａｎｃｅｓ［Ｊ］．　ＩＥＥＥ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｍａｇａｚｉｎｅ，２０１２，２９（３）：１０１—１１６．　作者简介　［３］ＦＡＲＨＡＮＧ－ＢＯＲＯＵＪＥＮＹ　Ｂ．Ｆｉｌｔｅｒ　Ｂａｎｋ　Ｓｐｅｃｔｕｍ　Ｓｅｎｓ—ｒ　ｉｎｇ　ｏｆｒ　Ｃｏｇｎｉｔｉｖｅ　Ｒａｄｉｏｓ［Ｊｊ．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ，２００８，５６（５）：ｌ８０１—１８１１．　［４］ＴＩＡＮ　Ｚ，ＧＩＡＮＮＡＫＩＳ　Ｇ．Ａ　Ｗａｖｅｌｅｔ　Ａｐｐｒｏａｃｈ　ｔｏ　Ｗｉｄｅ—　罗昌林（１９８１～），主要研究方向为认　知无线电、信号检测：　Ｅ—ｍａｉｌ：ｌｕｏｃｈａｎｇｌｉｎ＠１　３９．ｃｏｒｎ　ｂａｎｄ　Ｓｐｅｃｔｒｕｍ　Ｓｅｎｓｉｎｇ　ｆｏｒ　Ｃｏｇｎｉｔｉｖｅ　Ｒａｄｉｏｓ［Ｃ］／／Ｐｒｏｃ．　ＩＥＥＥ　Ｃｏｇｎｉｔｉｖｅ　Ｒａｄｉｏ　Ｏｒｉｅｎｔｅｄ　Ｗｉｒｅｌｅｓｓ　Ｎｅｔｗｏｒｋｓ　ａｎｄ　许翔（１９６３一），浙江嘉兴人，副教授，主要研究方向　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ，Ｍｙｋｏｎｏｓ　Ｉｓｌａｎｄ，Ｇｒｅｅｃｅ，２００６：１－５．　为无线通信、数字信号处理。　◆ｌｉｉ◆ｉｉＩ－＊－ｉ　ｉ１４ｔ．ｉｉＩ◆ｌｉｉ◆…ｉ◆ｌｉｉ◆ｉｌｌ◆…◆ｉｉ１４ｔ．Ｉｉｉｉ◆…ｉ◆ｉｉ１◆ｉｉ１◆ｉｉＩ◆…ｌ◆ｌ　Ｉｌ◆…Ｉ４ｔ－…Ｉ◆…【◆…◆ｌｌＩ◆川Ｉｌ◆…ｌ◆…４ｔ－…◆…Ｉ◆…ｌ４ｔ－…◆　◆…Ｉ◆…ｊ◆ｌ　Ｉｌ◆…１◆…ｌ◆…◆川ｌ４－…◆…◆…◆ｌ　Ｉｌ◆Ｉ１Ｉ◆…４ｔ－ｌｌＩ　４ｔ－ＩＩＩ｛◆ｌ　（上接第２９９页）　ｔｉｍｉｚａｔｉｏｎ（ＴＡＣＯ），２００９，６（２）：４０７４２０．　参考文献：　［１］ＯＮＮＹ　ＫＲＡＳＨＩＮＳＫＹ，ＣＨＲＩＳＴＯＰＨＥＲ　ＢＡｑ＇ＴＥＮ，ＭＡＲＫ　ＨＡＭＰＴＯＮ．Ｔｈｅ　Ｖｅｃｔｏｒ—ｔｈｒｅａｄ　Ａｒｃｈｉｔｅｃｔｕｒｅ［Ｃ］／／Ｐｒｏｃｅｅｄ—　ｉｎｇｓ　ｏｆ　ｔｈｅ　３１ｓｔ　Ａｎｎｕａｌ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｃｏｍ—　ｐｕｔｅｒ　Ａｒｃｈｉｔｅｃｔｕｒｅ，２００４．　［５］ＡＳＩＫＡ　Ｇ．，ＷＯＨ　Ｍ，ＳＥＯ　Ｓ．Ｍｉｇｈｔｙ—ｍｏｒｐｂｉｎｇ　Ｐｏｗｅｒ—ＳＩＭＤ　［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２０１０　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｃｏｍｐｉｌｅｒｓ．Ａｒｃｈｉｔｅｃｔｕｒｅｓ　ａｎｄ　Ｓｙｎｔｈｅｓｉｓ　ｆｏｒ　Ｅｍｂｅｄｄｅｄ　Ｓｙｓｔｅｍｓ，２０１０．　作者简介　吴晨曦（１９９１一），阜阳师范学院数　［２］ＯＨ　Ｍ，ＳＥＯ　Ｓ，ＦＬＡＵＴＮＥＲ　Ｋ．Ａｎｙｓｐ：Ａｎｙｔｉｍｅ　Ａｎｙｗｈｅｒｅ　Ａｎｙｗａｙ　Ｓｉｎａｇｌ　Ｐｒｏｃｅｓｓｉｎｇ【Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　３６ｔｈ　Ａｎ－　ｎｕａｌ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｃｏｍｐｕｔｅｒ　Ａｒｃｈｉｔｅｃｔｕｒｅ，２０Ｏ９．　学与计算科学学院信息与计算科学专业　学生，研究方向为计算机硬件、微处理器　技术；　Ｅ－ｍａｉｌ：２７９３１３７１＠ｑｑ．ｃｏｒｎ　［３］ＫＡＰＡＳＩ　Ｕ　Ｊ，ＤＡＬＬＹ　Ｗ　Ｊ，ＲＩＸＮＥＲ　Ｓ．Ｅｆｆｉｃｉｅｎｔ　Ｃｏｎｄｉ—　ｔｉｏｎａｌ　Ｏｐｅｒａｔｉｏｎｓ　ｆｏｒ　Ｄａｔａ—Ｐａｒａｌｌｅｌ　Ａｒｃｈｉｔｅｃｔｕｒｅｓ［Ｃ］／／　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　３３ｒｄ　ａｎｎｕａｌ　ＡＣＭ／ＩＥＥＥ　ｉｎｔｅｒｎａｔｉｏｎａｌ　ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｍｉｃｒｏａｒｃｈｉｔｅｃｔｕｒｅ，２０００．　杨　惠（１９８７一），助理研究员，国防科技大学计算机学　院电子科学与技术专业博士研究生，研究方向大规模集成电　路设计，微处理器设计。　Ｅ—ｍａｉｌ：ｈｕｉｈｕｉ１９８７０１２４＠１２６．ｃｏｒｎ　［４］ＦＵＮＧ　Ｗ　Ｗ　Ｌ，ＳＨＡＭ　Ｉ，ＹＵＡＮ　Ｇ．Ｄｙｎａｍｉｃ　Ｗａｒｐ　Ｆｏｒｍａ—　ｔｉｏｎ：Ｄｆｉｆｃｉｅｎｔ　ＭＩＭＤ　Ｃｏｎｔｒｏｌ　Ｆｌｏｗ　ｏｎ　ＳＩＭＤ　Ｇｒａｐｈｉｃｓ　Ｈａｒｄ－　ｗａｒｅ［Ｊ］．ＡＣＭ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ａｒｃｈｉｔｅｃｔｕｒｅ　ａｎｄ　Ｃｏｄｅ　Ｏｐ—　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

一种动态的变型向量处理器