嵌入式微处理器IP core的改进设计方案

发布时间:2011-12-28 阅读量:1302 来源: 我爱方案网 作者:

中心议题:
    *  总体设计方案的拟定
    *  各子模块的设计
    *  系统综合、仿真验证与性能分析
解决方案:
    *  将乘、除法单元各自独立出来
    *  采用类RISC的指令系统和硬布线直接产生控制信号的方式
    *  尽量减少指令执行所需的时钟周期
    *  采用标准的自顶向下的设计方法
  
在嵌入式系统的设计中, IP技术为SoC的设计提供了有效途径, 是SoC的技术支撑。当然, 在国内开发出具有自主知识产权的IP模块还面临着许多问题, 如核心算法的优化、不同层次模块的建立、模块的可重用问题以及IP模块的标准化问题等。对于嵌入式处理器IP 核, 面对的挑战就是如何选择一个满足其应用需求的处理器。现已有数百种嵌入式处理器, 每组都具备一组不同的外设、存储器、接口和性能特性, 用户很难做出一个合理的选择。本文设计的微处理器的指令集与标准8051单片机完全兼容, 这样有利于开发人员的使用。
  
1 总体设计方案的拟定
  
1.1 提出改进方案
  
首先在对典型八位微处理器进行了详尽地剖析的基础上, 指出在传统典型微处理器内核中制约微处理器整体性能的主要因素, 然后提出以下改进方案:
  
(1) 微处理器的内核结构上, 将乘、除法单元各自独立出来来完成算术逻辑指令中的乘、除法运算。这样可以回避传统典型微处理器基于累加器的ALU结构及算术逻辑指令, 从而提高逻辑指令的执行效率。
  
(2) 在指令系统上, 通过采用类RISC的指令系统和硬布线直接产生控制信号的方式来简化指令译码器的设计。同时为内核添加指令缓冲区、采用指令流水线技术、多管道并行执行指令。
  
(3) 指令时序上, 设计中尽量减少指令执行所需的时钟周期, 提高微处理器的运行效率。
  
1.2 总体设计思路
  
根据IP core通用的设计方法, 本文采用了标准的自顶向下的设计方法。就是根据系统级的内容,把系统划分为单元, 然后再把每个单元划分为下一层次的单元, 这样一直划分下去, 直到最底层的单元可以用硬件描述语言进行设计, 如图1所示; 接着在完成各个模块设计的基础上完成系统级设计;然后进行整个系统的仿真验证; 最后选用特定的FPGA芯片进行综合、布局布线以及功能后仿真。

图1 微处理器系统级划分图

 

 


  
2 各子模块的设计
  
2.1 ALU模块
  
算术逻辑单元(ALU) 是微控制器的核心部件, ALU的设计依赖于指令系统, ALU采用什么样的结构、设置那些功能都是建立在对系统指令集分析的基础上来完成。
  
根据算术运算类指令可知, ALU单元主要要完成的功能有: 带/不带进位加/减法、乘法、除法、十进制调整、逻辑运算以及布尔操作的实现。整个操作的完成是通过多路选择器控制来完成。因此, 我们可以对整个ALU系统进行如图2划分, 然后对各个子模块进行设计。

图2 ALU系统划分框图
  
2.2 控制通路的设计
  
本文中的控制通路由译码器模块和控制器模块两部分组成。这部分的设计是在对指令系统进行正确分析的基础上来完成。
  
设计控制通路有两种主要的方法。微程序控制(或微序列控制) 方式使用存储器查表方式来输出控制信号, 而硬连线控制使用时序逻辑和组合逻辑来产生控制信号。硬件直接实现的控制单元一般用有限状态机实现, 通常有较高的运算速度;但是通用性差, 每个电路都必须专门设计控制单元。每一种方法都有一些变形形式。由于本文中微处理器的控制相对简单, 所以在设计中采用了硬连线控制方法。

(1) 控制器模块的状态机实现
  
根据本文中多数输出要保持一个完整的时钟周期, 此时钟周期内输出不能受时钟信号的影响,所以采用Moore型有限状态机来完成控制器模块的设计。整个控制模块的设计通过主状态机和子状态机两步来完成。注状态机模型如图3所示。

图3 控制单元的主状态机模型
  
以中断处理子状态机设计为例, 对子状态机的设计进行说明, 状态转换图如图4所示。

图4 中断处理状态机状态转换图

 

 


  
(2) 存储器模块的设计
  
存储器是数字系统的重要组成部分, 数据处理单元的处理结果需要存储, 许多处理单元的初始化数据也需要存放在存储器中。本文的存储器结构, 采用的是将程序存储器和数据存储器分开寻址的哈佛结构。同时又将数据存储器分为内部数据存储器和外部数据存储器两部分来设计。
  
(3) 中断系统设计
  
本文中的中断系统在控制通路来完成, 共提供了5个中断源, 同时通过对中断优先级寄存器IP中的某位的置位或清除, 可以把每个中断源分别编程为高优先级或低优先级。如表1所示。

表1 中断源表

  
(4) 定时器/计数器模块的设计
  
定时器/计数器是微处理器中重要的外围模块,它主要是完成作为定时器和事件计数器的功能。
  
在作为定时器工作时, 每一个机器周期使定时寄存器加1计数。在作为事件计数器工作时, 是对外部输入负跳变信号做加法计数, 规定在每个机器周期的某一状态采样此信号, 在前一个周期采样到"1", 后一个周期采样到"0" 时计数加1, 而在检测到跳变信号后的那个周期的下一个状态时,新的计数值装入计数寄存器。
  
3 系统综合、仿真验证与性能分析
  
在整个微处理器IP核的设计过程中, 利用可编程逻辑器件进行电路验证对于保证设计的正确性和投片成功十分重要。在FPGA的设计流程中包括三种基本的验证方法: HDL、RTL级描述仿真, 门级仿真和布线后的时序仿真。具体验证流程如图5所示。仿真的目的就是要确认设计的正确性。如果出错的话, 则通过分析仿真器的输出波形, 找出出错的原因, 并对原设计进行修改。

图5 系统验证流图

3.1 仿真验证
  
验证方法: 首先编写各种测试代码; 然后转化为vhdl文件, 再写入ROM模块; 最后在仿真环境中运行IP核, 完成对整个系统的全指令集测试。一般内部RAM和寄存器的值无法直接检测, 可以通过多条指令将其输出到IP核的四个输出端口供检查。本文采用Model Tech公司的仿真工具Moledsim来进行功能仿真和时序仿真。
  
图6是对基本子程序调用指令的测试仿真时序。包括子程序调用、传送、加法以及返回等指令。根据测试指令集, 如果程序执行正确, 那么在程序执行完后, 输出端口P0口就会出现21H。

 

 




图6 基本子程序调用指令的测试仿真波形图
  
测试指令集: MOV A, #20H; ACALL DELEY;MOV P0, A; DELAY: INC A; MOV P0, A。
  
3.2 综合及综合结果分析
  
本文中的综合及优化都是由综合工具SynplifyPro来完成的。利用Synplify Pro工具提供的逻辑综合与适配工具和设计的约束条件, 可以方便的实现本文各模块的逻辑综合和布局布线。
  
对于本文中的八位微处理器来说, 由于它是一个非常复杂的数字逻辑电路, 不仅包含大量的组合逻辑电路, 而且包含了时序复杂的时序逻辑电路。通过逻辑综合估计整个系统超过一百万门,因此要用大容量的可编程逻辑器件来做电路验证。
  
通过比较各种可编程逻辑器件的性能和结构特点(见表2), 决定采用器件Xilinx Virtex2 XC2V1000bg575-6来完成本文的电路验证。

表2 Virtex2系列器件性能和结构特点表

  
综合结果分析主要是利用结构视图、综合报告分析综合结果是否满足时序要求, 分析综合的频率、面积等信息。
  
3.3 性能分析
  
本文的器件资源的占用情况如表3.(由于内部存储器要占用很多的资源, 故此表列出的是缩减内部内存后器件的资源占用情况)。

表3 器件资源占用情况表
  
将经过FPGA验证的MCU核与传统的微处理器做比较, 可以看出, 由于所设计的微处理器核是采用硬布线逻辑产生控制信号, 所以其工作时钟频率要大大优于传统的微处理器。FPGA验证的结果是, 工作时钟频率大于60MHz, 是传统微控制器工作时钟频率的五倍; 在每MHz时钟频率的指令执行效率指标上, 所设计微处理器核的性能约为传统微控制器的12倍。这得益于微控制器内核采用类RISC指令结构, 及设计指令执行周期的大大减小。
  
4 结束语
  
由于整个微控制器内核都是采用可综合的VHDL语言描述, 这使得该内核具有很好的可移植性、可重复利用性和实用性。也可以适当地拓宽数据总线的宽度, 以减少内存访问的次数, 从而提高指令执行效率。此外, 还可借助EDA工具,方便地与AD/DA转换器、LCD显示驱动器、串行通信接口等外围功能模块综合成各种嵌入式控制系统。

相关资讯
“中国芯”逆袭时刻:新唐携7大新品打造全场景AIoT解决方案矩阵

在万物互联与智能化浪潮席卷全球的今天,新唐科技以颠覆性创新奏响行业强音。4月25日,这场历时10天、横跨七城的科技盛宴在深圳迎来高潮,以"创新驱动AI、新能源与车用科技"为主题,汇聚全球顶尖行业领袖,首次公开七大核心产品矩阵,展现从芯片设计到智能生态的全链条创新能力,为半导体产业转型升级注入新动能。

半导体先进制程技术博弈:台积电、英特尔与三星的差异化路径

在2025年北美技术研讨会上,台积电正式宣布其A14(1.4nm)工艺将于2028年量产,并明确表示无需依赖ASML最新一代High NA EUV光刻机。这一决策背后,折射出全球半导体巨头在技术路线、成本控制和市场竞争中的深层博弈。

嵌入式主板EMB-3128:轻量级边缘计算的工业级解决方案

随着AIoT技术的快速落地,智能设备对高性能、低功耗嵌入式硬件的需求持续攀升。华北工控推出的EMB-3128嵌入式主板,搭载Intel® Alder Lake-N系列及Core™ i3-N305处理器,以高能效比设计、工业级可靠性及丰富的接口配置,成为轻量级边缘AI计算的理想选择。该主板支持DDR5内存、多模态扩展接口及宽温运行环境,可广泛应用于智能家居、工业自动化、智慧零售等场景,助力产业智能化升级。

从ASMI财报看行业趋势:AI芯片需求爆发如何重塑半导体设备市场?

作为全球半导体沉积设备领域的龙头企业,荷兰ASM国际(ASMI)近日发布2024年第一季度财报,展现强劲增长动能。财报显示,公司当季新增订单额达8.34亿欧元(按固定汇率计算),同比增长14%,显著超出市场预期的8.08亿欧元。这一表现主要受益于人工智能芯片制造设备需求激增与中国市场的战略性突破,同时反映出半导体产业技术迭代与地缘经济博弈的双重影响。

车规级SerDes国产替代提速:解析纳芯微NLS9116/NLS9246技术优势与市场潜力

随着汽车智能化加速,车载摄像头、激光雷达、显示屏等传感器数量激增,数据传输带宽需求呈指数级增长。传统国际厂商基于私有协议(如TI的FPD-Link、ADI的GMSL)垄断车载SerDes市场,导致车企供应链弹性不足、成本高企。2025年4月,纳芯微电子发布基于HSMT公有协议的全链路国产化SerDes芯片组(NLS9116加串器与NLS9246解串器),通过协议解耦、性能优化与供应链自主可控,为ADAS、智能座舱等场景提供高性价比解决方案,标志着国产车规级芯片从“跟跑”迈向“并跑” 。