c2000c5000c6000系列DSP编程方法

上传人:z**** 文档编号:164558784 上传时间:2022-10-25 格式:DOCX 页数:13 大小:40.19KB
收藏 版权申诉 举报 下载
c2000c5000c6000系列DSP编程方法_第1页
第1页 / 共13页
c2000c5000c6000系列DSP编程方法_第2页
第2页 / 共13页
c2000c5000c6000系列DSP编程方法_第3页
第3页 / 共13页
资源描述:

《c2000c5000c6000系列DSP编程方法》由会员分享,可在线阅读,更多相关《c2000c5000c6000系列DSP编程方法(13页珍藏版)》请在装配图网上搜索。

1、二、TI公司三大系列内部结构的简介1、C2000系列的内部结构1,C2000 系列基于改进的哈佛结构,支持分开的程序空间和数据空间。还有第三个空间, 即 I/O 空间,用于片外总线接口。外设总线映射到数据空间,因此,运行在数据空间的所有 指令,都可以运行于所有的外设寄存器。C2000系列的CPU包括:一个32位的中心算术逻 辑单元(CALU)、一个32位的累加器(ACC)、CALU具有输入和输出数据定标移位器、一个16x16 位乘法器、一个乘积定标移位器、数据地址产生逻辑:包括 8 个辅助寄存器和 1 个辅助寄存 器算术单元(ARAU)、程序地址产生单元C2000 系列采用 2xLPASIC

2、核,其内部设有 6 组 16 位的数据与程序总线。这 6 组总线是: PAB(ProgramAddr Bus) 程 序 地 址 总 线 DRAB(Data-ReadAddr Bus) 数 据 读 地 址 总 线;DWAB(Data-WriteAddr. Bus)数据写地址总线;PRDB(ProgramReadBus)程序读总线;DRDB(DataReadBus)数据读总线;DWEB(DataWriteBus)数据写总线。将数据读地址总线(DRAB) 和数据写地址总线(DWAB)分开,CPU就可以在同一个机器周期内读和写数据。C2000系列具有以下类型的片内存储器:双访问RAM(DARAM),即

3、一个机器周期内可以访问 两次的存器; FlashEEPROM 或工厂掩模的 ROM。 C2000 系列的存储器分为单独可选择的 4 个空间,总共的地址范围为224K字:程序存储器(64K字);局部数据存储器(32K字);全局 数据存储器(64K字);输入/输出(64K字)。2、 C5000 系列的内部结构C5000 系列中央处理单元 CPU 包括算术逻辑单元、乘法器、累加器、移位寄存器、各种专门 用途的寄存器、地址发生器、比较选择单元、指数编码器。具体内容如下先进的多总线结 构,具有1条程序存储器数据总线、3条数据存储器数据总线和4条地址总线;40位算术 逻辑单元(ALU),包括40位的桶形移

4、位寄存器和2个独立的40位的累加器;17位乘17 位的并行乘法器与一个40位的专用加法器结合在一起,用于单周期乘/累加操作;比较、 选择和存储单元(CSSU),用于Viterbi操作(一种通信的编码方式)中的加/比较选择;指数编 码器用于在单周期内计算 40 位累加器的指数值;2个地址生成器,包括8个辅助寄存器和2个辅助寄存器算术单元6。C5000系列内部存储器系统包括1624位外接存储器接口、片内的程序ROM、片内的单访 问的数据RAM和双访问的数据RAM。具有16位192 K的基本可寻址空间:64 K字程序空间, 64 K 字数据和 64 K 字的 I/O 空间7。C5000系列的片外设和

5、专用电路包括软件可编程等待状态发生器;可编程的存储器体转 换逻辑;片内的锁相环(PLL)时钟发生器,可采用内部振荡器或外部的时钟源;外部总线 关断控制电路可用来断开外部数据总线、地址总线和控制信号;数据总线具有数据保持特 性;可编程的定时器;直接存储器访问(DMA)控制器;可与主机直接连接的8位并行 主机接口(HPI),有些产品还包括:扩展的8位并行主机接口(HPI8)和16位并行主机接口(HPII6); 片内的串口根据型号不同分以下类型:全双工的标准串口,支持8位和16位数据传送、 时分多路(TDM)串口、缓冲串口(BSP)以及多通道缓冲串口(McBSP)。3、C6000系列的内部结 构C6

6、000 系列 DSP 芯片的 CPU 包括:程序取指单元、指令分配单元、指令译码单元、双数据 通道(每个通道包含4个功能单元)、32个32bit寄存器(C62x / 67x系列)/ 64个32bit寄存器 (C64x 系列)、控制寄存器、控制逻辑、测试、仿真和中断逻辑、断电。芯片内的CPU有8个并行处理单元,分为相同的两组。单个指令字长度为32bit, 8条指令 构成一个指令包,总字长为256bit。芯片内部设置了专门的指令分配模块,可将每个256bit 的指令包同时分配到8 个处理单元,并由 8 个处理单元同时执行。当芯片的最高时钟频率为 1GHz,且内部8个处理单元同时运行时,其最大处理能

7、力可达8000MIPS。指令并行化是实 现其良好性能的关键,使该系列DSP芯片的性能远远超出传统设计所实现的性能。DSP芯片的内部存储器为最大可达7Mbit的片内SRAM。它一般可划分为一级缓冲存储器(简 称为缓存)、二级缓存两部分(C620x/C670x系列仅具有一级缓存)。其一级缓存又可分为内 部程序缓存和内部数据缓存两部分。C6000DSP芯片的存储器寻址空间为32bit,可以进行字节寻址,获得8bit、16bit、32bit数 据。它可以很方便地配置不同速度、不同容量、不同复杂程度的存储器,其32bit的外部存 储器接口(EMIF)可以直接与同步存储器连接(如同步动态随机存取存储器(S

8、DRAM)、同步突发 静态随机存取存储器(SBSRAM),主要用于大容量、高速存储器;可以直接连接异步存储器如 静态随机存取存储器(SRAM)、电可编程只读存储器(EPROM),主要用于小容量数据存储器和 数据存储;还可直接连接外部控制器,如与先入先出(FIFO)存储器连接。它的片内集成外设主要包括DMA/EDMA、外部存储器接口(EMIF)以及一些辅助外设,诸如 定时器、串行接口等,依靠这些外设, DSP 芯片实现与外部器件的接口,完成相应的功能。 DSP 芯片在内部集成了众多的外围设备(简称外设)接口,可以方便地连接片外存储器、主机、 串行设备等外设。 TMS320C6000 系列芯片的主

9、要片内外设模块包括:程序和数据存储器控 制器、直接存储器访问(DMA)控制器、增强型直接存储器访问(EDMA)控制器、外部存储器接 口(EMIF)、多路缓冲串行口(McBSP)、多路音频串行口(McASP)、通用目标输入/输出口(GPIO)、 主机接I=1(HPI)、中断选择器、定时器(Timer)、二级内部存储器(Two_Level Internal Memory)、 锁相环(PLL)控制器、扩展总线(XBUS)、外围部件互连(PCI)。三、内部结构的对比C2000 系列 DSP 是针对工业应用提供的高性能和高代码效率控制器,针对不同的控制设计方 案具有丰富的可选产品线。 C2000 数字信

10、号处理器在提供通用处理器性能的同时,将丰富的 微控制器集成外设与TI领先的DSP技术融合在一起,外设包括Flash存储器、快速AD转换 器和稳定的 CAN 模块等。利用 TI 强大的低成本、高集成的 C2000 控制器平台,用户可以在 减小系统成本的同时提高产品性能,并能快速投向市场oC2000系列DSP芯片具有如下特点: TMS320C20x是最早使用片内闪烁存储器的DSP芯片,闪烁存储器具有比ROM灵活、比RAM 便宜的特点,TMS320F206和TMS320F207的片内具有32K字的闪烁存储器和4.5K字的RAM。 利用闪烁存储器存储程序,不仅降低了成本,减小了体积,而且系统升级也比较

11、方便。此系 列 DSP 芯片针对数字控制系统应用进行了优化设计,芯片内部具有多达16 路的 10 位 A/ D 转换功能,具有多个通用定时器和一个看门狗定时器,具有多达14个的脉宽调制(PwM)输 出通道,最多具有 41 个通用 I/ O 引脚。C5000 系列是一个定点低功耗系列,特别适用于手持通讯产品,如手机、 PDA、 GPS 等。目 前的处理速度一般在 80MIPS 一 400MIPS。 C5000 系列主要分为 C54xx 和 C55xx 两个系列。 两个系列在执行代码级是兼容的,但他们的汇编指令系统却不同。 C5000 包含的主要外设有 McBPS 同步串口, HPI 并行接口,定

12、时器, DMA 等。其中 C55XX 提供 EMIF 外部存储器扩展 接口,允许用户直接使用SDRAM、SBSRAM、SRAM、EPROM等各种存储器。而C54XX没有 提供EMIF,所以只能直接使用静态存储器SRAM和EPROM。另外,C5000系列一般都使用 双电源供电,其 I/0 电压和核电压一般不同,而且不同型号也有差别。不过, TI 提供了全系 列的DCDC变换器可以解决DSP的电源问题。C6000 系列的 CPU 是第一款采用 VelociTI 体系结构的 DSP 芯片。 VelociTI 是高性能、先进的 超长指令字(VLIW)结构。在具有VLIW结构的处理器中,多个功能单元并行

13、工作,共享公用 的大型寄存器组,同时执行的各种操作是由 VLIW 的长指令分配模块来进行同步协调的。 C6000 系列 DSP 芯片的这种结构使其成为多通道、多功能以及高性能应用的首选器件4求的地方。DSP的传统设计往往是采取主从式结构:在一块电路板上,DSP做从属机,负责 数字信号处理运算;外加一块嵌入式微处理器做主机,来完成输入、控制、显示等其他功能。 为此,TI专门推出了一款双核处理器OMAP,包含有一个ARM和一个C5000系列DSP, OMAP处理器C55x系列,采用改进的哈佛结构(1组程序存储器总线、3组数据存储器总线 和4组地址总线)。包含中央处理器(CPU)、存储器和片上外设三

14、个部分。具有8条16位总 线:1条程序总线、3条数据总线和4条地址总线和高度并行性的算术逻辑单元(ALU)。专用 的硬件逻辑、片内存储器、片内外设和高度专业化的指令集,是芯片达到高性能、高速度 操作更方便、更灵活2。图 2 C5000 系列 DSP 的基本结构在 CPU 方面:(1) 先进的多总线结构,采用改进的哈佛结构;(2) 40位算术逻辑单元(ALU),包括40位的桶形移位寄存器和2个独立的40位的累加器;(3) 17位乘 17 位的并行乘法器与一个 40 位的专用加法器结合在一起,用于单周期乘/累加操 作;(4) 比较、选择和存储单元(CSSU),用于Viterbi操作(一种通信的编码

15、方式)中的加/比较选择;(5) 指数编码器用于在单周期内计算40 位累加器的指数值;(6) 2 个地址生成器,包括 8 个辅助寄存器和 2 个辅助寄存器算术单元。在存储器系统方面:具有16位192K基本可寻址空间:64K字程序空间,64K字数5据和 I/O 空间;在片外设和专用电路方面: (1)软件可编程等待状态发生器; (2)可编程的存储器体转换逻辑; (3)片内的锁相环(PLL)时钟发生器,可采用内部振荡器或外部的时钟源;(4)外部总线关断控 制电路可用来断开外部数据总线、地址总线和控制信号; (5)数据总线具有数据保持特性; (6) 可编程的定时器;(7) 直接存储器访问(DMA)控制器

16、;(8) 可与主机直接连接的8位并行主机接口(HPI),有些产品还包括:扩展的8位并行主机接 口(HPI8)和16位并行主机接口(HPII6);片内的串口全双工的标准串口,支持8位和16位数据传送、时分多路(TDM)串口、缓冲 串口 (BSP)以及多通道缓冲串口 (McBSP)。(10)指令的执行采用指令预提取、指令提取、指令译码、访问操作数、读取操作数、执行等 六级流水线并行结构。此外,还具有符合IEEE 1149.1标准的在片仿真接口,可与主机连接, 用于系统芯片开发应用。TMS320C55XX是在C54X的基础上发展起来的并与其兼容。C55X通过增加功能单元,增强了 运算能力,性能更好和

17、功耗更低。是目前最省电的芯片,更适合在数据效率高、运算量大的 2.5G和3G的无线通信中使用。相比C54X,该芯片在CPU的功能方面做了扩展:(1)总线增加了 2条,一条读操作总线(BB), 条写操作总线(WB);增加了一个乘加单元 (MAC)。(3)增加了一个 16 位的 ALU。(4)将累加器增至4个: AC0、 AC1、 AC2、 AC3。 (5)临时寄存器增至4个: T0、 T1、 T2、 T3。与C54X相比,C55X不仅增加了硬件资源,也优化了资源的管理,所以性能得到了大大的提 升,处理能力可达400800MIPS,广泛应用于移动通信终端设备中。2.3 TMS320C6000 系列

18、TMS320C6000平台,包含定点C62x和C64x以及浮点C67x。其追求的是至高性能,最近新 推出的芯片速度高达1GH Z,适合宽带网络、图像、影像、雷达等处理应6用。内部数据/Cache存储器32位外部存储接口包括直接同步存储器接口,可与同步动态存 储器(SDRAM),同步突发表态存储器(SBSRAM)直接相连,主要用于大容量高速存储。还包 括直接异步存储器接口,可与 SRAM 和 EPROM 连接,主要用于小容量数据存储和程序存储。 还有直接外部控制器接口,可与FIFO寄存器连接,可以方便的配置不同速度、不同容量、 不同复杂程度的存储器。C6000的其他模块包括:四通道自动加载DMA

19、协处理器,可用于 数据的DMA传输;16位宿主机接口,可以将C6000配置成宿主机的DSP加速器;灵活的锁 相环路时钟产生器,可以对输入时钟进行不同的倍频处理。有的芯片内集成的JTAG仿真扫 描装置,方便开发和程序调试。图 3 C6000 系列 DSP 的基本结构C62xx 16位定点 DSP:速度为 12002000MIPS,适用于无线基站、 ADSL、MODEM 池 (pooled Modem)、网络系统及数字音频广播设备等场合,价格21224美元。工作频率: 150-300MHZ;运行速度:1200-2400MIPS;内部2个乘法器,6个算术逻辑单元,超长指令 字(VLIW)结构,大容量

20、的片内存储器和大范围的寻址能力,4个DMA接口,2个多通道 缓存串口,2 个 32 位片内外设。C67xx 32为浮点DSP:速度为1000MFLOPS,适用于基站数据波束形成、图像处理、语音识 别及3D图形等。工作频率:400-600MHz,运行速度:3200-4800MIPS具有特殊功能的指令 集。C64xx为定点DSP: C64xx系列的芯片工作频率高达1000MHz,计算速度已超过50亿次指 令/秒,而功耗仅为现有器件的1/3。 C64xx 系列芯片可通过一条单独接入家庭的宽带线路传 输大量的个性化数据、视频和语音,并可通过地3G无线基站向手机发送多媒7体信息。C64xx和C62xx代

21、码兼容,但结构有显著的加强,其初期的工作频率可达750MHz。C67xx在 C62xx 八个功能块中的六个上增加了浮点功能,因此其指令集是不同的。 C6000 没有专门的 MAC单元,而是使用分开的乘法和加法指令来实现MAC操作。尽管该操作需要两个指令周 期,但其流水的效果仍然是单周期执行。这种结构包含两个数据通道,以便和各有四个功能 单元的两组相匹配。C62x和C64x包含两个乘法单元(M)、六个32-bit的算术单元、40-bit的ALU和40-bit的桶 型移位器。 C64x 的 M 单元每个时钟周期执行两个 16316-bit 的乘法,而 C62x 则只能执行一 个乘法。此外, C64

22、x 的每个 M 单元可以在每个周期内作四个 838-bit 的乘法。 M 单元的位 计数和旋转硬件,可以支持bit水平的算法。2.4 三大芯片性能比较(1) 从 C2000 系列芯片的应用领域不难看出,它的内核十分适宜进行工业控制。内核中哥哥 存储器和累加器的运算逻辑单元不说,具有高位宽高精度高效率的AD转换集成功能,具有 增强型事件管理器,增强型的脉冲宽度调制功能部分,增强型的多路数据同时和排序采集单 元, OEP 元件,还有增强型的定时器单元,多数量的 SPI 和 SCI 等,从而在整体上更加有利 于控制信号的变量实时的采集和处理。(2) 高效,低耗是 C5000 系列的最大特点。在各种

23、CPU 单元还有片内外设及各种总线和用户 接口不断改进的同时,有的还加入新的 ARM 核,从而更加提高整体的运行效率。通过增加 可控的电源选择装置,从而为各模块能够在最低功耗的前提下达到要求的效果提供了实现方 法。这也是此系列芯片用在消耗类电子产品中的原因。(3) 从运行速度上, C6000 居首位,因为它集成了很多完整功能的外设在片内。采用的寻地址 位宽可达32位甚至更大,具有超强指令字处理功能,指令更加高效。更有先进的多路DMA, 集成多个单 DSP 功能,扩充各种总线和数据接口数目,加强整体的智能控制,增加高速缓 存等各种方法,大大的提高运算速度,达到处理超大数量信息的能力。结论通过对

24、TI 公司三大系列 DSP 芯片内部结构整体的比较,从他们适宜应用的领域出发,得出 了三个系列的结构特点和区别,对 DSP 芯片有了一定的了解,为今后更好地学习 DSP 打下 了良好的理论基础2.1TMS320C2000 系列TMS320C2000平台包含 TMS320C20x/C24x和32位的C28x的定点 DSP。该系列使用TMS3202XLP 作为处理核心,系列中不同型号配置上不同的片上外设,具有高中低的不同控 制能力,其中C24x系列市场销量很好,而对C28xx系列,TI则认为很有市场潜力而大力推 广。C2000 专门针对控制领域做了内核的优化配置,集成了众多的片内外设,使其更适合逆

25、变器、 马达、机器人、数控机床、电力等应用领域。由于 C2000 定位在控制领域,其包含了大量 片内外设,如 IO、SCI、SPI、CAN、A/D 等等。这样 C2000 既能作为快速微控制器来控制对 象,也能作为 DSP 来完成高速数字信号处理, DSP 的高性能与通用微控制器的方便性紧密结 合在一起,所以C2000也常被称为DSP控制器2C2000系列在工业控制和家电领域中,一个比较大的市场是变频器和不间断电源(UPS)。二者 在电路结构上基本一致,都是整流 +滤波+桥式逆变结构,控制上都是采用脉冲宽度调制(PWM)控制。C2000为此专门设计了能产生PWM的事件管理器(EV),用户可以方

26、便地 用来生成PWM,调节死区等。事实上绝大多数电机控制,包括步进电机,都是采用PWM 控制,都适合采用 DSPC2000 控制,可获得更好的细分、速度与精度。128K 字 Sectored Flash18K 字 RAM4K 字 Boot ROM存储器总线中断管理32 X 32bit乘法器32bit定时器定时JTAGR-M-W Automic ALU32 bit 寄存器组事件管理器 A 看门狗 watchdog事件管理器 B12 bit模数转换器 ADC 通用输入输出口GPIO多通道缓冲串口McBSPCAN-20BSCI-A SCI-B SPI-串口C28x 32bit DSP图 1TMS32

27、0C28x 控制器总体结构C2000 系列 DSP 芯片系列具有许多独特的地方:(1)采用多组总线结构实现并行处理机制,容 许 CPU 同时进行程序指令和存储数据的访问;(2)采用独立的乘法器和累加器,使复杂的乘 法运算能快速进行;(3)乘法器和累加器分别连接比例移位器,使得许多复杂运算或运算后的定标能在一条指令 中完成;(4)有丰富的寻址方式,可方便灵活的编程;(5)有完善片内外设,可构成结构完整的单片系统;该系列芯片具有3条地址总线:程序读地址总线(PAB)、数据读地址总线(DRAB)、数据写地址总线(DWAB);具有3条数据总线:程序读数据总线(PRDB)、数据读数据总线(DRDB)、数

28、据写数据 总线(DWDB);采用四级流水线操作:取指令(P)、指令译码(T)、取操作数(D)和执行指令(E)。 该系列芯片的CPU称为TMS3202XLP,其中32位中央算术逻辑单元(CALU)执行算数运算和逻 辑运算,32位累加器接受CALU的结果,1个16X16位的硬件乘法器,逻辑/地址产生逻辑 功能的8个辅助寄存器和操作它们的8个算术逻辑单元(ARLU),2个包含状态位和控制位的状 态寄存器(ST0、ST1)。存储器I/O空间由3个独立编址的存储器空间组成:64K的程序存储器、数据存储器和I/O 空间。其中数据存储器空间地址范围还包括最大 32K 的全局数据存储器空间。片上的 544 字

29、的双存取RAM具有比外存储器更优性能,更低的成本和更少的功耗,从而加快了系统速 度。片上外设包括涉及与时间有关事件的时间管理模块(EV)。EV含有通用定时器、比较器、PWM 发生器、捕获器;A/D转换模块(ADC)含有2个8通道10位的A/D转换器;串行通信接口(SCI) 是一个标准的串行异步数字通信接口模块,可以实现双工和半双工通信,串行外设通信模块 (SPI)提供了一个高速同步串行总线,实现与带有SPI的芯片连接,为工程应用系统提供了方 便;中断管理模块负责处理 DSP 内核中断,片内外设以及外部引脚中断的响应过程。 DAC 转换模块为双10位模数转换器,系统监视模块由看门狗和实时中断定时

30、器组成,负责监视 芯片的软硬件运行状态。系统复位部分,当系统出现故障时可以在一定时间内复位或得到已 知状态。最后JTAG逻辑扫描电路与IE1149.1的逻辑扫描电路兼容,用于系统仿真和测试。 2.2TMS320C5000 系列TMS320C5000平台,是专门针对低功耗、高性能的高速实时信号处理而专门设计的16位定点DSP,广泛应用于无线通信系统设备和远程通 信等实时嵌入系统中。其提供性能、外围设备、小型封装和电源效率的优化组合,适合便携 式上网、语音处理及对功耗有严格要求的地方。DSP的传统设计往往是采取主从式结构:在 一块电路板上, DSP 做从属机,负责数字信号处理运算;外加一块嵌入式微

31、处理器做主机, 来完成输入、控制、显示等其他功能。为此,TI专门推出了一款双核处理器OMAP,包含有 一个 ARM 和一个 C5000 系列 DSP, OMAP 处理器把主从式设计在芯片级上合二为一,一个 典型的应用实例为诺基亚手机。表2TMS320C5000主要性能和典型应用TMS320C5000包含代码兼容的定点C54x系列和C55x系列,采用改进的哈佛结构(1组程序 存储器总线、3组数据存储器总线和4组地址总线)。包含中央处理器(CPU)、存储器和片上 外设三个部分。具有8条16位总线: 1条程序总线、 3 条数据总线和4条地址总线和高度并 行性的算术逻辑单元(ALU)。专用的硬件逻辑、

32、片内存储器、片内外设和高度专业化的指令 集,是芯片达到高性能、高速度,操作更方便、更灵活2。图2TMS320C54x控制器总体结构在 CPU 方面:(1) 先进的多总线结构,采用改进的哈佛结构;(2) 40位算术逻辑单元(ALU),包括40位的桶形移位寄存器和2个独立的40位的累加器;(3) 17位乘17位的并行乘法器与一个40位的专用加法器结合在一起,用于单周期乘/累加操 作;(4) 比较、选择和存储单元(CSSU),用于Viterbi操作(一种通信的编码方式)中的加/比较选择;(5) 指数编码器用于在单周期内计算40位累加器的指数值;(6) 2个地址生成器,包括8个辅助寄存器和2个辅助寄存

33、器算术单元。在存储器系统方面:具有16位192K基本可寻址空间:64K字程序空间,64K字数据和I/O 空间;在片外设和专用电路方面:(1)软件可编程等待状态发生器;(2)可编程的存储器体转换逻辑;(3) 片内的锁相环(PLL)时钟发生器,可采用内部振荡器或外部的时钟源;(4) 外部总线关断控制电路可用来断开外部数据总线、地址总线和控制信号;(5) 数据总线具有数据保持特性; (6)可编程的定时器;(7) 直接存储器访问(DMA)控制器;(8) 可与主机直接连接的8位并行主机接口(HPI),有些产品还包括:扩展的8位并行主机接 口(HPI8)和16位并行主机接口(HPII6);片内的串口全双工

34、的标准串口,支持8位和16位数据传送、时分多路(TDM)串口、缓冲 串口 (BSP)以及多通道缓冲串口 (McBSP)。(10)指令的执行采用指令预提取、指令提取、指令译码、访问操作数、读取操作数、执行等 六级流水线并行结构。此外,还具有符合IEEE1149.1标准的在片仿真接口,可与主机连接, 用于系统芯片开发应用。TMS320C55XX 是在 C54X 的基础上发展起来的并与其兼容。 C55X 通过增加功能单元,增强了 运算能力,性能更好和功耗更低。是目前最省电的芯片,从而更适合在数据效率高、运算量 大的2.5G和3G的无线通信中使用。相比C54X系列,该芯片在CPU的功能方面做了扩展:(

35、1) 总线增加了 2条,一条读操作总线(BB), 条写操作总线(WB);(2) 增加了一个乘加单元(MAC)。增加了一个16位的ALU。(4)将累加器增至4 个: AC0、 AC1、 AC2、 AC3。 (5)临时寄存器增至 4 个: T0、 T1、 T2、 T3。 与 C54X 相比, C55X 不仅增加了硬件资源,也优化了资源的管理,所以性能得到了大大的提 升,处理能力可达400800MIPS,广泛应用于移动通信终端设备中。2.3TMS320C6000 系列TMS320C6000平台,包含定点C62x和C64x以及浮点C67x。其追求的是至高性能,最近新 推出的芯片速度高达1GHZ,适合宽

36、带网络、图像、影像雷达等处理应用。表 3TMS320C6000 主要性能和典型应用在250MHz的主频条件下,C6000的运算速度可以达到2000MIPS。该系列芯片包括定点的 C62XX 系列,浮点是 C67XX 系列,其中 C64XX 最新成员,它为第三代无线产业、宽带基础设 施和影像应用带来了技术的变革。图 3TMS320C6000 控制器总体结构C6000系列具有超强的指令字(VLIW)处理能力。单指令字长为32位,内部共有8个并行的 处理单元,8条指令组成一个指令包,在一个时钟周期内完成。工作频率可达200MHz,每 秒完成1.6G此操作。通过片内的锁相环(PLL)获得倍频输入时钟。

37、C6000的8个独立单元中 有 2 个 16 位乘法器和 6 个算术逻辑单元。采用加载和储存的结构,数据在多处理器单元传 输依靠 32 个 32 位通用寄存器。指令可以进行字节寻址,并有条件决定是否执行。寻址空间 为32位,芯片内部集成了 1Mb7Mb的片内SRAM,且被分成两片:一是内部程序/Cache 存储器,二是内部数据/Cache存储器。32位外部存储接口包括直接同步存储器接口,可与同步动态 存储器(SDRAM),同步突发表态存储器(SBSRAM)直接相连,主要用于大容量高速存储。还 包括直接异步存储器接口,可与 SRAM 和 EPROM 连接,主要用于小容量数据存储和程序存 储。还有

38、直接外部控制器接口,可与 FIFO 寄存器连接,可以方便的配置不同速度、不同容 量、不同复杂程度的存储器。C6000 的其他模块包括:四通道自动加载 DMA 协处理器,可用于数据的 DMA 传输;16 位 宿主机接口,可以将 C6000 配置成宿主机的 DSP 加速器;灵活的锁相环路时钟产生器,可 以对输入时钟进行不同的倍频处理。有的芯片内集成的JTAG仿真扫描装置,方便开发和程 序调试。2.4三大系列内部结构比较首先,三大系列芯片有共同之处,具有相同点:都包含中央处理器(CPU)、存储器和片上 外设三个部分。(2) 片内组织都采用哈佛结构,更多的是改进的哈佛结构,并采用多级流水线,从而提高片

39、 内指令的运行速度和运行效率。(3) 在CPU单元中都具有相应的乘法加法器,ALU,筒形移位器等等基础逻辑运算单元。(4) 都有相应的软硬件复位装置功能,如看门狗等。 (5)各种总线接口,主从机接口,通用的 10 口,SPI,SCI,CAN等外设的一种或几种。都支持JTAG仿真。 再次,三大系列芯片由于应用各领域的不同,具有鲜明的不同点:(1)从 C2000 系列芯片的应用领域不难看出,它的内核十分适宜进行工业控制。内核中哥哥 存储器和累加器的运算逻辑单元不说,具有高位宽高精度高效率的AD转换集成功能,具有 增强型事件管理器,增强型的脉冲宽度调制功能部分,增强型的多路数据同时和排序采集单 元,

40、 0EP 元件,还有增强型的定时器单元,多数量的 SPI 和 SCI 等,从而在整体上更加有利 于控制信号的变量实时的采集和处理。高效,低耗是C5000系列的最大特点。在各种CPU单元还有片内外设及各种总线和用户 接口不断改进的同时,有的还加入新的ARM核,从而更加提高整体的运行效率。通过增加 可控的电源选择装置,从而为各模块能够在最低功耗的前提下达到要求的效果提供了实现方 法。这也是此系列芯片用在消耗类电子产品中的原因(3)从运行速度上,C6000居首位,因为 它集成了很多完整功能的外设在片内。采用的寻地址位宽可达32位甚至更大,具有超强指 令字处理功能,指令更加高效。更有先进的多路DMA,

41、集成多个单DSP功能,扩充各种总 线和数据接口数目,加强整体的智能控制,增加高速缓存等各种方法,大大的提高运算速度, 达到处理超大数量信息的能力,。I 公司三大系列 DSP 芯片内部结构之比较T二、TMS320C2000 系列TMS320C2000是作为优化控制的DSP系列。TMS320C2000系列DSP集成CPU核和控制外设 于一体,提供了高速的ADC和PWM发生器等,集成强大灵活的特定控制接口。C2000 DSP 既具有数字信号处理能力,又具有强大的事件管理能力和嵌入式控制功能,非常实用于工业、 汽车、医疗和消费类市场中数字电机控制、数字电源和高级感应技术。在太阳能逆变器、风 力发电等绿

42、色能源应用领域也将得到广泛应用。TMS320C2000系列目前主要有16位的TMS320F24X和32位的TMS320C28x两个子系列。TMS320F24X是较早的16定点DSP控制器,性能达到40MIPS,提供了高度集成的闪存、控 制和通信外设,也提供了引脚兼容的ROM版本,代表产品有F240和F2407。TMS320C28x 是 32 位的控制器,主要包括了 TMS320x280x、TMS320x281x、TMS320F282xx 和浮点的TMS320F283xx系列,4个子系列都采用同样的C28x CPU核,软件完全兼容,目前 共有 28 种芯片。 TMS320x280x 系列外设功能

43、增强且极具价格优势,采用 100 引脚封装,所 有产品引脚兼容。具有高达128KB的闪存和100MIPS的性能,也有ROM版本的产品,该系 列共有 12 款产品,它们全部引脚兼容。该系列增强了事件管理模块的功能,具有 HPRWM 输出,串行外设最高达到 4 个 SPI 模块快、2 个 SCI 模块、2 个 CAN 模块和 1 个 I2C 总线。TMS320x281x 系列的 TMS320F281x 系列具有高达 128KB 的 Flash 和 150MIPS 的性能,该系列 共有8款产品。TMS320x282x系列是32位定点DSP控制器,工作频率高达150MHz,包括 TMS320F2823

44、2、TMS320F28234 和 TMS320F28235 共 3 款产品。 TMS320F283x 是 TI 最新推出 的浮点数字信号控制器,包括了定点的32 位 C28xCPU 核,还包括一个单精度32 位 IEEE754 浮点单元,浮点协处理器速度可达300MEL0PS,主要产品有TMS320F28332、TMS320F28334 和TMS320F28335,该系列产品在太阳能发电和汽车雷达等系统中可以充分发挥作用,与 F281x 相比, F282x 和 F283x 增加了 6 通道 DMA、 I2C 接口, GPIO 数增加到 88 个,片内串行 接口数和存储器容量也有所提高,有高达

45、512KB 的片上 Flash。 F282x 和 F283x 产品引脚完全 兼容。在 C2000 系列中, TI 主推 C24x 和 C28x 两个子系列,如表 1 所示。表 1 TMS320C2000 定点 DSPDSP 类型 特性C24x 16bit 数据, 定点SCI,SPI,CAN, 10 bit A/D,事件管理器,看门狗定时器,片上Flash 存储器, 2040MIPS C28x32bit 数据,定点SCI,SPI,CAN,12 bit A/D,McBSP,看门狗定时器,片上 Flash存储器, 400MIPSTMS320C28x 是到目前为止用于数字控制领域性能最好的 DSP 芯

46、片。 32 位的定点 DSP 核,最 高速度可达400MIPS,可以在单个指令周期内完成32X32位的乘累加运算,具有增强的电 机控制外设、高性能的模/数转换能力和改进的通信接口,具有8GB的线性地址空间,采用 低电压供电(3.3V外设/1.8V CPU核),与TMS320C24X源代码兼容。TMS320C5000 系列TMS320C5000是16位定点、低功耗的DSP,最适合便携式上网以及无线通信等应用场合, 如手机、 PDA、 GPS 等应用,处理速度在 80400MIPS。 TMS320C5000 主要成员有 TMS320C55x 和 TMS320C54x 两个 16 位定点 DSP 子

47、系列,两者软件兼容。C54x 具有很好的操作灵活性和很高的运行速度,其结构采用改善的哈佛结构(一组程序存 储器总线、3组数据存储器总线、4组地址总线),具有专用硬件逻辑的CPU、片内存储器、 片内外设以及一个效率很高的指令集。 C54x 具有以下主要优点:使用改善的哈佛结构,时 的性能和多功能性都得以提高;具有高度并行性和专用硬件逻辑的 CPU 设计,是芯片性能 大大提高;效率很高的指令集更适合于快速算法的实现和高级语言编程的优化;模块化结构 的设计,是派生器件得到了更快的发展;先进的 IC 制造工艺,提高了芯片性能,降低了功 耗;先进的静态设计技术,使得芯片具有更低的功耗和更强的应用能力。

48、TMS320C54x 结构 框图如图 1 所示。图 1 TMS320C54x 结构框图C55x工作在0.9V时,功耗低至0.005mW/MIPS。工作在400MHz钟频时,可达800MIPS。和 120MHz的C54x相比,300MHz的C55x性能提高5倍。功耗将为1/6。因此,C55x非常适 合个人的和便携式的应用以及数字通信设施的应用。C55x的核具有双MAC以及相应的并行 指令,还增加了累加器、ALU和数据存储器,其指令集是C54x指令集的超集,以便和扩展 了的总线结构、新增加的硬件执行单元相适应。C55x的指令长度从8bit到48bit可变,由此 可控制代码的大小,比C54x降低40

49、%,同时也就意味着降低对存储器的要求,从而降低系 统的成本。C55x结构框图如图2所示。TMS320C6000 系列TMS320C6000是32位最高性能的DSP,包括C62x/C67xC64x/DM64x等4个系列。C62X和 C64x是32位定点DSP,定点器件性能从1200MIPS到8000MIPS,C67x是32位浮点DSP, 浮点器件性能从6001800MFL0PS, DM64x在C64x核的基础上,增加了视频接口,以便视 频应用。C6000系列广泛应用在有线/无线宽带网络、组合Modem、GPS导航、基站数字波 束形成、医学图像处理、语音识别、3D图形、ADSL Modem、网络系

50、统、中心局交换机、数 字音频广播设备等,其中移动通信是C6000系列DSP的重要应用领域。C6000系列的芯片有了更优化的性能。两层cache结构,是的存储方式更加灵活;强化的DMA 控制器,EDMA提供2GB/S的片外带宽,支持有独立事件触发的64个通道,总共有85个参 数可以用来设置连接,支持字节、字、半个字以及双字等各种字长,从而大大提高系统的效 率,使系统的设计者只需要考虑EDMA是否能达到要求,通道之间的交互并不影响性能,这 和传统的DMA大不相同;3组片外总线:组片外存储器接口(EMIF)和1组主机接口(HPI); 灵活的串口连接,3个多通道缓冲串口(MsBSP)可以和各种标准接口

51、; ATM通用测试和操 作接口(UTOPIA)。C6000的结构框图如图3所示。C62x和C64x处理器具有相同的核结构,C64x系列是在C62x的结构上扩展而来,增加了一 些新的功能单元,强化了一些功能单元,C67x扩展了 C62x的指令集,支持浮点运算,C67x 对C62x向下兼容,但和C64x不兼容,C62x的指令可以在C67x上运行,C67x处理器适合于 要求高精度、大动态范围以及大量运算的应用,C64xDSP是C6000 DSP系列里最高性能的定 点DSPoDM64x系列处理器基于TI的VelociTI.2超长指令字结构,使其适用于数字媒体应用。 DM64x的结构框图如图4所示总结C

52、2000系列主要偏重于工控领域,这个系列的DSP自身集成了丰富的I/O 口,A/D采样接口 及PWM输出接口,其中C24x子系列为16位定点型,C28x子系列为32为定点型;C5000 和C6000系列主要偏重于视频图像处理,C5000系列均为16位定点型,C6000系列中的C62x 和C64x为32位定点型,C67x子系列为浮点型,性能强大,但自身集成的外设很少,一般 需要扩展。在时钟方面,C2000系列的时钟频率比C5000和C6000的频率要低,C2000系列的最高主频 为150MHz,C5000系列中的C55x子系列最高主频为300MHz,C6000系列中的C64x子系列 的最高主频高

53、达720MHz。C2000系列中的C28x子系列可扩展性能达到400MIPS,是最佳的C/C+控制代码效率05000 系列中, C54x 关注于低功耗, C55x 则降低功耗提到一个新水平, C55x 的功耗低至 0.005mW/MIPs,具有最长的电池寿命和最佳的代码密度。C6000系列是TI的高档DSP系列 其中C64x子系列的工作频率将达到1.1GHz,是最好的DSP编译器,C6000系列及C2000中 的 C28x 系列,用 C 语言编程效率非常高,代码优化可达 85%左右缩短了软件开发周期,程 序可以执行好。随着技术的发展,现在的 DSP 产品的时钟频率和处理器速度越来越高,集成的片内外设及 内存越来越多,寻址空间越来越大,功能越来越强,芯片的功耗也逐渐加大,性能价格比也 越来越好。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!