stm32f407和tms320f28335的对比

有没有大神给个两种芯片的对比啊，包括特点，构架以及底层配置和编译环境，两种芯片都可以用C/C++编程么虽然一个是ARM.,一个是DSP，难道二者就没有可比性么?？... 有没有大神给个两种芯片的对比啊，包括特点，构架以及底层配置和编译环境，两种芯片都可以用C/C++编程么
虽然一个是ARM.,一个是DSP，难道二者就没有可比性么?？展开

 我来答

2个回答

#热议# 在购买新能源车时，要注意哪些？

意法半导体(中国)投资有限公司 2023-06-12

展开全部

意法半导体致力于引领单片机技术和产品的创新，推动生态系统的建设，为用户提供满意的产品和技术服务。意法半导体单片机产品线拥有业界宽广、极具创新力的32位产品系列 – STM32，覆盖超低功耗、超高性能方向，同时兼具很强的市场竞争力。STM32是ARM Cortex内核单片机和微处理器市场和技术方面的佼佼者，目前提供16大产品线 (F0, G0, F1, F2, F3, G4, F4, F7, H7, MP1, L0, L1, L4, L4+,L5, WB)，超过1000个型号。STM32产品广泛应用于工业控制、消费电子、物联网、通讯设备、医疗服务、安防监控等应用领域，其优异的性能进一步推动了生活和产业智能…

官网

匿名用户
2015-08-07

展开全部

论坛上看到的比较。
这几天刚拿到STM32F4的评估板，STM32F4这次的卖点就是FPU和DSP指令集，关注了挺长时间，这次就想测试一下STM32F4的浮点性能，如果满足就升级自己飞控的架构。本来用STM32F103+28335双核架构，F28335当浮点处理器用，调试起来比较麻烦，所以一直想换了。

测试代码就是用的我飞控的算法，全部使用浮点运算，包含姿态和位置两个7阶和9阶的卡尔曼滤波器，包含大量的矩阵运算以及部分导航算法和PID控制器等，还有部分IF和SWITCH包含跳转的判定语句，相比纯算法算是一个比较综合的运算。

测试环境：
F28335：CCS V3.3，使用TI优化的数学库，不开优化，程序在RAM里执行。
STM32F4：KEIL V4.7，使用ARM优化的数学库，不开优化。

测试方法：
F28335：在飞控算法入口设置断点，清零CCS的CPU计数器(profile->clock)，然后STEP OVER，记录下CPU的计数
STM32F4：在飞控算法入口设置断点，记录下Register窗口内算states计数器，然后STEP OVER，记录下新的计数器数值，与之前的数值相减得到CPU计数

测试结果：
F28335：253359个CPU周期，除以150MHZ，大约是1.69ms
STM32F4：一共285964个周期，除以168MHZ，大约是1.7ms,比F28335略慢

结论就是，对于包含相对较多跳转的综合浮点算法而言，STM32F4似乎并不慢多少。

抛开架构因素，从纯浮点运算方面来看的话。STM32F4的FPU加减乘指令VADD.F32、VSUB.F32、VMUL.F32都是单周期指令，而除法VDIV.F32耗费14个周期。
例如：a = a / b;产生的汇编为：
0x08000220 ED900A00 VLDR s0,[r0,#0x00]

0x08000224 4804 LDR r0,[pc,#16] ; @0x08000238

0x08000226 EDD00A00 VLDR s1,[r0,#0x00]

0x0800022A EE801A20 VDIV.F32 s2,s0,s1

0x0800022E 4803 LDR r0,[pc,#12] ; @0x0800023C

0x08000230 ED801A00 VSTR s2,[r0,#0x00]
复制代码 F28335： F28335的FPU有加减乘法指令，都是双周期的，由于没有硬件除法指令，F28335这里是用软件模拟的浮点除法，汇编可以看到 LCR $div_f32.asm字样，需要19个时钟周期。
例如：a = a * b,产生的汇编为：
0087B2 E203 MOV32 *-SP[4], R0H

0087B4 E2AF MOV32 R1H, *-SP[6], UNCF

0087B6 E700 MPYF32 R0H, R1H, R0H

0087B8 7700 NOP //需要让流水线等待FPU运算完毕，所以需要NOP

0087B9 E203 MOV32 *-SP[4], R0H

复制代码除法：
0087BD E203 MOV32 *-SP[4], R0H

0087BF E2AF MOV32 R1H, *-SP[6], UNCF

0087C1 7640 LCR $div_f32.asm:52:71$

0087C3 E203 MOV32 *-SP[4], R0H
复制代码结论：
可见单从浮点处理器来说，F28335是不如F4的FPU的。但是由于F28335是哈佛架构，有较长的流水线，可以在一个时钟周期里完成读取，运算和存储，所以程序连续运行的话，就比ARM快上许多许多，比如执行一次a = a + b只需要5个时钟周期，但是缺点就是一旦要跳转，就必须清空流水线，如果是
for(i = 0;i < 1000; i ++)

a = a + b;
复制代码这样的运算，速度反而要比ARM慢（测试下来单次是17周期，ARM是14）.所以说这就是ARM和DSP不同的地方了。

看看这次测试比较，感觉环境还是有一定的问题：
1、F28335是在RAM中运行，并且两者都是在仿真器环境中进行运算，还是离线在Flash中跑比较靠谱。
2、两者编译平台一个是CCS，一个是KEIL，对通用语句的优化，有待商榷。
3、ARM和TI的数学库中，各自支持的运算种类不一样。

已赞过 已踩过<

评论收起

意法半导体(中国)投资有限公司
2023-06-12 广告

STM32F103是一款高性能的嵌入式芯片，由意法半导体（STMicroelectronics）公司生产。它是STM32系列芯片之一，具有紧凑、低功耗、高性能等特点，被广泛应用于嵌入式系统中。STM32F103的主要特点包括：1. 集成了A... 点击进入详情页

本回答由意法半导体(中国)投资有限公司提供

pjj243347
2017-12-03

知道答主

回答量：1

采纳率：0%

帮助的人：927

我也去答题访问个人页

关注

展开全部

STM32F4会更好些，同时哈佛架构，但内部存储映射 arm是统一编制 DSP是分开的，所以理论上DSP运行要快，但要考虑你具体项目侧重点，是偏执与运算速度（335），还是硬件资源（STM32F4），或是开发速度(STM32F4)。还有就是芯片运行时的散热，335散热会高些，侧重与工业，STM32更侧重与消费电子与物联网

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

替换stm32f103c8t6-国民技术单片机正品现货、技术支持、样品

国民技术授权代理商绿都电子，为您提供国民技术N32L406系列低功耗单片机，基于Arm M4F内核，高性能，超低功耗，内置LCD屏驱，集成丰富的接口和模拟外设，适用于超低功耗产品应用

www.szlvdu.com广告

proteus仿真设计51/STM32单片机

qianhu.wejianzhan.com广告

stm32f407原理图-4.0Turbo-国内入口

ppt生成、文本润色、翻译、文档阅读、写文案、写代码、写论文等API直连，集成12家知名企业大语言模型

chat.moshuai.co广告

stm32f407和tms320f28335的对比

您可能关注的内容

其他类似问题

为你推荐：