STM32H750 + LWIP 调试血泪记录（从 3M → 50M）

zhuzhu、

126人浏览 · 2026-07-01 11:52:22

zhuzhu、 · 2026-07-01 11:52:22 发布

一开始我还以为是 lwIP 的锅。

TCP window 调了、mem pool 调了、pbuf 调了、cache 搞了、DMA 描述符也重构了，甚至 TX 还做了 copy buffer。

结果：

👉 3Mbps → 7Mbps，没本质变化。

关键转折点

后来换了个思路：

把外部 XIP（100M NOR Flash）直接关掉，改成内部 ROM 跑代码。

结果很离谱：

👉 直接 50Mbps

而且：

lwIP 基本没再怎么动
零拷贝还在
DMA 还在
cache 还在
ITCM 热点优化也还在

真正的问题

不是 lwIP，不是 DMA，也不是 TCP。

是 XIP + cache + flash 访问模式。

H750 + 外部 NOR Flash（100MHz）的问题：

开 I-cache 之后，理论上应该还行。

但实际是：

预取 miss 很严重
instruction fetch 卡顿
pipeline 被 flash latency 打断

结果就是：

👉 TCP send_more 不是算不过来
👉 是 CPU 在“等指令”

最坑的一点

ST 文档说：

XIP 性能只下降 10%+

这个在“理想 cache 命中”情况下是对的。

但现实是：

👉 一旦预取/branch miss 多一点
👉 性能直接掉一大截

不是线性的，是断崖式的

对比很明显

❌ 外部 XIP（100M NOR Flash）

lwIP 已经优化完
DMA 正常
cache 开了
零拷贝也做了

👉 结果：3~7Mbps

✔ 内部 ROM

啥都没变：

lwIP
DMA
pbuf
TCP window
cache

👉 直接 50Mbps

最后结论很简单

很多人调 lwIP，其实调错层了：

不是网络慢，是 CPU 在 XIP 上“卡指令”

补一句更真实的感受

H750 这个东西：

做通信没问题
DMA 很强
ETH 很稳

但你一旦：

👉 把代码跑在外部 NOR XIP 上

整个系统就会变成：

“看起来都对，但就是跑不满”

经验总结

lwIP 不是瓶颈（大部分时候）
DMA 也不是瓶颈
TCP 也不是瓶颈
cache 也不是主要问题

真正杀性能的：

👉 指令执行路径（XIP + flash latency + miss）

AI硬件创业社区

智能硬件社区聚焦AI智能硬件技术生态，汇聚嵌入式AI、物联网硬件开发者，打造交流分享平台，同步全国赛事资讯、开展 OPC 核心人才招募，助力技术落地与开发者成长。

更多推荐

基于STM32单片机的智能家居语音识别控制系统语音互动2 (设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）

当前温湿度语音播报：“当前温度XX摄氏度”，“湿度百分之XX”关闭电机：步进电机反转关闭窗帘/晾衣架,语音播报“电机已关闭”关闭所有设备：直接关闭所有设备,语音播报“已关闭所有设备”关闭电视：继电器断开表示关闭电视，语音播报“电视已关闭”窗帘/晾衣架控制+开灯+空调+电视+自动模式+手动模式。开灯：打开白色LED照明指示灯，语音播报：“灯已打开”关灯：关闭白色LED照明指示灯，语音播报：“灯已关

AI硬件创业社区

基于STM32单片机的 CO浓度检测一氧化碳可燃报警器监测系统2(设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）

基于STM32单片机的 CO浓度检测一氧化碳可燃报警器监测系统2(设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）当CO浓度大于我们设置上限时，蜂鸣器进行声光报警。当CO浓度大于我们设置上限时，蜂鸣器进行声光报警。报警的时候继电器闭合开启风扇排烟降低浓度。LCD1602液晶显示当前CO浓度值。LCD1602液晶显示当前CO浓度值。STM32单片机进行数据处理。STM32单片机进行数

AI硬件创业社区

基于51/STM32单片机的智能垃圾桶语音识别控制垃圾分类2(设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）

基于51/STM32单片机的智能垃圾桶语音识别控制垃圾分类2(设计源文件+万字报告+讲解)（支持资料、图片参考_降重降ai）“可回收垃圾”：书本纸盒，罐头塑料，镜子铁锅，鞋子玩偶。“厨余垃圾”：剩菜剩饭，鸡蛋骨头，萝卜青菜，瓜果果皮。“有害垃圾”：电池灯泡，油漆发胶，酒精水银，农药彩笔。“其他垃圾”：砖瓦陶瓷，花盆海绵，马桶扫把，筷子渣土。上电后LD3322语音播报：“欢迎使用智能垃圾桶，会直