告别Matlab仿真：手把手教你用C语言在STM32上实现实时数字滤波（附完整代码）

weixin_30896511

369人浏览 · 2026-06-06 11:17:56

weixin_30896511 · 2026-06-06 11:17:56 发布

STM32实战：从零构建实时数字滤波系统的C语言实现指南

在嵌入式开发领域，实时信号处理一直是工程师面临的挑战之一。传统Matlab仿真虽然能验证算法，但将理论转化为能在资源受限的MCU上高效运行的代码，需要跨越理论与实践的鸿沟。本文将带你深入理解如何在STM32平台上，用纯C语言实现专业级的数字滤波系统。

1. 嵌入式数字滤波的核心挑战

与PC环境不同，嵌入式实时滤波面临三大核心难题： 计算资源受限 、 时序严格 和 内存瓶颈 。在STM32F4系列芯片上，主频通常不超过180MHz，而处理一个采样点的时间窗口可能仅有几十微秒。

典型传感器信号特征对比表 ：

信号类型	典型频率范围	常见干扰源	推荐滤波器类型
心电信号(ECG)	0.5-100Hz	50/60Hz工频	带阻+低通
肌电信号(EMG)	20-500Hz	运动伪影	高通+陷波
加速度计信号	0-200Hz	高频噪声	低通滤波

提示：选择截止频率时，应比目标信号最高频率至少高出20%，避免有效信号衰减

2. 滤波器设计：从理论到C代码

2.1 一阶IIR滤波器的实现奥秘

一阶滤波器是嵌入式系统的首选，因其计算量小且容易定点化。其差分方程为：

// 一阶低通滤波器实现
float first_order_lpf(float input, float *prev_output, float alpha) {
    float output = alpha * input + (1 - alpha) * (*prev_output);
    *prev_output = output;
    return output;
}

关键参数α的计算公式：

α = 2πfcTs / (2πfcTs + 1)

其中fc为截止频率，Ts为采样周期。在STM32中，为避免浮点运算，通常采用Q格式定点数：

// 定点数版本(使用Q15格式)
int16_t first_order_lpf_fixed(int16_t input, int16_t *prev_output, int16_t alpha_q15) {
    int32_t tmp = (int32_t)alpha_q15 * input + 
                 (32767 - alpha_q15) * (*prev_output);
    *prev_output = (int16_t)(tmp >> 15);
    return *prev_output;
}

2.2 高阶滤波器实现技巧

虽然高阶滤波器效果更好，但直接型实现会导致数值不稳定。推荐采用 二阶节串联 结构：

typedef struct {
    float b0, b1, b2; // 分子系数
    float a1, a2;     // 分母系数
    float x1, x2;     // 输入延迟线
    float y1, y2;     // 输出延迟线
} BiquadSection;

float biquad_filter(float input, BiquadSection *section) {
    float output = section->b0 * input + section->b1 * section->x1 + 
                  section->b2 * section->x2 - section->a1 * section->y1 - 
                  section->a2 * section->y2;
    
    // 更新延迟线
    section->x2 = section->x1;
    section->x1 = input;
    section->y2 = section->y1;
    section->y1 = output;
    
    return output;
}

多阶滤波器串联时的注意事项 ：

各节增益需适当分配，避免中间结果溢出
建议先高通后低通的串联顺序
每节的Q值应差异化设置

3. STM32上的优化实践

3.1 内存管理策略

在资源受限环境下，推荐采用 环形缓冲区 管理采样数据：

#define BUF_SIZE 64
typedef struct {
    float data[BUF_SIZE];
    uint16_t head;
    uint16_t tail;
} CircularBuffer;

void push_sample(CircularBuffer *buf, float sample) {
    buf->data[buf->head] = sample;
    buf->head = (buf->head + 1) % BUF_SIZE;
    if(buf->head == buf->tail) {
        buf->tail = (buf->tail + 1) % BUF_SIZE; // 溢出处理
    }
}

float get_prev_sample(CircularBuffer *buf, uint16_t delay) {
    uint16_t idx = (buf->head - delay + BUF_SIZE) % BUF_SIZE;
    return buf->data[idx];
}

3.2 定时器触发ADC的配置

精确的采样时序对滤波效果至关重要。以下为STM32CubeMX配置要点：

启用TIM2作为触发源，设置ARR寄存器决定采样率
配置ADC为定时器触发模式
开启DMA传输到内存
设置合理的中断优先级

典型配置代码片段 ：

// 定时器初始化
htim2.Instance = TIM2;
htim2.Init.Prescaler = 84-1; // 84MHz/84 = 1MHz
htim2.Init.CounterMode = TIM_COUNTERMODE_UP;
htim2.Init.Period = 1000-1; // 1kHz采样率
htim2.Init.ClockDivision = TIM_CLOCKDIVISION_DIV1;
HAL_TIM_Base_Init(&htim2);

// ADC配置
hadc1.Instance = ADC1;
hadc1.Init.ClockPrescaler = ADC_CLOCK_SYNC_PCLK_DIV4;
hadc1.Init.Resolution = ADC_RESOLUTION_12B;
hadc1.Init.ExternalTrigConv = ADC_EXTERNALTRIGCONV_T2_TRGO;

4. 实战：心电信号处理完整方案

4.1 信号链设计

前置放大：仪表放大器(INA128)
高通滤波(0.5Hz)去除基线漂移
50Hz陷波消除工频干扰
低通滤波(100Hz)抑制高频噪声
后级放大适配ADC量程

4.2 陷波滤波器实现

双二阶陷波滤波器是处理工频干扰的理想选择：

void setup_notch_filter(BiquadSection *section, float center_freq, 
                       float sample_rate, float Q) {
    float omega = 2 * PI * center_freq / sample_rate;
    float alpha = sin(omega) / (2 * Q);
    
    section->b0 = 1;
    section->b1 = -2 * cos(omega);
    section->b2 = 1;
    section->a0 = 1 + alpha;
    section->a1 = -2 * cos(omega);
    section->a2 = 1 - alpha;
    
    // 归一化
    section->b0 /= section->a0;
    section->b1 /= section->a0;
    section->b2 /= section->a0;
    section->a1 /= section->a0;
    section->a2 /= section->a0;
}

4.3 动态阈值检测算法

经过滤波后的信号，可通过以下算法检测QRS波：

#define WINDOW_SIZE 20
float detect_qrs(float sample, CircularBuffer *buf) {
    static float threshold = 0;
    static float peak = 0;
    
    push_sample(buf, sample);
    
    // 计算滑动窗口均值
    float mean = 0;
    for(int i=0; i<WINDOW_SIZE; i++) {
        mean += get_prev_sample(buf, i);
    }
    mean /= WINDOW_SIZE;
    
    // 更新阈值
    float diff = fabs(sample - mean);
    threshold = 0.9 * threshold + 0.1 * diff * 3;
    
    // 峰值检测
    if(diff > threshold && diff > peak) {
        peak = diff;
        return 1.0; // 检测到QRS波
    } else {
        peak *= 0.95;
        return 0.0;
    }
}

5. 调试与性能优化技巧

5.1 实时波形监控

通过SWO或USART输出数据，配合Python可视化：

import serial
import matplotlib.pyplot as plt

ser = serial.Serial('COM3', 115200)
plt.ion()
fig, ax = plt.subplots()
data = []

while True:
    line = ser.readline().decode().strip()
    try:
        data.append(float(line))
        if len(data) > 500:
            data.pop(0)
        ax.clear()
        ax.plot(data)
        plt.pause(0.01)
    except:
        pass

5.2 计算性能优化

DSP指令加速 ：STM32F4系列支持ARM DSP指令集，可将滤波速度提升5倍：

#include "arm_math.h"

void arm_biquad_cascade_df1_f32(
    const arm_biquad_casd_df1_inst_f32 *S,
    float32_t *pSrc,
    float32_t *pDst,
    uint32_t blockSize
);

// 初始化滤波器实例
arm_biquad_casd_df1_inst_f32 filter;
float coeffs[5*NUM_SECTIONS]; // 存储所有二阶节系数
arm_biquad_cascade_df1_init_f32(&filter, NUM_SECTIONS, coeffs, state);

内存优化技巧 ：

将滤波器系数声明为const，分配到Flash
使用__attribute__((aligned(4)))确保DMA访问对齐
启用CPU缓存和预取功能

6. 进阶：自适应滤波实现

对于非平稳信号，固定参数的滤波器可能效果不佳。LMS自适应算法可在运行时调整系数：

#define FILTER_ORDER 4
float lms_filter(float input, float desired, float *weights, float mu) {
    static float x[FILTER_ORDER+1] = {0};
    float y = 0;
    
    // 更新延迟线
    for(int i=FILTER_ORDER; i>0; i--) {
        x[i] = x[i-1];
    }
    x[0] = input;
    
    // 计算输出
    for(int i=0; i<=FILTER_ORDER; i++) {
        y += weights[i] * x[i];
    }
    
    // 更新权值
    float error = desired - y;
    for(int i=0; i<=FILTER_ORDER; i++) {
        weights[i] += mu * error * x[i];
    }
    
    return y;
}

在实际ECG应用中，可将R波检测后的稳定段作为期望信号，噪声段作为输入，自动学习最优滤波参数。

AI硬件创业社区

智能硬件社区聚焦AI智能硬件技术生态，汇聚嵌入式AI、物联网硬件开发者，打造交流分享平台，同步全国赛事资讯、开展 OPC 核心人才招募，助力技术落地与开发者成长。

更多推荐

洛谷 B4553：[GESP202606 二级] 完全平方数计数

算法原理很简单：令 a = floor(sqrt(le-1))，表示小于 le的最大完全平方数的平方根。令 b = floor(sqrt(ri))，表示不大于 ri的最大完全平方数的平方根。则区间内的完全平方数个数 = b - a。

AI硬件创业社区

STM32 HRTIM | 原理、HAL 库、DMA 同步与高频 PWM

……

AI硬件创业社区

三、如何在zephyr上使用串口进行输出与输入（含dma与中断方式）

本文展示了在STM32H7系列开发板上实现UART通信的两种方式：中断方式和DMA方式。中断方式通过环形缓冲区和消息队列实现高效数据收发，测试结果显示能够稳定进行收发回环测试，代码示例包含中断服务函数、数据发送函数和初始化流程。DMA方式则利用双缓冲技术解决缓存一致性问题，通过异步事件回调处理接收数据，显著降低CPU占用率。两种方法均针对STM32H7系列特性进行了优化，其中DMA方式特别处理了D