一、毕设的痛点

毕设选型的真正困境不是"哪个平台参数更好",而是——预算就这么多,怎么用小钱办一件大事。

  • 第一个,钱。 有专业画质又有AI算力的硬件,树莓派没NPU,Jetson上千块,ESP32-CAM便宜但做不了AI。你需要的那个价位,刚好是个空白地带。

  • 第二个,环境。 国产开发板的SDK往往是个压缩包。交叉编译工具链配一周,依赖冲突再来一周——第一帧画面还没看到,时间已经没了。

  • 第三个,模型。 你会用Colab训YOLO,但从PyTorch到板子上能跑的.bin,中间要过ONNX→INT8量化→NPU编译。学校没教,教程碎片化,训三天、部署两周。

三个痛点指向同一个结论:在有限的预算和时间内,需要的不只是一块好板子,而是一条确定能走通的路。

二、推荐方向

选题是之后的另一个坎。题目太简单,老师觉得工作量不够。太难,怕做不完。太偏软件,不如纯算法方向的同学有竞争力。太偏硬件,调板子的时间比写论文还长。

可以尝试一个方向:做一台带AI检测的摄像头。

为什么这个方向值得考虑——

实用性强。 一台能自动检测人形、自动报警、自动推流到手机的摄像头,不是玩具——它就是一个能实际运转的智能设备。答辩的时候把它放桌上,人走过去自动画框,比PPT上跑几个Benchmark表有说服力得多。

  • 技术栈广。 一个完整的AI摄像头项目贯穿了嵌入式Linux、图像传感器原理、ISP成像管线、NPU推理部署、视频编码与网络传输——论文里每一章都有实际内容可写。对电子信息、自动化、物联网专业的学生来说,这些模块直接对应就业市场的核心技能树。

  • 方向灵活。 安防监控、门禁考勤、停车管理、消防预警、人流统计——你可以根据专业背景选最顺手的切入点,不需要从零定义应用场景。

  • 门槛可控。 你不用从零发明摄像头。你做的是系统集成和应用层——一块开发板、一颗Sensor、一个检测模型、一套业务逻辑。相比纯算法方向不需要卷SOTA精度,相比纯硬件方向不需要画PCB。

三、解题思路

回到开头那三个痛点。钱、环境、模型——它们的共同根源是:市面上没有一块在百元价位、同时把ISP和AI做好、而且软件环境拿来就能跑通的板子。

所以解题思路不是"多花点钱买更好的硬件",也不是"再多花两周配环境"。而是找到一个在预算内能同时解决这三个问题的平台——它得自带AI ISP(专业画质不依赖摄像头模组本身的ISP),自带NPU(AI推理不靠CPU硬算),自带训练好的模型(加载即用),自带能跑通的sample(不用配环境)。

ShiMetaPi Pico-G1就是这个思路的答案。

Pico-G1基于国科微GK7206V1系列芯片。根据ShiMeta官方产品文档,核心参数如下[1]:

重点讲ISP。市面上绝大多数百元级开发板没有硬件ISP。树莓派接USB摄像头,画质靠几十块的摄像头模组自研ISP处理——光线充足时还行,暗光下基本无能为力。Pico-G1搭载的AI ISP在这条固定硬件流水线的基础上,在关键节点引入了深度学习模块。

最关键的一个节点在Bayer Raw域。Bayer Raw是Sensor输出的最原始数据——每个像素只有R/G/B中的一个分量,尚未经过任何ISP处理。传统ISP的模块排列顺序是:Demosaic(把R/G/B插值为完整RGB)→白平衡→色彩校正→降噪。降噪排在最后——它面对的数据已经被Demosaic插值和白平衡增益"污染"过,噪声从原始的泊松+高斯混合分布变成了三个通道互相耦合的非线性分布。暗光场景中,这种"先污染后清洗"的策略很难维持彩色输出的信噪比。

AI ISP把这个顺序倒过来了。Pico-G1的AI_NR模块在Bayer Raw域——信息最完整、噪声分布最规整的阶段——用深度学习做降噪,处理完毕的干净Raw数据再送入硬件ISP完成后续流程。这不是"早做还是晚做"的习惯问题,这是信息不可逆丧失的物理约束。

四、以黑光全彩为例,拆解AI ISP的底层逻辑

黑光全彩是检验AI ISP能力的最极端场景。环境照度0.0001 Lux——比星光还暗一个数量级——Sensor接收到的光子数逼近读出噪声量级,传统方案被迫切换红外模式、打开补光灯、输出黑白画面。

但AI_NR换了个位置打。根据AI_NR技术文档[2],AI_NR的核心架构是"大模型蒸馏+小模型微调":在云端用海量Sensor噪声样本训练一个通用降噪大模型(Teacher),充分学习各类噪声的统计分布规律;然后将这些知识蒸馏到一个轻量端侧模型(Student)中,在NPU上实时运行。这种策略让轻量模型继承了通用大模型的降噪能力,同时保持了端侧可运行的计算量级。

具体到Pico-G1上,AI_NR消耗NPU约0.5T算力,支持4M分辨率@15fps实时处理。信噪比提升8dB+,在0.0001 Lux极暗环境下输出彩色画面,无需红外补光灯。其余0.5T NPU可并行运行人形检测、人脸识别等AI推理——夜间彩色画面和AI检测同时在线。

AI_NR的完整部署流程包含六个阶段[2]:数据预处理(采集及蒸馏生成Noisy-Clean训练数据对)→浮点模型微调(两阶段训练,建议60+ epoch)→浮点推理验证→量化模型微调(INT8量化)→量化推理验证→TVM编译部署为.xmm模型文件。这条工具链的核心价值在于可复现、可量产——不是"拿着默认模型用"的封闭方案,开发者可以针对自己的Sensor重新走完整条链路。

不只能做黑光。2F-WDR双帧合成在隧道口和逆光场景避免过曝和死黑,3DNR利用时域信息在视频流中抑制随机噪声,LDC校正广角镜头的桶形畸变——这些模块和AI_NR共享同一个NPU引擎。Pico-G1的产品文档[1]明确将其定位为"助力客户实现低成本黑光解决方案",同时覆盖单目枪机、球机、双目枪球、长短焦、广角拼接等多种产品形态。理解AI ISP最好的方式不是把它看作一个"夜间增强功能",而是看作所有视觉任务的底层画质基准。

五、配套训练平台即将上线

内置模型够不够用,是一个自然的疑问。Pico-G1的SVP框架提供了8个已训练模型——人形、人脸、车辆、宠物、烟火、包裹、人头、非机动车检测,加载即用,每个都能独立撑起一个方向。如果这些模型覆盖了你的场景,不需要碰训练代码。

但如果你想做更定制的事,即将开放的云端NPU微调平台把模型部署链路由手动变成自动:上传少量标注图片,云端完成训练、量化、编译,下载.bin文件拷到板子上直接跑。不需要手动处理ONNX兼容性、量化精度损失、NPU算子适配。

AI摄像头是一个值得认真考虑的毕设方向。过去被钱、环境和模型部署挡着,现在三个门槛各有一个解法。了解更多产品详情及SDK文档,请关注ShiMetaPi官方渠道。


参考资料:

[1] ShiMeta-Pico-G1芯片与硬件平台介绍文档(01 芯片与硬件平台介绍.docx),ShiMeta官方产品文档

[2] AI降噪(AI_NR)技术文档(04 AI降噪 (AI_NR).docx),ShiMeta官方技术文档。

Logo

智能硬件社区聚焦AI智能硬件技术生态,汇聚嵌入式AI、物联网硬件开发者,打造交流分享平台,同步全国赛事资讯、开展 OPC 核心人才招募,助力技术落地与开发者成长。

更多推荐