边缘AI推理:从软件到硬件加速的探索
本文深入探讨了在资源受限的微控制器上运行AI模型进行推理的挑战与机遇。作者从TensorFlow Lite Micro的运作机制出发,详细分析了加法运算符的软件实现和基于ARM架构扩展的硬件加速方案,并介绍了利用Arm Ethos-U NPU进行模型加速的流程。文章揭示了不同硬件架构对AI推理性能的影响,以及如何通过软件和硬件协同优化来提升效率。
阅读更多
本文深入探讨了在资源受限的微控制器上运行AI模型进行推理的挑战与机遇。作者从TensorFlow Lite Micro的运作机制出发,详细分析了加法运算符的软件实现和基于ARM架构扩展的硬件加速方案,并介绍了利用Arm Ethos-U NPU进行模型加速的流程。文章揭示了不同硬件架构对AI推理性能的影响,以及如何通过软件和硬件协同优化来提升效率。
阅读更多
作者使用RAK5010开发板,尝试访问板载Quectel BG95-M3模块的USB接口,该接口提供了三个串口。通过查阅原理图,作者找到了需要改动的四个电阻。经过一番细致的焊接操作(过程中还发生了一个小插曲:一个电阻不慎丢失),作者成功地将USB数据线连接到BG95-M3模块。最终,作者成功地通过USB直接与调制解调器通信,解锁了三个串口。
阅读更多
本文讲述了作者在资源受限的Nordic Semiconductor nRF9151 MCU上运行Thingy:91 X的Wi-Fi站模式的经历。由于nRF9151的RAM仅为256KB,而Wi-Fi驱动程序需要大量资源,作者面临巨大挑战。通过禁用nrf_modem_lib以及巧妙地运用overlay文件和devicetree配置,最终成功连接到Wi-Fi网络,但RAM利用率高达99%。文章详细分析了过程中遇到的问题,包括驱动程序资源消耗、补丁加载方式以及socket创建等细节,并提供了解决方法,对嵌入式开发人员具有参考价值。
阅读更多
Nordic Semiconductor 推出了其首款 RISC-V 处理器 VPR,集成于最新的 nRF54H 和 nRF54L 系列 SoC 中。VPR 是一款 RV32EMC 处理器,运行速度高达 320MHz,主要用于软件定义外设。文章详细介绍了 VPR 的架构、初始化过程以及与 Arm Cortex-M33 处理器的协同工作机制。通过 Zephyr 系统的 sysbuild 功能,可以轻松构建和部署 VPR 应用,实现异构计算,提升性能和功能。
阅读更多
本文作者Daniel Mangum详细介绍了如何在Bluesky上托管一个简单的网站。并非真正意义上的网站托管,而是利用了Bluesky的AT协议和个人数据服务器(PDS)的底层机制。文章解释了Bluesky的内容类型——记录和blobs,以及blobs如何被上传、引用和访问。作者通过一系列curl命令演示了如何上传一个HTML文件作为blob,创建一个自定义类型的记录来引用该blob,并最终通过PDS访问该HTML文件,从而实现在Bluesky上“托管”网站的效果。文章还探讨了这种做法的安全隐患以及Bluesky为缓解这些风险采取的措施,并展望了AT协议未来可能的应用场景,例如在帖子中嵌入可执行代码片段。
阅读更多
本文讲述了作者参加芝加哥马拉松比赛的经历,从最初设定目标到制定计划,再到比赛过程中的心理和生理挑战,最终以2小时55分34秒的成绩完成比赛。作者详细描述了比赛过程中的感受,包括对目标的怀疑、对成功的渴望、对失败的恐惧以及最终的喜悦和感激。作者还分享了比赛过程中的策略调整、补给安排以及与家人朋友的互动。
阅读更多