本文讲述了作者在过去一年中开发AI视频编辑器的经历和收获。作者最初致力于构建一个本地化的、多模态AI驱动的视频编辑器,利用计算机视觉和扩散模型来增强视频编辑能力。然而,一系列当地交通事故的发生促使作者转向研究利用AI和机器人技术提高道路安全的项目,但最终未能获得资金支持。作者回归视频编辑器开发,反思了AI与现有视频编辑流程的整合问题,并提出了将视频编辑过程转变为视频生成过程的构想,探索利用LLM、多模态嵌入和计算机视觉技术打造更具个性化、交互性和动态性的视频体验。作者还分享了在使用Promptflow、Temporal、LLM等工具和技术时所面临的挑战和经验教训,并强调了新事物构建过程中的艰辛和不可预测性。