本文介绍了一种名为Iterative BC-Max的新技术,旨在通过改进内联决策来减小编译后二进制文件的大小。该技术通过解决精心设计的监督学习问题而不是使用不稳定且计算量大的强化学习算法来生成决策策略。与现有的强化学习算法相比,Iterative BC-Max具有多项优势,包括更少的编译器交互、对不可靠奖励信号的鲁棒性,以及只需解决二元分类问题。该技术通过迭代地编译程序语料库和学习新的编译策略,最终实现二进制文件大小的减小。实验结果表明,在搜索应用程序二进制文件上,Iterative BC-Max相比于进化策略基线实现了约1%的大小缩减。