MIT研究人员推进AI模型的可解释性自动化

2024-07-24

麻省理工学院计算机科学与人工智能实验室的研究人员开发了一种名为“MAIA”的多模式自动化可解释性代理系统,该系统可以使用视觉语言模型来自动执行各种神经网络可解释性任务。MAIA可以通过生成假设、设计实验来测试假设,并通过迭代分析改进其理解,从而解释人工智能模型的内部机制,帮助我们了解人工智能模型如何运作,并 audit 其安全性和偏差。

未分类