正在阅读：麻省理工发明漏洞自动修复系统CodePhage麻省理工发明漏洞自动修复系统CodePhage

2015-07-02 12:33 出处：其他作者：MIT News 责任编辑：shengyongzhen

　　在本月计算机协会编程语言设计与实现会议上（Association for Computing Machinery's Programming Language Design and Implementation），MIT麻省理工学院的研究人员展示了一个能够通过导入其他安全应用程序以自动修复漏洞的软件系统。

chang

　　漏洞自动修复系统：CodePhage

　　CodePhage在自动“借用”其他程序的功能时并不需要获取源代码。因此，被导入程序（即Donor捐献者，后文简称D）的开发语言并不重要。一旦用于修复的代码导入至有漏洞的应用程序（即Recipient接收者，简称R）中，CodePhage便可以提供一个更深层的分析，以确保漏洞被修复。

　　MIT计算机科学与人工智能实验室（CSAIL）CodePhage开发负责人Stelios Sidiroglou-Douskos表示，“在开源库中，我们有来自数以百万计的项目以及大量规范相似的项目的源代码可供使用。随着时间的推移，你需要做的就是从这些项目中获取最好最合适的组件来构建CodePhage系统。”

　　开始分析时，CodePhage需要两个样本值输入：一个会造成 R 崩溃，另一个则不会。一个称为DIODE的漏洞定位程序可自动生成引起崩溃（crash-inducing）输入。但用户仅仅认为是打开了一个特定文件而引发的崩溃事故。

　　系统运行过程

　　首先，CodePhage为 D 提供了一个不会引起崩溃的“安全”输入。然后跟踪 D 的执行操纵序列并使用符号表达式记录下它们，这里的符号表达式（symbolic expression，简称SE）是一串描述操作系统施加的逻辑约束符号。

　　在某些情况下，比如可能会检测 D 的输入是否小于某个阈值。如果结果是小于的，CodePhage将添加一个 SE 术语来表示该情况低于阈值。这里并不记录文件的实际大小，仅仅是通过检测施加限制约束。

　　接下来，CodePhage为 D 提供一个引起崩溃的输入。它再一次构建了一个SE来代表 D 执行的操作程序。但是当新的SE从旧的当中分离出时，CodePhage会中断其过程。这一偏差（divergence）就是了安全输入会遇到的约束而引起崩溃的输入不会遇见。因此，这可能是R安全检测所缺失的部分。

　　然后CodePhage分析 R 程序以寻找大多数 SE 所限制输入的位置，但不是全部。R能以不同的顺序执行不同的操作，而非完全按照施者所做的，同时可以储存不同形式数据。在这个过程之后，SE 描述了数据的状态，而非过程本身。

　　在每个标识的位置，CodePhage能够不受大部分 SE 的约束——同样适用 R。从第一个位置开始，CodePhage将仍然留在 R 程序语言中的少量约束转化成新代码，并将其插入源代码中。然后再次运行引起崩溃输入。

　　如果程序可以运行，则新代码解决了这个问题。如果没有，CodePhage会移动到R的下一个候选位置。如果项目依旧崩溃，即使在CodePhage已经尝试修复了所有候选位置之后，它仍会重返 D 程序，并继续建立 SE，直至找到下一个偏差。

　　自动化的未来

　　研究人员在发现漏洞的DIODE七个常见开源项目中测试了CodePhage，每个从 D 导入了两个到四个数量不等的漏洞修复。在所有情况下，CodePhage均能够修复漏洞代码，并且每个修复只需要二到十分钟时间。

　　安全检测占据了现代商业软件80%甚至更多的代码。研究者希望未来CodePhage的版本中可以实现自动检查并插入系统，从而大大减少软件开发者花费在繁重工作中的时间，解放程序员。

　　开发者之语

　　MIT计算机科学与工程教授Martin Rinard说，“未来的愿景是，你再也不需要写一段别人曾写过的代码。这个系统能够发现代码，并无论是何种代码都能自动把它们连在一起，让你的程序运行起来。借用另一个具有相似功能程序代码的技巧，并且用来修复一个基本上已经坏掉的程序，这是非常酷的过程。说实话，我很惊讶它竟然能够运行。”

　　Berger最后解释说，“施者程序并不是相同的人写的。他们有不同的编码标准；对变量的命名也不同；使用完全不同的变量；这些变量可以是本地的；或者是更高的堆栈。CodePhage能够识别这些链接，并判断‘这些变量与这些变量有关联’。与器官捐赠相似，通过遗传密码的转移让个体更完美。它的工作原理及最终成果真的很令人惊讶，这非常酷。”