path: root/design.html



<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="generator" content="Docutils 0.10: http://docutils.sourceforge.net/" />
<title>Sonsi: Stupid and Obvious Non-recursive Scheme Interpreter</title>
<style type="text/css">

/*
:Author: David Goodger ([email protected])
:Id: $Id: html4css1.css 7514 2012-09-14 14:27:12Z milde $
:Copyright: This stylesheet has been placed in the public domain.

Default cascading style sheet for the HTML output of Docutils.

See http://docutils.sf.net/docs/howto/html-stylesheets.html for how to
customize this style sheet.
*/

/* used to remove borders from tables and images */
.borderless, table.borderless td, table.borderless th {
  border: 0 }

table.borderless td, table.borderless th {
  /* Override padding for "table.docutils td" with "! important".
     The right padding separates the table cells. */
  padding: 0 0.5em 0 0 ! important }

.first {
  /* Override more specific margin styles with "! important". */
  margin-top: 0 ! important }

.last, .with-subtitle {
  margin-bottom: 0 ! important }

.hidden {
  display: none }

a.toc-backref {
  text-decoration: none ;
  color: black }

blockquote.epigraph {
  margin: 2em 5em ; }

dl.docutils dd {
  margin-bottom: 0.5em }

object[type="image/svg+xml"], object[type="application/x-shockwave-flash"] {
  overflow: hidden;
}

/* Uncomment (and remove this text!) to get bold-faced definition list terms
dl.docutils dt {
  font-weight: bold }
*/

div.abstract {
  margin: 2em 5em }

div.abstract p.topic-title {
  font-weight: bold ;
  text-align: center }

div.admonition, div.attention, div.caution, div.danger, div.error,
div.hint, div.important, div.note, div.tip, div.warning {
  margin: 2em ;
  border: medium outset ;
  padding: 1em }

div.admonition p.admonition-title, div.hint p.admonition-title,
div.important p.admonition-title, div.note p.admonition-title,
div.tip p.admonition-title {
  font-weight: bold ;
  font-family: sans-serif }

div.attention p.admonition-title, div.caution p.admonition-title,
div.danger p.admonition-title, div.error p.admonition-title,
div.warning p.admonition-title, .code .error {
  color: red ;
  font-weight: bold ;
  font-family: sans-serif }

/* Uncomment (and remove this text!) to get reduced vertical space in
   compound paragraphs.
div.compound .compound-first, div.compound .compound-middle {
  margin-bottom: 0.5em }

div.compound .compound-last, div.compound .compound-middle {
  margin-top: 0.5em }
*/

div.dedication {
  margin: 2em 5em ;
  text-align: center ;
  font-style: italic }

div.dedication p.topic-title {
  font-weight: bold ;
  font-style: normal }

div.figure {
  margin-left: 2em ;
  margin-right: 2em }

div.footer, div.header {
  clear: both;
  font-size: smaller }

div.line-block {
  display: block ;
  margin-top: 1em ;
  margin-bottom: 1em }

div.line-block div.line-block {
  margin-top: 0 ;
  margin-bottom: 0 ;
  margin-left: 1.5em }

div.sidebar {
  margin: 0 0 0.5em 1em ;
  border: medium outset ;
  padding: 1em ;
  background-color: #ffffee ;
  width: 40% ;
  float: right ;
  clear: right }

div.sidebar p.rubric {
  font-family: sans-serif ;
  font-size: medium }

div.system-messages {
  margin: 5em }

div.system-messages h1 {
  color: red }

div.system-message {
  border: medium outset ;
  padding: 1em }

div.system-message p.system-message-title {
  color: red ;
  font-weight: bold }

div.topic {
  margin: 2em }

h1.section-subtitle, h2.section-subtitle, h3.section-subtitle,
h4.section-subtitle, h5.section-subtitle, h6.section-subtitle {
  margin-top: 0.4em }

h1.title {
  text-align: center }

h2.subtitle {
  text-align: center }

hr.docutils {
  width: 75% }

img.align-left, .figure.align-left, object.align-left {
  clear: left ;
  float: left ;
  margin-right: 1em }

img.align-right, .figure.align-right, object.align-right {
  clear: right ;
  float: right ;
  margin-left: 1em }

img.align-center, .figure.align-center, object.align-center {
  display: block;
  margin-left: auto;
  margin-right: auto;
}

.align-left {
  text-align: left }

.align-center {
  clear: both ;
  text-align: center }

.align-right {
  text-align: right }

/* reset inner alignment in figures */
div.align-right {
  text-align: inherit }

/* div.align-center * { */
/*   text-align: left } */

ol.simple, ul.simple {
  margin-bottom: 1em }

ol.arabic {
  list-style: decimal }

ol.loweralpha {
  list-style: lower-alpha }

ol.upperalpha {
  list-style: upper-alpha }

ol.lowerroman {
  list-style: lower-roman }

ol.upperroman {
  list-style: upper-roman }

p.attribution {
  text-align: right ;
  margin-left: 50% }

p.caption {
  font-style: italic }

p.credits {
  font-style: italic ;
  font-size: smaller }

p.label {
  white-space: nowrap }

p.rubric {
  font-weight: bold ;
  font-size: larger ;
  color: maroon ;
  text-align: center }

p.sidebar-title {
  font-family: sans-serif ;
  font-weight: bold ;
  font-size: larger }

p.sidebar-subtitle {
  font-family: sans-serif ;
  font-weight: bold }

p.topic-title {
  font-weight: bold }

pre.address {
  margin-bottom: 0 ;
  margin-top: 0 ;
  font: inherit }

pre.literal-block, pre.doctest-block, pre.math, pre.code {
  margin-left: 2em ;
  margin-right: 2em }

pre.code .ln { color: grey; } /* line numbers */
pre.code, code { background-color: #eeeeee }
pre.code .comment, code .comment { color: #5C6576 }
pre.code .keyword, code .keyword { color: #3B0D06; font-weight: bold }
pre.code .literal.string, code .literal.string { color: #0C5404 }
pre.code .name.builtin, code .name.builtin { color: #352B84 }
pre.code .deleted, code .deleted { background-color: #DEB0A1}
pre.code .inserted, code .inserted { background-color: #A3D289}

span.classifier {
  font-family: sans-serif ;
  font-style: oblique }

span.classifier-delimiter {
  font-family: sans-serif ;
  font-weight: bold }

span.interpreted {
  font-family: sans-serif }

span.option {
  white-space: nowrap }

span.pre {
  white-space: pre }

span.problematic {
  color: red }

span.section-subtitle {
  /* font-size relative to parent (h1..h6 element) */
  font-size: 80% }

table.citation {
  border-left: solid 1px gray;
  margin-left: 1px }

table.docinfo {
  margin: 2em 4em }

table.docutils {
  margin-top: 0.5em ;
  margin-bottom: 0.5em }

table.footnote {
  border-left: solid 1px black;
  margin-left: 1px }

table.docutils td, table.docutils th,
table.docinfo td, table.docinfo th {
  padding-left: 0.5em ;
  padding-right: 0.5em ;
  vertical-align: top }

table.docutils th.field-name, table.docinfo th.docinfo-name {
  font-weight: bold ;
  text-align: left ;
  white-space: nowrap ;
  padding-left: 0 }

h1 tt.docutils, h2 tt.docutils, h3 tt.docutils,
h4 tt.docutils, h5 tt.docutils, h6 tt.docutils {
  font-size: 100% }

ul.auto-toc {
  list-style-type: none }

</style>
</head>
<body>
<div class="document" id="sonsi-stupid-and-obvious-non-recursive-scheme-interpreter">
<h1 class="title">Sonsi: Stupid and Obvious Non-recursive Scheme Interpreter</h1>

<p>最终版的设计和特性</p>
<div class="section" id="model">
<h1>Model</h1>
<p>由于Scheme允许first-class procedures，我将所有参与求值的对象都抽象成 <tt class="docutils literal">EvalObj</tt> ，然后再从中派生出较为具体的子类：</p>
<ul class="simple">
<li>EvalObj<ul>
<li>BoolObj</li>
<li>CharObj</li>
<li>Container<ul>
<li>Continuation</li>
<li>Environment</li>
<li>OptObj</li>
<li>PromObj</li>
<li>Pair</li>
<li>VecObj</li>
</ul>
</li>
<li>NumObj</li>
<li>StrObj</li>
<li>SymObj</li>
<li>UnspecObj</li>
</ul>
</li>
</ul>
<p>其中OptObj描述了统一的算符接口，即s-expression中application的第一个的元素 <tt class="docutils literal">opt</tt></p>
<pre class="literal-block">
(opt arg_1, arg_2, arg_3 ... arg_n)
</pre>
<p>而OptObj又向下进行细分，有用户定义函数类 <tt class="docutils literal">ProcObj</tt> , 简单内置函数类 <tt class="docutils literal">BuiltinProcObj</tt> 以及特殊操作符类 <tt class="docutils literal">SpecialOptObj</tt> 。
三者各自实现 <tt class="docutils literal">OptObj</tt> 要求的界面</p>
<pre class="literal-block">
vrtual Pair *callPair *args, Environment * &amp;envt, Continuation * &amp;cont, EvalObj ** &amp;top_ptr, Pair *pc);
</pre>
<p>即根据求值器当前的状态以及传入的参数，计算出值后自行压栈，并返回下一步的PC(program counter)位置。
之所以不直接返回计算出的值，而是让类实现自行进行较为低层的入栈，是因为三个不同类型算符的特殊性。</p>
<p>像简单内置函数仅仅根据已经算好的各个参数计算出值，所以所有这类实现都是具有相同的routine，即传入参数，计算得值，再压回栈。因此没有必要从 <tt class="docutils literal">BuiltinProcObj</tt> 根据每个要实现的built-in procedure派生一个类，而是共同采用 <tt class="docutils literal">BuiltinProcObj</tt> 的壳子，装入不同的evaluation routine（类似回调函数）即可。所以繁琐的栈操作在 <tt class="docutils literal">BuiltinProcObj</tt> 实现后，每次提供一个evaluation routine就能生成一个解决相应计算任务的实例，非常方便。</p>
<p>而较为复杂的 <tt class="docutils literal">SpecialOptObj</tt> 则不同。例如 <tt class="docutils literal">if</tt> 语句的行为模式就与 <tt class="docutils literal">lambda</tt> 和 <tt class="docutils literal">define</tt> 存在不小的差异，而且与普通procedure不同，它们是built-in macros，这也就是将call函数接口设计得较为generic的原因。以 <tt class="docutils literal">if</tt> 举例，我从 <tt class="docutils literal">SpecialOptObj</tt> 派生出一个针对 <tt class="docutils literal">if</tt> 的类 <tt class="docutils literal">SpecialOptIf</tt> ，它的 <tt class="docutils literal">call</tt> 函数实现不再那么单纯。而是根据当前 <tt class="docutils literal">if</tt> 的执行阶段决定应该做什么。对 <tt class="docutils literal">if</tt> 而言，有三个可能的阶段：</p>
<ul class="simple">
<li>调用 <tt class="docutils literal">call</tt> 之前，屏蔽 &lt;consequence&gt; 和 &lt;alternative&gt; 的求值，只计算 &lt;condition&gt;</li>
<li>首次调用 <tt class="docutils literal">call</tt> ，即根据传入的已经计算完毕的 &lt;condition&gt; 决定是计算 &lt;consequence&gt; 还是 &lt;alternative&gt;</li>
<li>再次调用 <tt class="docutils literal">call</tt> ，求值器已经算好了答案，将其入栈即可。整个过程结束。</li>
</ul>
<p>为了能够让求值器按照 <tt class="docutils literal">if</tt> 的特殊行为模式运行，我们就需要将 <tt class="docutils literal">call</tt> 接口设计成上文所述的通用形式。继续下一阶段只需将栈顶 <tt class="docutils literal">if</tt> 恢复，并且将PC指向下一阶段的表达式入口。而如果要结束整个 <tt class="docutils literal">if</tt> 反复过程，则不需要恢复 <tt class="docutils literal">if</tt> , 读出返回地址，将结果入栈并且设PC为返回地址的下一条指令。</p>
<p>这种设计看上去有些繁琐，但事实上证明是有效而具备弹性的。例如我在实现一系列builin-procedure时，就不需要考虑这种入栈出栈的事情，因为它们的操作都是相同的，只是计算过程不同，所以只需编写相应的函数代入 <tt class="docutils literal">BuiltinProcObj</tt> 中即可。而实现像 <tt class="docutils literal">if</tt> 这种特殊的算符，有了generic的接口能够轻松地操作执行流程，虽然直接改动了求值器的流程，但是影响也是局部的。</p>
<p>值得注意的 <tt class="docutils literal">if</tt> 三部曲中有一个在调用 <tt class="docutils literal">call</tt> 之前的屏蔽操作。因为类似 <tt class="docutils literal">if</tt> 还有 <tt class="docutils literal">lambda</tt> 的 primitive-macro 并不是按照procedure的模式工作，而是有选择性地计算参数列表中的参数。关于这些的实现，我将在下面的Interpretation中详细阐述。</p>
</div>
<div class="section" id="interpretation">
<h1>Interpretation</h1>
<p>整个解释器的核心问题就是如何求值。按照实现上可以分为两种。</p>
<p>一种是开发快速，可读性好的递归实现。它的优点是代码简单，思路直接。实现方式就是扫描一个表达式，将相应的语法成分抽取出来，递归计算这些部分后再根据语义得出整个表达式的结果。它的优点有：</p>
<ul class="simple">
<li>设计障碍小，容易实现</li>
<li>在复杂表达的处理上较为轻松</li>
<li>直接按照BNF文法硬编码</li>
</ul>
<p>而缺点则是：</p>
<ul class="simple">
<li>受到实现语言的限制（栈大小等）</li>
<li>在Scheme递归调用足够深时，程序会因为栈空间不足而退出，难以恢复和继续运行（当然应该有机制能捕捉即将发生的栈溢出，不过的确不是特别好的方法）</li>
<li>花销较大，效率不可观。直接实现的最坏复杂度是Scheme表达式长度乘以递归深度，最坏是O(n^2)量级。</li>
</ul>
<p>因此在构建AST，求值过程以及外部表示（external representation）的生成中，我都采用非递归实现。值得一提的是之所以 external representation 要采取非递归实现，主要原因是circular structure的判定，例如下面的代码：</p>
<pre class="literal-block">
define x '(1 . 2))
(set-cdr! x x)
(display x)
</pre>
<p>可以看出x实际上是一个自我指涉的结构，不妨将其视作一个无限长的list。而采用非递归的实现能较为容易地检测这种情形：</p>
<pre class="literal-block">
execute: build/sonsi in.scm
output: (1 #inf#)
</pre>
<p>类似的情况还出现在</p>
<pre class="literal-block">
; Circular promise
(define ones (delay (cons 1 ones)))
(display (car (force ones)))
(display &quot;\n&quot;)

; Circular vector
(define x #(1))
(vector-set! x 0 x)
(display x)
(display &quot;\n&quot;)

; Indirectly circular pair
(define x '(1 . 2))
(define y (cons 1 x))
(define z (cons 1 y))
(define l (cons 1 z))
(set-car! x l)
(display x)
(display &quot;\n&quot;)
</pre>
<p>采用适当实现的sonsi均能产生正确的输出：</p>
<pre class="literal-block">
1
#(#inf#)
((1 1 1 #inf#) . 2)
</pre>
<p>非递归的AST解析过程较为简单，就不再赘述。这里重点介绍一下求值过程的设计。
在 <tt class="docutils literal">eval.cpp</tt> 中的函数 <tt class="docutils literal">run_repr</tt> 就是解释器的主要计算流程。可以看到是由一个while-loop反复进行栈操作实现的。
事实上，求值过程的实现略微带有VM（virtual machine)的味道，也就是说，设计一套byte-code，在把目前的实现中的一些操作加以细化，就能逐步改写成一个简单的compiler。由于这是第一次尝试完成这方面的工程，所以一开始就打算设计一个比较direct的interpreter。换而言之，虽然采用类似的结构，但是许多操作并没有被拆分成更为generic的基本指令。下文进行具体的阐释。</p>
<p>首先为了实现如同R5RS中所说的程序和数据同质化的效果，我直接使用了Scheme中的Pair来表示AST。这个实现有许多优点。
第一就是first-class procedure的实现便利。sonsi最初的实现是将 <tt class="docutils literal">opt</tt> 算符作为AST子树的根，而各个参数作为儿子结点。这样的确在结构上能够反映一个procedure的调用的形式。然而让人陷入困窘的是根不一定就是立即值，而可能也是一个需要通过计算得出的procedure。那么将算符和参数用这种父子关系来表示无疑增加了算符的特异性，在实现上需要各种特判来进行弥补。另一个显而易见的问题就是，用这种结构存储表示表达式不利于 <tt class="docutils literal">eval</tt> 的实现。 因此，最终我直接使用Pair构建的s-expression来表示AST。</p>
<p>其次是关于指令的问题。不像compiler能够直接将操作序列化，sonsi仅仅用在表达式上的结点地址来描述当前计算到的位置。即PC寄存器里存储的是一个 <tt class="docutils literal">Pair *</tt> 。在s-expression的每个结点存储一个 <tt class="docutils literal">next</tt> 域来指向下一条指令，在大多数情况下 <tt class="docutils literal">next == cdr</tt> ，而当 <tt class="docutils literal">cdr</tt> 是empty list时， <tt class="docutils literal">next</tt> 是 <tt class="docutils literal">NULL</tt> ，在特殊的语法结构，例如 <tt class="docutils literal">if</tt> 中，通过在执行时临时修改 <tt class="docutils literal">next</tt> 指针就能跳过相应参数的计算。 的确使用这个方式能够基本描述计算进行的状态，但并不充分。在 <tt class="docutils literal">if</tt> 执行过程中， <tt class="docutils literal">if</tt> 本身的执行的 <strong>阶段</strong> 也描述了计算的状态。这一点在compiler可以把 <tt class="docutils literal">if</tt> 拆分为更简单的指令，而在直接解释的实现中，我通过在Continuation中用 <tt class="docutils literal">Pair *state</tt> 记录当前call的阶段。 什么是Continuation呢？</p>
<p>Continuation类似与栈帧，记录Scheme中caller的状态，在call计算完成后，caller通过自身所处的Continuation能恢复出call发生前的envt，cont和pc寄存器的值。</p>
<p>Let's put them all together.</p>
<p>求值器拥有三个寄存器：</p>
<ul class="simple">
<li>envt 环境指针</li>
<li>cont 当前Continuation</li>
<li>pc program counter （当前指令位置）</li>
</ul>
<p>envt提供了从Symbol到相应值的正确映射，不同的Environment实例通过 <tt class="docutils literal">prev_envt</tt> 指针形成层级结构，并且从底而上地查询Symbol是否bound。这样局部变量能够产生shadow的效果，并且利用指针和GC，Environment层级结构能够节省大量空间。</p>
<p>cont指向当前的Continuation，而每个Continuation记录了：</p>
<ul class="simple">
<li>prev_cont 上一层调用 （父调用）</li>
<li>envt 进入调用前的envt寄存器值</li>
<li>pc 进入调用前pc寄存器的值</li>
<li>prog caller的AST根结点（方便 <tt class="docutils literal">if</tt> 等特殊算符解析参数）</li>
<li>tail true 表示当前call是可以尾递归优化的，并且已经执行到tail expression</li>
</ul>
<p>求值器拥有一个求值栈 <tt class="docutils literal">eval_stack</tt> （与Continuation串联形成的调用“栈”不同，这个是用来计算表达式的）</p>
<p>主循环 <tt class="docutils literal">while (cont == bcont)</tt> ，将一直进行，除非最低层的call已经退出。</p>
<ul class="simple">
<li>考察当前pc指向的AST结点<ul>
<li>pc 为 <tt class="docutils literal">NULL</tt><ul>
<li>说明对于当前call来说各个参数已经计算完毕</li>
<li>开始调用call，具体方法就是调用 <tt class="docutils literal">OptObj</tt> 的通用接口 <tt class="docutils literal">call</tt> 函数</li>
<li><tt class="docutils literal">call</tt> 函数借由多态性完成调用<ul>
<li>根据cont寄存器得到进入调用前的相关信息<ul>
<li>还有阶段没有完成：将pc设置为下一阶段的位置，更新 <tt class="docutils literal"><span class="pre">cont-&gt;state</span></tt></li>
<li>所有阶段完成：根据cont恢复寄存器，设置合适的pc值，将cont设置为prev_cont</li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
<li>pc 不为 <tt class="docutils literal">NULL</tt><ul>
<li>当前pc指向的是立即值：从envt中获取，或者直接使用</li>
<li>当前pc指向一个call：<ul>
<li>新建Continuation，保存当前执行状态(pc, envt, cont)，更新cont</li>
<li>调用prepare：供有些特殊语法（ <tt class="docutils literal">if</tt> , <tt class="docutils literal">lambda</tt> 等）重新设置 <tt class="docutils literal">next</tt> 指针实现部分参数的屏蔽</li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
</ul>
<p>具体实现请参考 <tt class="docutils literal">eval.cpp</tt> ， 关于用户自定义函数以及其闭包的实现请参考 <tt class="docutils literal">ProcObj</tt> 构造函数和其成员函数 <tt class="docutils literal">call</tt> 。</p>
</div>
<div class="section" id="garbage-collection">
<h1>Garbage Collection</h1>
<p>sonsi的垃圾回收采用引用计数的方式，并且能够对循环引用进行正确的处理。</p>
<p>GC的实现最初采取集中式的记录，即采用STL的map将 <tt class="docutils literal">EvalObj</tt> 的地址和计数关联，并且扫描出计数为0的 <tt class="docutils literal">EvalObj</tt> 予以释放。
首先每次进行GC时需要对整个map进行检查相当花费时间，我们没有必要这样做。
事实上，增加一个pending_list，每当有 <tt class="docutils literal">EvalObj</tt> 计数归0时，就加入pending_list，那么GC时只需扫描这个list即可。值得注意的是，pending_list只是记录了曾经计数一度减少到0的 <tt class="docutils literal">EvalObj</tt> ，而这不一定说明它现在一定就是零引用（虽然大多数情况是，否则这个实现就不能提高效率了）。因此，在GC时需要re-check每个list中的元素。</p>
<p>通过这个优化，我自己写的（比较臃肿低效的）同一段八皇后Scheme代码解释时间从7s降低到了2s。</p>
<p>通过gprof可以看出，程序时间花销的瓶颈出现在了频繁的attach和expose上，毕竟它们都是在map上进行的操作。</p>
<p>继续分析，不难发现其实不用采用集中式的记录。集中式记录相比分散的最大好处是对象本身不需要存储count，在并不是所有对象都需要GC时可以节约对象上维护GC信息的花销。然而在sonsi中，每一个 <tt class="docutils literal">EvalObj</tt> 都需要在GC中拥有相应的条目，所以不妨直接改造 <tt class="docutils literal">EvalObj</tt> 结构，加入一个 <tt class="docutils literal">GCRecord *gc_rec</tt> 域，指向对应的GC信息。这样就可以把集中式的map去掉，转化为利用内存寻址完成map本来要做的事情。这样就可以在较小的常数时间内对一个 <tt class="docutils literal">EvalObj</tt> 的count进行操作。</p>
<p>这样还剩下最后一个问题——循环引用的解决。在sonsi的实现中，函数闭包会直接产生一个循环引用：即一个函数 <tt class="docutils literal">ProcObj</tt> 依赖于它被创生出的环境 envt，而它诞生的环境本身有存在一个到该 <tt class="docutils literal">ProcObj</tt> 的binding。要保证闭包的正常工作，以及环境的一致性，就不可避免造成了引用计数上的问题。</p>
<p>例如在我的Scheme八皇后实现中（详见test/robust_test.scm中部分代码）为了编写方便，采用了大量的闭包，因此必须解决这个问题。</p>
<p>通过查阅资料，我发现了一个介绍CPython中GC实现的文章，里面谈到了这个问题。其中采用了一个非常简洁有效的方法，其实是逆向思维：</p>
<ul class="simple">
<li>会出现循环引用问题的一定是那种带有Container性质的对象（例如Scheme中的pair, list, vector等）</li>
<li>扫描出当前没有被回收的Container</li>
<li>增加一个额外标记gc_refs，初始值设置为当前引用计数值</li>
<li>遍历所有的Container，将其依赖的Container计数减1</li>
<li>再次扫描所有的Container，其中计数不为零的必然不能回收，并且它们直接或者间接依赖的也不能回收，其余的则一定可以回收。</li>
</ul>
<p>一个问题是，采用分散的存储之后如何遍历所有的 <tt class="docutils literal">EvalObj</tt> ? 其实只需要用链表把 <tt class="docutils literal">GCRecord</tt> 串起来即可。
另外，不难看出，解决循环引用虽说是必要的，但耗时的确高于普通的回收过程（检查pending_list，均摊之后可以认为没有太大的时间消耗），因为每次要扫描所有对象。因此普通的回收可以较为频繁的进行，这样一方面普通回收不会因此提高overhead，另一方面降低了没有回收的对象数，加快了循环检查。而循环检查则需要等对象数堆积到了一定程度之后再开始进行，避免产生极高的overhead。</p>
<p>还有一个问题是safe point。虽然之前听说过这个概念，但是真正意识到重要性是在系统加入了tail-recursive优化之后。就是说在执行过程中，某对象引用计数一度降为零，而后来又可能被增加。那么如果GC发生在这中间，就会错判，因此回收时机的选择尤为重要。最终的实现是在每次离开调用，即根据cont寄存器指向的Continuation恢复调用前状态后进行collect。</p>
<p>built-in procedures中提供了修改阈值和查看未被回收的对象数的过程，见Features。</p>
</div>
<div class="section" id="features">
<h1>Features</h1>
<p>除了baseline之外，sonsi还大致有哪些extra features呢？</p>
<ul class="simple">
<li>Non-recursive evaluation</li>
<li>Relatively high-efficient evaluation</li>
<li>Huge input support （例如构造一个10^5长度的表达式，guile直接段错误，而sonsi能够处理。这个可以启发一些应用：解释其他程序生成的Scheme代码，所谓其他程序可能是user-friendly的GUI等）</li>
<li>GC Built-ins ( <tt class="docutils literal"><span class="pre">gc-status</span></tt> 和 <tt class="docutils literal"><span class="pre">set-gc-resolve-threshold!</span></tt> )</li>
<li>Accurate GC (Tested, using <tt class="docutils literal"><span class="pre">(set-gc-resolve-threshold!</span> 0)</tt> at the end of the script)</li>
<li>Vector support</li>
<li>Nearly full literal/quote support ( <tt class="docutils literal">#(1 2 3 (4 5 (6 7)) 8 <span class="pre">9)'',</span> `` '(a, b, c)</tt>, etc.)</li>
<li>Extensive interface (can easily write more built-ins)</li>
<li>And more...</li>
</ul>
</div>
<div class="section" id="what-is-not-supported-feasible-in-the-future">
<h1>What is Not Supported (feasible in the future)</h1>
<ul class="simple">
<li>Macro</li>
<li>Quasi-quotation</li>
</ul>
</div>
</div>
</body>
</html>
<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="generator" content="Docutils 0.10: http://docutils.sourceforge.net/" />
<title>Sonsi: Stupid and Obvious Non-recursive Scheme Interpreter</title>
<style type="text/css">

/*
:Author: David Goodger ([email protected])
:Id: $Id: html4css1.css 7514 2012-09-14 14:27:12Z milde $
:Copyright: This stylesheet has been placed in the public domain.

Default cascading style sheet for the HTML output of Docutils.

See http://docutils.sf.net/docs/howto/html-stylesheets.html for how to
customize this style sheet.
*/

/* used to remove borders from tables and images */
.borderless, table.borderless td, table.borderless th {
  border: 0 }

table.borderless td, table.borderless th {
  /* Override padding for "table.docutils td" with "! important".
     The right padding separates the table cells. */
  padding: 0 0.5em 0 0 ! important }

.first {
  /* Override more specific margin styles with "! important". */
  margin-top: 0 ! important }

.last, .with-subtitle {
  margin-bottom: 0 ! important }

.hidden {
  display: none }

a.toc-backref {
  text-decoration: none ;
  color: black }

blockquote.epigraph {
  margin: 2em 5em ; }

dl.docutils dd {
  margin-bottom: 0.5em }

object[type="image/svg+xml"], object[type="application/x-shockwave-flash"] {
  overflow: hidden;
}

/* Uncomment (and remove this text!) to get bold-faced definition list terms
dl.docutils dt {
  font-weight: bold }
*/

div.abstract {
  margin: 2em 5em }

div.abstract p.topic-title {
  font-weight: bold ;
  text-align: center }

div.admonition, div.attention, div.caution, div.danger, div.error,
div.hint, div.important, div.note, div.tip, div.warning {
  margin: 2em ;
  border: medium outset ;
  padding: 1em }

div.admonition p.admonition-title, div.hint p.admonition-title,
div.important p.admonition-title, div.note p.admonition-title,
div.tip p.admonition-title {
  font-weight: bold ;
  font-family: sans-serif }

div.attention p.admonition-title, div.caution p.admonition-title,
div.danger p.admonition-title, div.error p.admonition-title,
div.warning p.admonition-title, .code .error {
  color: red ;
  font-weight: bold ;
  font-family: sans-serif }

/* Uncomment (and remove this text!) to get reduced vertical space in
   compound paragraphs.
div.compound .compound-first, div.compound .compound-middle {
  margin-bottom: 0.5em }

div.compound .compound-last, div.compound .compound-middle {
  margin-top: 0.5em }
*/

div.dedication {
  margin: 2em 5em ;
  text-align: center ;
  font-style: italic }

div.dedication p.topic-title {
  font-weight: bold ;
  font-style: normal }

div.figure {
  margin-left: 2em ;
  margin-right: 2em }

div.footer, div.header {
  clear: both;
  font-size: smaller }

div.line-block {
  display: block ;
  margin-top: 1em ;
  margin-bottom: 1em }

div.line-block div.line-block {
  margin-top: 0 ;
  margin-bottom: 0 ;
  margin-left: 1.5em }

div.sidebar {
  margin: 0 0 0.5em 1em ;
  border: medium outset ;
  padding: 1em ;
  background-color: #ffffee ;
  width: 40% ;
  float: right ;
  clear: right }

div.sidebar p.rubric {
  font-family: sans-serif ;
  font-size: medium }

div.system-messages {
  margin: 5em }

div.system-messages h1 {
  color: red }

div.system-message {
  border: medium outset ;
  padding: 1em }

div.system-message p.system-message-title {
  color: red ;
  font-weight: bold }

div.topic {
  margin: 2em }

h1.section-subtitle, h2.section-subtitle, h3.section-subtitle,
h4.section-subtitle, h5.section-subtitle, h6.section-subtitle {
  margin-top: 0.4em }

h1.title {
  text-align: center }

h2.subtitle {
  text-align: center }

hr.docutils {
  width: 75% }

img.align-left, .figure.align-left, object.align-left {
  clear: left ;
  float: left ;
  margin-right: 1em }

img.align-right, .figure.align-right, object.align-right {
  clear: right ;
  float: right ;
  margin-left: 1em }

img.align-center, .figure.align-center, object.align-center {
  display: block;
  margin-left: auto;
  margin-right: auto;
}

.align-left {
  text-align: left }

.align-center {
  clear: both ;
  text-align: center }

.align-right {
  text-align: right }

/* reset inner alignment in figures */
div.align-right {
  text-align: inherit }

/* div.align-center * { */
/*   text-align: left } */

ol.simple, ul.simple {
  margin-bottom: 1em }

ol.arabic {
  list-style: decimal }

ol.loweralpha {
  list-style: lower-alpha }

ol.upperalpha {
  list-style: upper-alpha }

ol.lowerroman {
  list-style: lower-roman }

ol.upperroman {
  list-style: upper-roman }

p.attribution {
  text-align: right ;
  margin-left: 50% }

p.caption {
  font-style: italic }

p.credits {
  font-style: italic ;
  font-size: smaller }

p.label {
  white-space: nowrap }

p.rubric {
  font-weight: bold ;
  font-size: larger ;
  color: maroon ;
  text-align: center }

p.sidebar-title {
  font-family: sans-serif ;
  font-weight: bold ;
  font-size: larger }

p.sidebar-subtitle {
  font-family: sans-serif ;
  font-weight: bold }

p.topic-title {
  font-weight: bold }

pre.address {
  margin-bottom: 0 ;
  margin-top: 0 ;
  font: inherit }

pre.literal-block, pre.doctest-block, pre.math, pre.code {
  margin-left: 2em ;
  margin-right: 2em }

pre.code .ln { color: grey; } /* line numbers */
pre.code, code { background-color: #eeeeee }
pre.code .comment, code .comment { color: #5C6576 }
pre.code .keyword, code .keyword { color: #3B0D06; font-weight: bold }
pre.code .literal.string, code .literal.string { color: #0C5404 }
pre.code .name.builtin, code .name.builtin { color: #352B84 }
pre.code .deleted, code .deleted { background-color: #DEB0A1}
pre.code .inserted, code .inserted { background-color: #A3D289}

span.classifier {
  font-family: sans-serif ;
  font-style: oblique }

span.classifier-delimiter {
  font-family: sans-serif ;
  font-weight: bold }

span.interpreted {
  font-family: sans-serif }

span.option {
  white-space: nowrap }

span.pre {
  white-space: pre }

span.problematic {
  color: red }

span.section-subtitle {
  /* font-size relative to parent (h1..h6 element) */
  font-size: 80% }

table.citation {
  border-left: solid 1px gray;
  margin-left: 1px }

table.docinfo {
  margin: 2em 4em }

table.docutils {
  margin-top: 0.5em ;
  margin-bottom: 0.5em }

table.footnote {
  border-left: solid 1px black;
  margin-left: 1px }

table.docutils td, table.docutils th,
table.docinfo td, table.docinfo th {
  padding-left: 0.5em ;
  padding-right: 0.5em ;
  vertical-align: top }

table.docutils th.field-name, table.docinfo th.docinfo-name {
  font-weight: bold ;
  text-align: left ;
  white-space: nowrap ;
  padding-left: 0 }

h1 tt.docutils, h2 tt.docutils, h3 tt.docutils,
h4 tt.docutils, h5 tt.docutils, h6 tt.docutils {
  font-size: 100% }

ul.auto-toc {
  list-style-type: none }

</style>
</head>
<body>
<div class="document" id="sonsi-stupid-and-obvious-non-recursive-scheme-interpreter">
<h1 class="title">Sonsi: Stupid and Obvious Non-recursive Scheme Interpreter</h1>

<p>最终版的设计和特性</p>
<div class="section" id="model">
<h1>Model</h1>
<p>由于Scheme允许first-class procedures，我将所有参与求值的对象都抽象成 <tt class="docutils literal">EvalObj</tt> ，然后再从中派生出较为具体的子类：</p>
<ul class="simple">
<li>EvalObj<ul>
<li>BoolObj</li>
<li>CharObj</li>
<li>Container<ul>
<li>Continuation</li>
<li>Environment</li>
<li>OptObj</li>
<li>PromObj</li>
<li>Pair</li>
<li>VecObj</li>
</ul>
</li>
<li>NumObj</li>
<li>StrObj</li>
<li>SymObj</li>
<li>UnspecObj</li>
</ul>
</li>
</ul>
<p>其中OptObj描述了统一的算符接口，即s-expression中application的第一个的元素 <tt class="docutils literal">opt</tt></p>
<pre class="literal-block">
(opt arg_1, arg_2, arg_3 ... arg_n)
</pre>
<p>而OptObj又向下进行细分，有用户定义函数类 <tt class="docutils literal">ProcObj</tt> , 简单内置函数类 <tt class="docutils literal">BuiltinProcObj</tt> 以及特殊操作符类 <tt class="docutils literal">SpecialOptObj</tt> 。
三者各自实现 <tt class="docutils literal">OptObj</tt> 要求的界面</p>
<pre class="literal-block">
vrtual Pair *callPair *args, Environment * &amp;envt, Continuation * &amp;cont, EvalObj ** &amp;top_ptr, Pair *pc);
</pre>
<p>即根据求值器当前的状态以及传入的参数，计算出值后自行压栈，并返回下一步的PC(program counter)位置。
之所以不直接返回计算出的值，而是让类实现自行进行较为低层的入栈，是因为三个不同类型算符的特殊性。</p>
<p>像简单内置函数仅仅根据已经算好的各个参数计算出值，所以所有这类实现都是具有相同的routine，即传入参数，计算得值，再压回栈。因此没有必要从 <tt class="docutils literal">BuiltinProcObj</tt> 根据每个要实现的built-in procedure派生一个类，而是共同采用 <tt class="docutils literal">BuiltinProcObj</tt> 的壳子，装入不同的evaluation routine（类似回调函数）即可。所以繁琐的栈操作在 <tt class="docutils literal">BuiltinProcObj</tt> 实现后，每次提供一个evaluation routine就能生成一个解决相应计算任务的实例，非常方便。</p>
<p>而较为复杂的 <tt class="docutils literal">SpecialOptObj</tt> 则不同。例如 <tt class="docutils literal">if</tt> 语句的行为模式就与 <tt class="docutils literal">lambda</tt> 和 <tt class="docutils literal">define</tt> 存在不小的差异，而且与普通procedure不同，它们是built-in macros，这也就是将call函数接口设计得较为generic的原因。以 <tt class="docutils literal">if</tt> 举例，我从 <tt class="docutils literal">SpecialOptObj</tt> 派生出一个针对 <tt class="docutils literal">if</tt> 的类 <tt class="docutils literal">SpecialOptIf</tt> ，它的 <tt class="docutils literal">call</tt> 函数实现不再那么单纯。而是根据当前 <tt class="docutils literal">if</tt> 的执行阶段决定应该做什么。对 <tt class="docutils literal">if</tt> 而言，有三个可能的阶段：</p>
<ul class="simple">
<li>调用 <tt class="docutils literal">call</tt> 之前，屏蔽 &lt;consequence&gt; 和 &lt;alternative&gt; 的求值，只计算 &lt;condition&gt;</li>
<li>首次调用 <tt class="docutils literal">call</tt> ，即根据传入的已经计算完毕的 &lt;condition&gt; 决定是计算 &lt;consequence&gt; 还是 &lt;alternative&gt;</li>
<li>再次调用 <tt class="docutils literal">call</tt> ，求值器已经算好了答案，将其入栈即可。整个过程结束。</li>
</ul>
<p>为了能够让求值器按照 <tt class="docutils literal">if</tt> 的特殊行为模式运行，我们就需要将 <tt class="docutils literal">call</tt> 接口设计成上文所述的通用形式。继续下一阶段只需将栈顶 <tt class="docutils literal">if</tt> 恢复，并且将PC指向下一阶段的表达式入口。而如果要结束整个 <tt class="docutils literal">if</tt> 反复过程，则不需要恢复 <tt class="docutils literal">if</tt> , 读出返回地址，将结果入栈并且设PC为返回地址的下一条指令。</p>
<p>这种设计看上去有些繁琐，但事实上证明是有效而具备弹性的。例如我在实现一系列builin-procedure时，就不需要考虑这种入栈出栈的事情，因为它们的操作都是相同的，只是计算过程不同，所以只需编写相应的函数代入 <tt class="docutils literal">BuiltinProcObj</tt> 中即可。而实现像 <tt class="docutils literal">if</tt> 这种特殊的算符，有了generic的接口能够轻松地操作执行流程，虽然直接改动了求值器的流程，但是影响也是局部的。</p>
<p>值得注意的 <tt class="docutils literal">if</tt> 三部曲中有一个在调用 <tt class="docutils literal">call</tt> 之前的屏蔽操作。因为类似 <tt class="docutils literal">if</tt> 还有 <tt class="docutils literal">lambda</tt> 的 primitive-macro 并不是按照procedure的模式工作，而是有选择性地计算参数列表中的参数。关于这些的实现，我将在下面的Interpretation中详细阐述。</p>
</div>
<div class="section" id="interpretation">
<h1>Interpretation</h1>
<p>整个解释器的核心问题就是如何求值。按照实现上可以分为两种。</p>
<p>一种是开发快速，可读性好的递归实现。它的优点是代码简单，思路直接。实现方式就是扫描一个表达式，将相应的语法成分抽取出来，递归计算这些部分后再根据语义得出整个表达式的结果。它的优点有：</p>
<ul class="simple">
<li>设计障碍小，容易实现</li>
<li>在复杂表达的处理上较为轻松</li>
<li>直接按照BNF文法硬编码</li>
</ul>
<p>而缺点则是：</p>
<ul class="simple">
<li>受到实现语言的限制（栈大小等）</li>
<li>在Scheme递归调用足够深时，程序会因为栈空间不足而退出，难以恢复和继续运行（当然应该有机制能捕捉即将发生的栈溢出，不过的确不是特别好的方法）</li>
<li>花销较大，效率不可观。直接实现的最坏复杂度是Scheme表达式长度乘以递归深度，最坏是O(n^2)量级。</li>
</ul>
<p>因此在构建AST，求值过程以及外部表示（external representation）的生成中，我都采用非递归实现。值得一提的是之所以 external representation 要采取非递归实现，主要原因是circular structure的判定，例如下面的代码：</p>
<pre class="literal-block">
define x '(1 . 2))
(set-cdr! x x)
(display x)
</pre>
<p>可以看出x实际上是一个自我指涉的结构，不妨将其视作一个无限长的list。而采用非递归的实现能较为容易地检测这种情形：</p>
<pre class="literal-block">
execute: build/sonsi in.scm
output: (1 #inf#)
</pre>
<p>类似的情况还出现在</p>
<pre class="literal-block">
; Circular promise
(define ones (delay (cons 1 ones)))
(display (car (force ones)))
(display &quot;\n&quot;)

; Circular vector
(define x #(1))
(vector-set! x 0 x)
(display x)
(display &quot;\n&quot;)

; Indirectly circular pair
(define x '(1 . 2))
(define y (cons 1 x))
(define z (cons 1 y))
(define l (cons 1 z))
(set-car! x l)
(display x)
(display &quot;\n&quot;)
</pre>
<p>采用适当实现的sonsi均能产生正确的输出：</p>
<pre class="literal-block">
1
#(#inf#)
((1 1 1 #inf#) . 2)
</pre>
<p>非递归的AST解析过程较为简单，就不再赘述。这里重点介绍一下求值过程的设计。
在 <tt class="docutils literal">eval.cpp</tt> 中的函数 <tt class="docutils literal">run_repr</tt> 就是解释器的主要计算流程。可以看到是由一个while-loop反复进行栈操作实现的。
事实上，求值过程的实现略微带有VM（virtual machine)的味道，也就是说，设计一套byte-code，在把目前的实现中的一些操作加以细化，就能逐步改写成一个简单的compiler。由于这是第一次尝试完成这方面的工程，所以一开始就打算设计一个比较direct的interpreter。换而言之，虽然采用类似的结构，但是许多操作并没有被拆分成更为generic的基本指令。下文进行具体的阐释。</p>
<p>首先为了实现如同R5RS中所说的程序和数据同质化的效果，我直接使用了Scheme中的Pair来表示AST。这个实现有许多优点。
第一就是first-class procedure的实现便利。sonsi最初的实现是将 <tt class="docutils literal">opt</tt> 算符作为AST子树的根，而各个参数作为儿子结点。这样的确在结构上能够反映一个procedure的调用的形式。然而让人陷入困窘的是根不一定就是立即值，而可能也是一个需要通过计算得出的procedure。那么将算符和参数用这种父子关系来表示无疑增加了算符的特异性，在实现上需要各种特判来进行弥补。另一个显而易见的问题就是，用这种结构存储表示表达式不利于 <tt class="docutils literal">eval</tt> 的实现。 因此，最终我直接使用Pair构建的s-expression来表示AST。</p>
<p>其次是关于指令的问题。不像compiler能够直接将操作序列化，sonsi仅仅用在表达式上的结点地址来描述当前计算到的位置。即PC寄存器里存储的是一个 <tt class="docutils literal">Pair *</tt> 。在s-expression的每个结点存储一个 <tt class="docutils literal">next</tt> 域来指向下一条指令，在大多数情况下 <tt class="docutils literal">next == cdr</tt> ，而当 <tt class="docutils literal">cdr</tt> 是empty list时， <tt class="docutils literal">next</tt> 是 <tt class="docutils literal">NULL</tt> ，在特殊的语法结构，例如 <tt class="docutils literal">if</tt> 中，通过在执行时临时修改 <tt class="docutils literal">next</tt> 指针就能跳过相应参数的计算。 的确使用这个方式能够基本描述计算进行的状态，但并不充分。在 <tt class="docutils literal">if</tt> 执行过程中， <tt class="docutils literal">if</tt> 本身的执行的 <strong>阶段</strong> 也描述了计算的状态。这一点在compiler可以把 <tt class="docutils literal">if</tt> 拆分为更简单的指令，而在直接解释的实现中，我通过在Continuation中用 <tt class="docutils literal">Pair *state</tt> 记录当前call的阶段。 什么是Continuation呢？</p>
<p>Continuation类似与栈帧，记录Scheme中caller的状态，在call计算完成后，caller通过自身所处的Continuation能恢复出call发生前的envt，cont和pc寄存器的值。</p>
<p>Let's put them all together.</p>
<p>求值器拥有三个寄存器：</p>
<ul class="simple">
<li>envt 环境指针</li>
<li>cont 当前Continuation</li>
<li>pc program counter （当前指令位置）</li>
</ul>
<p>envt提供了从Symbol到相应值的正确映射，不同的Environment实例通过 <tt class="docutils literal">prev_envt</tt> 指针形成层级结构，并且从底而上地查询Symbol是否bound。这样局部变量能够产生shadow的效果，并且利用指针和GC，Environment层级结构能够节省大量空间。</p>
<p>cont指向当前的Continuation，而每个Continuation记录了：</p>
<ul class="simple">
<li>prev_cont 上一层调用 （父调用）</li>
<li>envt 进入调用前的envt寄存器值</li>
<li>pc 进入调用前pc寄存器的值</li>
<li>prog caller的AST根结点（方便 <tt class="docutils literal">if</tt> 等特殊算符解析参数）</li>
<li>tail true 表示当前call是可以尾递归优化的，并且已经执行到tail expression</li>
</ul>
<p>求值器拥有一个求值栈 <tt class="docutils literal">eval_stack</tt> （与Continuation串联形成的调用“栈”不同，这个是用来计算表达式的）</p>
<p>主循环 <tt class="docutils literal">while (cont == bcont)</tt> ，将一直进行，除非最低层的call已经退出。</p>
<ul class="simple">
<li>考察当前pc指向的AST结点<ul>
<li>pc 为 <tt class="docutils literal">NULL</tt><ul>
<li>说明对于当前call来说各个参数已经计算完毕</li>
<li>开始调用call，具体方法就是调用 <tt class="docutils literal">OptObj</tt> 的通用接口 <tt class="docutils literal">call</tt> 函数</li>
<li><tt class="docutils literal">call</tt> 函数借由多态性完成调用<ul>
<li>根据cont寄存器得到进入调用前的相关信息<ul>
<li>还有阶段没有完成：将pc设置为下一阶段的位置，更新 <tt class="docutils literal"><span class="pre">cont-&gt;state</span></tt></li>
<li>所有阶段完成：根据cont恢复寄存器，设置合适的pc值，将cont设置为prev_cont</li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
<li>pc 不为 <tt class="docutils literal">NULL</tt><ul>
<li>当前pc指向的是立即值：从envt中获取，或者直接使用</li>
<li>当前pc指向一个call：<ul>
<li>新建Continuation，保存当前执行状态(pc, envt, cont)，更新cont</li>
<li>调用prepare：供有些特殊语法（ <tt class="docutils literal">if</tt> , <tt class="docutils literal">lambda</tt> 等）重新设置 <tt class="docutils literal">next</tt> 指针实现部分参数的屏蔽</li>
</ul>
</li>
</ul>
</li>
</ul>
</li>
</ul>
<p>具体实现请参考 <tt class="docutils literal">eval.cpp</tt> ， 关于用户自定义函数以及其闭包的实现请参考 <tt class="docutils literal">ProcObj</tt> 构造函数和其成员函数 <tt class="docutils literal">call</tt> 。</p>
</div>
<div class="section" id="garbage-collection">
<h1>Garbage Collection</h1>
<p>sonsi的垃圾回收采用引用计数的方式，并且能够对循环引用进行正确的处理。</p>
<p>GC的实现最初采取集中式的记录，即采用STL的map将 <tt class="docutils literal">EvalObj</tt> 的地址和计数关联，并且扫描出计数为0的 <tt class="docutils literal">EvalObj</tt> 予以释放。
首先每次进行GC时需要对整个map进行检查相当花费时间，我们没有必要这样做。
事实上，增加一个pending_list，每当有 <tt class="docutils literal">EvalObj</tt> 计数归0时，就加入pending_list，那么GC时只需扫描这个list即可。值得注意的是，pending_list只是记录了曾经计数一度减少到0的 <tt class="docutils literal">EvalObj</tt> ，而这不一定说明它现在一定就是零引用（虽然大多数情况是，否则这个实现就不能提高效率了）。因此，在GC时需要re-check每个list中的元素。</p>
<p>通过这个优化，我自己写的（比较臃肿低效的）同一段八皇后Scheme代码解释时间从7s降低到了2s。</p>
<p>通过gprof可以看出，程序时间花销的瓶颈出现在了频繁的attach和expose上，毕竟它们都是在map上进行的操作。</p>
<p>继续分析，不难发现其实不用采用集中式的记录。集中式记录相比分散的最大好处是对象本身不需要存储count，在并不是所有对象都需要GC时可以节约对象上维护GC信息的花销。然而在sonsi中，每一个 <tt class="docutils literal">EvalObj</tt> 都需要在GC中拥有相应的条目，所以不妨直接改造 <tt class="docutils literal">EvalObj</tt> 结构，加入一个 <tt class="docutils literal">GCRecord *gc_rec</tt> 域，指向对应的GC信息。这样就可以把集中式的map去掉，转化为利用内存寻址完成map本来要做的事情。这样就可以在较小的常数时间内对一个 <tt class="docutils literal">EvalObj</tt> 的count进行操作。</p>
<p>这样还剩下最后一个问题——循环引用的解决。在sonsi的实现中，函数闭包会直接产生一个循环引用：即一个函数 <tt class="docutils literal">ProcObj</tt> 依赖于它被创生出的环境 envt，而它诞生的环境本身有存在一个到该 <tt class="docutils literal">ProcObj</tt> 的binding。要保证闭包的正常工作，以及环境的一致性，就不可避免造成了引用计数上的问题。</p>
<p>例如在我的Scheme八皇后实现中（详见test/robust_test.scm中部分代码）为了编写方便，采用了大量的闭包，因此必须解决这个问题。</p>
<p>通过查阅资料，我发现了一个介绍CPython中GC实现的文章，里面谈到了这个问题。其中采用了一个非常简洁有效的方法，其实是逆向思维：</p>
<ul class="simple">
<li>会出现循环引用问题的一定是那种带有Container性质的对象（例如Scheme中的pair, list, vector等）</li>
<li>扫描出当前没有被回收的Container</li>
<li>增加一个额外标记gc_refs，初始值设置为当前引用计数值</li>
<li>遍历所有的Container，将其依赖的Container计数减1</li>
<li>再次扫描所有的Container，其中计数不为零的必然不能回收，并且它们直接或者间接依赖的也不能回收，其余的则一定可以回收。</li>
</ul>
<p>一个问题是，采用分散的存储之后如何遍历所有的 <tt class="docutils literal">EvalObj</tt> ? 其实只需要用链表把 <tt class="docutils literal">GCRecord</tt> 串起来即可。
另外，不难看出，解决循环引用虽说是必要的，但耗时的确高于普通的回收过程（检查pending_list，均摊之后可以认为没有太大的时间消耗），因为每次要扫描所有对象。因此普通的回收可以较为频繁的进行，这样一方面普通回收不会因此提高overhead，另一方面降低了没有回收的对象数，加快了循环检查。而循环检查则需要等对象数堆积到了一定程度之后再开始进行，避免产生极高的overhead。</p>
<p>还有一个问题是safe point。虽然之前听说过这个概念，但是真正意识到重要性是在系统加入了tail-recursive优化之后。就是说在执行过程中，某对象引用计数一度降为零，而后来又可能被增加。那么如果GC发生在这中间，就会错判，因此回收时机的选择尤为重要。最终的实现是在每次离开调用，即根据cont寄存器指向的Continuation恢复调用前状态后进行collect。</p>
<p>built-in procedures中提供了修改阈值和查看未被回收的对象数的过程，见Features。</p>
</div>
<div class="section" id="features">
<h1>Features</h1>
<p>除了baseline之外，sonsi还大致有哪些extra features呢？</p>
<ul class="simple">
<li>Non-recursive evaluation</li>
<li>Relatively high-efficient evaluation</li>
<li>Huge input support （例如构造一个10^5长度的表达式，guile直接段错误，而sonsi能够处理。这个可以启发一些应用：解释其他程序生成的Scheme代码，所谓其他程序可能是user-friendly的GUI等）</li>
<li>GC Built-ins ( <tt class="docutils literal"><span class="pre">gc-status</span></tt> 和 <tt class="docutils literal"><span class="pre">set-gc-resolve-threshold!</span></tt> )</li>
<li>Accurate GC (Tested, using <tt class="docutils literal"><span class="pre">(set-gc-resolve-threshold!</span> 0)</tt> at the end of the script)</li>
<li>Vector support</li>
<li>Nearly full literal/quote support ( <tt class="docutils literal">#(1 2 3 (4 5 (6 7)) 8 <span class="pre">9)'',</span> `` '(a, b, c)</tt>, etc.)</li>
<li>Extensive interface (can easily write more built-ins)</li>
<li>And more...</li>
</ul>
</div>
<div class="section" id="what-is-not-supported-feasible-in-the-future">
<h1>What is Not Supported (feasible in the future)</h1>
<ul class="simple">
<li>Macro</li>
<li>Quasi-quotation</li>
</ul>
</div>
</div>
</body>
</html>