Skip to content
On this page

垃圾回收

前面已经知道基本类型存储在栈空间中,引用类型存储在堆空间中。通过这种方式,解决了数据的存储问题。

不过数据使用之后,如果不需要了(垃圾数据),但是还保留在内存中,那就会导致占用内存越来越大,所以需要对这些垃圾数据进行回收,释放内存空间。

垃圾回收的必要性

下面这段话引自《JavaScript权威指南(第四版)》

由于字符串、对象和数组没有固定大小,所有当他们的大小已知时,才能对他们进行动态的存储分配。JavaScript程序每次创建字符串、数组或对象时,解释器都必须分配内存来存储那个实体。只要像这样动态地分配了内存,最终都要释放这些内存以便他们能够被再用,否则,JavaScript的解释器将会消耗完系统中所有可用的内存,造成系统崩溃。

这段话解释了为什么需要系统需要垃圾回收,JS 不像 C/C++,它有自己的一套垃圾回收机制(Garbage Collection)。JavaScrip t的解释器可以检测到何时程序不再使用一个对象了,当他确定了一个对象是无用的时候,他就知道不再需要这个对象,可以把它所占用的内存释放掉了。

例如:

js
var a = "before";
var b = "override a";
var a = b; // 重写a

这段代码运行之后,“before”这个字符串失去了引用(之前是被 a 引用),系统检测到这个事实之后,就会释放该字符串的存储空间以便这些空间可以被再利用。

垃圾回收机制

垃圾回收有两种方法:标记清除和引用计数。其中标记清除更为常用。

标记清除

这是 JavaScript 中最常见的垃圾回收方式。

当变量进入执行环境是,就标记这个变量为“进入环境”。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流进入相应的环境,就可能会用到他们。当变量离开环境时,则将其标记为“离开环境”。

可以使用任何方式来标记变量。如何标记其实并不重要,重要的是采取什么策略。

垃圾收集器在运行的时候会给存储在内存中的所有变量都加上标记(当然,可以使用任何标记方式)。然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。而在此之后再被加上标记的变量将被视为准备删除的变量,原因是环境中的变量已经无法访问到这些变量了。最后。垃圾收集器完成内存清除工作,销毁那些带标记的值,并回收他们所占用的内存空间。

简单说:就是垃圾回收器会每隔一段时间扫描一次内存,当然这个时间应该是很短,在扫描的过程中垃圾回收器会把所有的内存的变量全部加上标记,然后如果有你需要用到的内存,垃圾回收器就会把你需要用到的内存的标记删掉,意思就是说,这个内存我不清除,但是会把有标记的全部删掉,这就是垃圾回收器的一次清理工作。

举个例子:

js
var m = 0,n = 19 // 把 m, n, add() 标记为进入环境。
add(m, n) // 把 a, b, c 标记为进入环境。
console.log(n) // a, b, c 标记为离开环境,等待垃圾回收。
function add(a, b) {
  a++
  var c = a + b
  return c
}

引用计数

另一种不太常见的垃圾回收策略是引用计数。

引用计数的含义是跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型赋值给该变量时,则这个值的引用次数就是 1。相反,如果包含对这个值引用的变量又取得了另外一个值,则这个值的引用次数就减 1。当这个引用次数变成 0 时,则说明没有办法再访问这个值了,因而就可以将其所占的内存空间给收回来。这样,垃圾收集器下次再运行时,它就会释放那些引用次数为0的值所占的内存。

但是用这种方法存在着一个问题,下面来看看代码:

js
function problem() {
  var objA = new Object();
  var objB = new Object();

  objA.someOtherObject = objB;
  objB.anotherObject = objA;
}

在这个例子中,objAobjB 通过各自的属性相互引用;也就是说这两个对象的引用次数都是2。在采用引用计数的策略中,由于函数执行之后,这两个对象都离开了作用域,函数执行完成之后,objAobjB 还将会继续存在,因为他们的引用次数永远不会是 0。这样的相互引用如果说很大量的存在就会导致大量的内存泄露。

参考

垃圾回收 has loaded