代码中到底应不应当写注释?

  当很多前辈教育后辈应当多写注释的时候,当网络上充满了有关程序员从不写注释的段子的时候,这是一个非常有争议的话题。作为一个标题党,容我先修正一下我的观点:我认为如果代码写得足够好,那么大多数注释是多余的,我们应该通过写出更好的代码来代替更多注释。

  注释的确有其用途,但大部分情况下,程序员在滥用注释。我是反对夹杂在代码间的注释的,我认为注释应当从代码中独立出来——通常被称为文档。

  请看下面一段代码。

  

复制代码 代码如下:

  /* /static/market/checkout.js

  2014.7.2 create by orzfly

  2014.7.29 update by jysperm: fixbugs

  TODO: 这段代码中注释太多了,需要移除一些 -- jysperm

  */

  var raw_products = req.query['products'].split(',');

  // 商品 ID 的数组

  var products = []

  // 过滤每个参数

  for(var i = 0, i < raw_products.length, i++) {

  if (!raw_products[i])

  return;

  // 前端传来的数据中居然会有空格

  if (!raw_products[i].trim())

  return

  /* 2014.7.22: 现在可以使用非数字 ID 了

  // 略过非数字条目

  if (isNan(raw_products[i].trim().toFixed()))

  return;

  */

  products.push(raw_products[i].trim().toFixed());

  }

  // 总钱数

  var sum = 0;

  // 计算每个商品的总钱数

  for(var i = 0, i < products.length, i++) {

  // 从数据库中查商品信息

  var data = db.product.byID(products[i]);

  // TODO: 谁来写一下没查到商品的情况

  // 把商品的价格加到总钱数上, a += b 是 a = a + b 的缩写

  sum += data.price;

  }

  你居然花了一半的时间在读注释上面,这是多么浪费生命的事情,在代码中每加一行注释,都会增加代码的阅读成本——即使阅读者已经了解了注释所要传达的精神;同时也会增加维护成本:修改这段代码的人不得不连同注释一起修改——而且你不能确定他到底会不会这么做。

  所以只有当非常必要的情况下,才应该添加注释,而且应当言简意赅。注释不应当解释一段代码在做什么,因为这是每个合格的程序员都应该知道的事情,而是应该解释这段代码为什么要这样做。

  由此引出几种明显不应该添加的注释:

  本应由版本控制系统记录的信息、对代码的评论,以及不是很重要的 TODO.

  代码并不是全部,一个但凡靠谱一点的项目,都应当有自己的版本控制系统,除了记录代码差异之外,还应该有工单和 Issue 的功能。

  阅读代码的人通常不需要了解几个程序员之间的恩怨,很多时候也不关心这段代码的历史,这些信息只会把代码拖得越来越长。

  废弃的代码

  被弃用的代码应该被删掉,这些代码会非常影响阅读,而且它们一般又很长。

  在绝大多数情况下,被弃用的代码不会重新派上用场,即使出现了少数情况,你也可以从版本控制系统中找到它们。

  对变量和函数名的解释

  这种情况下显然你需要一个更恰当的名字,如果这个标识符有一个比较小的作用于,你可以使用一个比较长的名字以便容纳更多信息。

  例如上文中的:

  products 应改为 products_id

  sum 应改为 total_amount

  data 应改为 product_record

  对语法的解释,以及显而易见的事情

  例如上文中的「把商品的价格加到总钱数上, a += b 是 a = a + b 的缩写」,这显然是任何一个人都知道的事情。

  也许有人愿意通过写这样的注释来梳理思路:

  

复制代码 代码如下:

  // 过滤参数:

  //    去掉 ID 里的空格

  //    去掉非数字 ID

  // 循环每一个商品:

  //    去数据库查记录

  //    把商品的价格加到总钱数上

  但是当代码写完的时候记得删掉。

  对逻辑块的概括

  例如上文中的「过滤每个参数」和「计算每个商品的总钱数」,这情况下通常是你没有对逻辑进行抽象,具体表现就是像下面这样:

  

复制代码 代码如下:

  // 首先有 25 行代码去做事情 A

  // 然后有 5 行代码去做事情 B

  // 这里有 90 行代码去做事情 C

  // 最后有 45 行代码去做事情 D

  这导致你需要一些注释来分割这四个部分。如果这四个部分都是一个函数调用的话,那么函数名本身就是对逻辑的一种解释,读者可以快速地找到函数 B, 而不必在前 25 行中搜索做事情 B 的五行代码。

  综上,我对这段代码的改善意见如下:

  

复制代码 代码如下:

  var filterProductID = function(raw_products_id) {

  result = []

  raw_products_id.forEach(function(product_id) {

  if (product_id and product_id.trim())

  products_id.push(product_id.trim().toFixed());

  });

  return result;

  };

  var getPriceOfProduct = function(id) {

  var product_record = db.product.byID(products[i]);

  if (product_record)

  return product_record.price;

  else

  return 0;

  };

  var products_id = filterProductID(req.query['products'].split(','));

  var tatol_amount = 0;

  products_id.forEach(function(product_id) {

  tatol_amount += getPriceOfProduct(product_id);

  });

  虽然我在以一段虚构的,刻意编造的代码来佐证我的观点,但我相信在实际的项目中,同样可以通过改善代码来减少注释,而且总体上来讲会节约更多的时间和精力。