星期日, 九月 11, 2005

《统计陷阱》之“相关关系与因果关系”

  近日看了新华网上的《调查:学历越高收入越多上网时间越长》的新闻,使我联想到了《统计陷阱》中的一章“相关关系与因果关系”。
  这是一个非常常见的谬误。我自然相信这个统计的过程是非常符合程序的,谬误也并不是出现统计的数据上。而是出现在由统计得出的结果上。文中指出:“上网时间与上网者的学历成正比,学历越高,上网时间越长。”这就像是一个因果关系,表明乐学历的高低直接导至乐上网时间的变化。
  让我们来揭示此文的谬误:如果B紧跟着A出现,那么A一定导致B。举个一目了然的例子:我每次下雨外出都能遇到同事MM,那么是否可以得出结论:因为下雨,所以我才遇到乐同事MM?换一个更接近那条新闻的例子(也是书中例子):假设我们已经证实高中毕业生比中途辍学者赚的钱多,并且在大学里多学一年,其收入也会有相应的提高。而得出一个一般结论:在学校呆得时间越长,你赚的钱就越多。但结论在下面这种情况下就并不适用。具有博士学位的人通常变成了大学教师,而不会成为最富有的阶层。另一个例子:在对大学生抽烟者的统计中,发现成绩好的大学生中抽烟的人比成绩差的大学生要少。于是得到了“合理”的推断:抽烟使人的头脑变笨。但是,难道结论就不能是相反的解释么?也许低分促使学生变得爱抽烟。最大的可能是两个因素并不互为因果。是否那些不把读书当回事的爱社交的学生更爱抽烟?
  现在让我们来分析一下那个新闻,我们是不是可以有这样的解释:因为有些职业需要长时间的上网,而从事这些职业的大多数人学历较高。又或者是对于网络这种新事件,年轻人比中老年人更快的接受、使用、喜爱它,因此他们成了使用网络的主力。而因为近十几年来教育的普及,年轻人往往有着比中老年人更高的学历。
  两个因素的相关性是必须通过对事物关联性的描述进行仔细的研究得出的。由此可见,不要说此新闻中的两个因素是否具有因果关系,就是退一步的相关关系是否成立也是一个末知数。

附:
1、追同事MM的情况不是太好,接触得越多就越是发现我们的共同语言太少,而且我只是一个不善言词的人。另外她比偶想像的更成熟,比较现实。当然这只是偶的初步结论。
2、最近又遇到空姐啦,当然只是在QQ里。她总是过着忙碌的生活,现在十一来乐,又有她忙的乐。
3、同学MM终于又回上海来乐,看看有希望伐。不过情况一下,还是松土。
4、最近联通的SGIP升级,现在也开始和移动公司一样走用户鉴权,SP现在就不能随便发短信乐。原来的公司希望我能帮他们把程序升级至最新的SGIP。就当赚点泡MM的经费吧。

没有评论:

静秋

   2010年之前的信息已经无从找到太多的痕迹,照片、日志都没有什么太多的记录。也许哪一天回想起来,我们再补充这一部分的内容。   《三渣树之恋》是那个时间段比较有影响力的电影,虽然我没有去电影院看过,但和丹丹还是一起在家里补习了电影。这电影算是当年的纯爱风吧,情节已不太记得起...