思圆笔记(BETA) 让思考更圆融

2015年01月31日开智群演讲稿全文

首先,自我介绍一下,80 后思维爱好者,对思辨和心理学非常感兴趣,学过数学和模式识别,写过几年的博客,做过几年的外企技术工作,现在从事互联网产品的创意和研发。

我同时也是个人信息管理爱好者。因为特别容易沉浸于博客和维基的写作乐趣中,所以自己业余时间,利用各种免费软件和网络服务拼凑出一套基于 Windows 的桌面版 Wiki 文档编辑和存储系统(含加密、自动备份和云同步功能),便于自己长期使用。

回头看来,这些兴趣爱好都可以归结到心理学和认知科学这个主线上来。

可以说正是带着对心理学和认知科学的好奇,闻香识人,才逐步在互联网上熟悉了刘未鹏,李笑来,刘夙,采铜,阳志平老师等前辈…… 这才有幸得到阳老师邀请加入开智群的热闹讨论中。

今天要分享的主题,就是【沉浸互联网——自生长的档案馆和出版社】。这个主题既包含了我的个人兴趣与经历回顾,也包含了我对互联网的理解和利用;既有对互联网现状的看法,也有对未来的展望。产生这个主题,主要因为我一直沉浸于其中吧。

继续分享之前,我先说一下注意事项。这次分享我为许多要点都给出了参考链接,但是希望群友耐心听完分享,再点击我给出的参考链接。

因为“多点一次超链接,思路就会发散一层,连续点击三次以后很容易丢失原来的目的”(我事后会把分享稿发给大家)

我是在高三时期(1998 年前后)接触到互联网的,那时候就觉得打开了一扇具有无限可能的资料库(但还谈不上出版),对它充满了好奇和遐想,一上网就觉得特别刺激。

当时曾经读过比尔盖茨的《未来之路》,觉得这本书蕴含着对互联网未来的准确预言——有用的信息像自来水和交流电那样唾手可得,不出户即可知天下。

但是随着上网经历的增多,就发现互联网,尤其是中文互联网的现状没有我预想得那么好,垃圾的重复的信息,杂乱无章的广告,充满诱惑的干扰人思维的花边新闻,让上网体验极度变差。(举例说明 - 一篇被滥用的职场文章 http://pimgeek.github.io/jekyll/1422672924.html)

我因为困惑而有所反思。把互联网假想成可以自动过滤劣质信息的有用信息网,是我的错。

后来,我逐渐明白互联网是由人的兴趣和商业利益共同推动的,免费的信息不可能像天上掉馅饼那样产生出来,需要有人持续付出努力去改善它的内容,否则就会变成靠怂人听闻的信息吸人眼球,赚取短期广告利益的注意力耗散信息网。

我当然不希望坐视不管。最初想法简单直接,就是尽我个人的努力,基于我个人的美好愿景外加我的逻辑判断和审美能力,收集真正有用的信息,剔除垃圾信息,并且尽快告知我认识的网友哪些才是真正值得关注的。。。

再后来,我逐渐发现这个互联网信息提纯的目标工程浩大,工作量大得超乎想象。

但同时我又了解到很多不同的解决思路,比如网页互链关系分析的数据挖掘思路,典型的如 Google 搜索引擎。它试图利用网页之间的引用推荐关系,给同类的网页内容排出优先顺序,受推荐程度高的网页才出现在搜索结果前列,至少这样可以基本达到去粗取精的效果。

但我对内容的质量有点偏执,还是是想亲手去做整理。所以我就在业余时间里一点一点地收集有用且公开免费的信息,并加以验证,研读,整理…… 没想到多年过来,我居然拼凑出一套基于 Windows 的桌面版 Wiki 文档编辑和存储系统。

这就进入了我今天要讲的重点,一套用于把互联网信息提纯的,面向个人知识分享者的信息处理流程,以及和它配套的软件处理系统。

我所谓的信息处理流程,大概包括【信息收集】【信息验证】【信息研读】【信息整理】【信息发布】这几个关键环节。

在分别介绍各个处理环节之前,大家或许想了解:分享者本人利用这套工具,配合他的脑力,到目前为止做到了什么呢?

粗略地说就是 2013 年 12 月发布在知乎网上回答,一年过后它得到 3000 多赞:你有哪些相见恨晚的知识想推荐 - 吴笛推荐给大家的知识合辑 - http://www.zhihu.com/question/22238159/answer/20783349

如果各位群友对信息处理流程的细节不那么感兴趣,那么我至少可以为大家奉上这份知识合辑。

对于希望了解流程细节的群友,接下来我就分各个环节来讲解,包括这个环节需要做哪些事,所用的典型工具是怎样的。

首先是【信息收集】环节,被收集的信息可能来自各种不同的渠道,门户网站,微博,微信,论坛,中小网站,各类博客等等。

当我通过这些渠道看到有用的信息,打算收集到我的私人笔记库存中时,主要会做些什么事情呢?

主要是
A) 它为何会吸引我,触动我?
B) 它的内容要点是什么?
C) 如何做到一个超链接就可以访问到它?这个超链接也就是大家俗称的“传送门”。

谈到信息收集,很多人都会想到 Evernote 印象笔记,它收集信息方面做得的确非常好,提供了各种插件,提高收集信息的效率。

其实我从 Evernote 的桌面 2.2.384 版就很喜欢这款软件了,但是它后来的版本我就渐渐不再使用了,主要因为它的功能趋于臃肿,速度也慢了下来。

出于诸多考虑,我在 2012 年左右开始用免费的开源软件 Zim 来辅助信息收集。

Zim 是一款面向个人的,所见即所得的桌面维基软件,跨平台可用,完全基于纯文本,所以它的数据是开放的。(相关知乎回答:有哪些适合个人知识管理的 wiki 系统?- Zim Desktop Wiki http://www.zhihu.com/question/19716095/answer/20910474)

Zim 不是一款消费向的软件,它只适合在桌面系统中使用,而且不太容易上手。

Zim 和 Evernote 有相似之处,都是以笔记条目为单位来记录信息,但它有非常方便的交叉引用链接生成功能,可以高效地从一个条目跳转到另一个相关的条目。

事实上,我有一部分资料就是用 Zim 生成链接并放在网上的。 http://pimgeek.github.io/zim/
(相关界面截图:http://img.teamkn.com/i/vIZRYyu4.png)

虽然利用 Zim 收集信息的手工操作步骤比 Evernote 多了一些,但毕竟 可以让我专注于信息的收集和整理本身。

那么另一个问题来了,我主要会收集什么样的信息呢?

一般是那些我认为经得起推敲的,干货充足,经久不衰的信息。这个也符合采铜前辈所说的【长半衰期原则】

我并不指望像 Evernote 那样见到什么都收集,而是利用手头简单有效的工具,多收集那些“半衰期长”的信息,避免盲目跟风。(可参考采铜的回答:推荐给年轻人的可实现的成功学 - http://www.zhihu.com/question/22238159/answer/20750109)

信息收集这一块已经把要点讲到了,接下来我要讲一讲【信息验证】这一环节。

前面曾经提到过,免费信息不一定都是有用的,甚至是误导的,很早以前我读过李笑来老师的一篇博客文章,他很明确地指出了这一点。(参考链接:最少必要知识 - http://blog.sina.com.cn/s/blog_62eeb1350102vcas.html)

他推荐了一篇外文文章叫做 “Testing the Surf: Criteria for Evaluating Internet Information Resources.”(网上冲浪的信息验证:评估因特网信息资源的是否可信的判断标准)。该文章充分详实地说明了评估一条互联网(不得不说主要是英文互联网)信息是否可信的判断标准。
https://journals.tdl.org/pacsr/index.php/pacsr/article/view/6016/5645

我最初也是受李笑来老师这篇博文的启发,开始对各种网上信息更加谨慎地对待,并且努力找到我所关注的每条信息的最初来源。

最理想的情况是找到了信息的最初作者,或者找到了可信的发布机构的报道支撑这条信息,无论这条信息是中文信息还是英文信息。

我同时也意识到并不是每个人都能利用 Testing the Surf 一文中所述的那些规则去做判断,所以我总结了一套只要利用 Google 搜索引擎,机械地反复搜索,就可以发现一则网文是否原创,或者是否来自可靠源头的方法。

我没有做严格的统计,凭印象来看,这个方法至少 10 次使用有 6 次左右能行得通吧。(举例说明:知乎回答 - 如何找到库伦定律的原始文献 - 利用 Google 搜索法的操作步骤 - http://www.zhihu.com/question/21938586/answer/22906279)

前面举出的例子,仅仅是用到了“一边搜索,一边根据搜索结果的内容,调整搜索关键词再次搜索”这样的迭代搜索法来逐步接近原始文章。

在网文溯源方面,还需要充分利用 Google 搜索的网文发布时间筛选器,因为无论一篇网文被传播篡改得多么离谱,它的发布时间一般都比原文要晚上几个月甚至几年。

简言之,如果一篇文章号称原创,而且你明确看到它文章写着是 2014 年发布的。如果我利用 Google 搜索找到一篇雷同的文章,在 2007 年就发布过了,那我就会严重怀疑 2014 年那篇是转载甚至篡改过的文章。

再举一例说明,大家近年来可能听说过女子把迷路的小孩子送回家,结果被电铃按钮麻痹,醒来发现人在浴缸里肾被切掉。

其实利用 Google 的发布时间筛选器查找,就发现早在 2008 年就有人提到过类似的故事,而且当时就被辟谣了。Google 搜索引擎截图如下: http://img.teamkn.com/i/CHoO1inj.png

Google 时间筛选器实际链接 - http://s.4ye.me/eLvt5j
辟谣文章 -http://www.loongzone.com/forum.php?mod=viewthread&tid=12305

这里举的两个例子都比较简单,开智群的讨论者们想必都不会轻信,但这里介绍的信息溯源和验证方法,才是我想说的重点,只要你会使用 Google 搜索引擎,就可以掌握我说的方法。

为了方便大家熟悉 Google 的搜索技巧,我制作了多项在线入门教程,欢迎大家试用:http://pimgeek.github.io/

除了 Google 搜索引擎,我还会试着利用 archive.org 这个免费的互联网历史版本库。如果一则网文的最初链接失效了,那么很有可能能在 archive.org 这个网站上找到它历史上曾经出现过的样子。

例如著名的思维技术培训师爱德华·德博诺曾经在网上有一些免费的教程,但某些教程网页链接后来失效了,我就会试着用 archive.org 来追溯它的历史版本 - https://web.archive.org/web/20031118191440/http://www.debonothinking.com/courses/C001.htm

对于还不熟悉 archive.org 的群友们,我稍微铺垫一下:这个网站是对整个互联网上大量静态网页内容的一个多版本存档,概念上比较类似于我们 Windows 的系统还原,或者是 Mac 机上的 Time Machine。

以上两个都是借助互联网本身来验证信息可靠性,如果我们身边有某个领域的专家,如果不确定网文的可靠性,那么直接问专家反而来得快些。

为什么我首先强调 Google 和 archive.org 而最后才强调领域专家呢?主要是希望群友们提高使用互联网的“投入产出比”,毕竟互联网越来越趋于无处不在,而领域专家却未必随叫随到。

到这里已经讲完了【信息搜集】和【信息验证】两个环节,我要稍微整理一下微信聊天记录,群友朋友们也可以顺便休息两三分钟。

休息过后,接下来让我继续讲解【信息研读】这个环节。

信息验证过后,就要努力去利用它,做到知行合一,而不是纯粹以收集信息为乐趣,那样就变成集邮了。我也是在收集和整理信息的过程中,才逐步意识到这个问题的。

我们的主持人谢行知同学,或许也是深谙此道,才选择了【谢行知】 这个名号,让人感觉到 知行合一 是多么的重要。

用偏认知科学的语言粗略描述,如果不能把所收集到的知识转变成大脑内神经网络的存储,那么遇到棘手的事情,第一反应仍然是用笨办法老办法,无论 Evernote 还是 Zim 笔记库里的资料,都不会“主动跳出来”帮忙。

在我看来,大脑与非智能程序的最大区别就在于,遇到难题时,是否能自动蹦出一个默认且靠谱的解决方案。

说到知行合一,就不得不说另一个道理,这在研读一些新的信息时尤为重要。那就是眼见未必为实,Good But Useless(GBU)的怪现象是确实存在的。

关注某项信息时,自我感觉挺好(Good)但是实际用不上(Useless),这个现象似乎存在某种矛盾。它直接引发了一个疑惑:我们的感官觉得好的事情,为什么在实践上有可能是无用的?

反过来想想还是困惑,人们自我感觉良好时,为什么就能保证它在实践上是有用的?难道上帝对人类真的有特殊眷顾,所以允许人们只凭感觉良好,就能做出明智的决策?

为了不偏离分享主题,这里不对 GBU 做过多展开,只想告诉大家,我在收集有用的认知心理学和进化心理学相关资料的时候,初步找到了一种可以接受的解释(但不是定论)。

读过《自私的基因》或者了解过进化心理学基础的人,就意识到:人类毕竟也是生物的一种,生物是通过亿万年的进化才发展出来的,人们的感觉器官也得益于这种进化,会自然而然地对一些东西 感觉良好(Feel Good),对另一些东西感觉整个人都不好了(Feel Bad)

《自私的基因》也好,进化心理学也好,都是在讲这种随进化而形成的自然好恶倾向。现代社会发展很快,有些大脑在进化中形成的好恶倾向反而不适应今天的生活实际了,所以会产生 GBU 的现象。(参考链接:刘未鹏博客 - 遇见20万年前的自己 -http://mindhacks.cn/2010/03/18/escape-from-your-shawshank-part3/)

回到【信息研读】的主题上来,关注那些看似有用的信息或者书籍时,要带着警觉。不要看见大家都在转发或者点赞,就觉得必须重视,必须转发,甚至必须接受。

我有两则知乎回答说明了这一点。
反面例子:哈佛大学学生是否四点钟还在自习室里自习?辟谣并解释 - http://www.zhihu.com/question/23146712/answer/23769587
正面例子:号称终极快速学习法的费曼技巧,究竟是什么样的学习方法?可靠性可以确认 - http://www.zhihu.com/question/20576786/answer/21770899

GBU 这种现象也同样会出现在后面【信息整理】和【信息发布】等环节。

在信息整理环节,我一般会按自己的思路去整理内容,但这样做过整理之后,是否方便读者发现更多有用的条目呢?所以我需要不断尝试变换信息整理方式,才能避免 GBU 的问题。

举例说明,我曾使用 Wiki 链接整理内容,自己感觉有用内容更容易被发现了,但我仍然需要读者通过评论框告诉我是否事与愿违 - http://s.4ye.me/f8xl3N

但让我们暂且忘记 GBU 的现象,观察问题的另一方面,作为信息整理者,我也是普通人,也会累会烦,怎样才能让自己不知疲倦地继续整理信息呢?

我的初步解决思路是:尽量保证我发布出去的信息是美观,整洁,大方的,让人看了想要点赞的。只有大家点赞(甚至直接或间接地促成经济回报),我才有进一步工作的动力和客观条件,去把这项信息加工的工作持续做下去。

这引出了【信息发布】这一环节的关键作用。

信息发布后及时收获点赞很重要,因为它似乎可以调动我体内的某种化学激励机制(这也属于认知科学范围),促使我保持工作热情,也可以说成是目标达成后产生了进一步的工作动力。

顺便说,关于工作动力,有一则知乎回答可以分享给大家 - 丹尼尔·平克在《驱动力》这本书里描述的工作驱动力究竟是什么? - http://www.zhihu.com/question/22952141/answer/23281721)

信息发布时需要赏心悦目的关键作用已经无需赘述了,但我需要借助哪些工具才能达到预期的信息发布效果呢?

简单地说,我主要使用了免费的 GitHub Pages 网页发布服务和 Jekyll 模板引擎。

为了让大家看到我发布到互联网的内容,网站域名,网页存储空间,访问流量三者缺一不可。GitHub Pages 不仅允许我免费拥有一个 pimgeek.github.io 二级域名,还向我免费提供了充足的网页存储空间和访问流量。

而 Jekyll 则允许我用技术手段全面控制自己网站的内容版式和文章展示效果,比如我可以选择三栏还是两栏,并且确保我的文章在手机和 Pad 上都能够正常显示。

一旦网站的内容版式确定了,我就可以专心撰写文章。Jekyll 模板引擎允许我使 Markdown 语法格式发布文章。

幸运的是,Zim 软件也允许我把维基笔记条目以 Markdown 语法格式导出,所以我的个人笔记条目就通过 Markdown 这个语法格式与 Jekyll 建立了“绿色通道”————只要我觉得一则笔记条目值得发布出来,我就可以不加修改地通过 Jekyll 和 GitHub Pages 免费地发布到互联网。

有的群友可能会问,像网易 LOFTER,简书,十五言这样的写作平台也很方便啊,还有大量的读者群,为何要大费周章地使用 Jekyll + GitHub Pages?

对此我要说明,Jekyll + GitHub Pages 比较适合像我这种追求全面掌控信息加工流程的使用者。

用 Jekyll + GitHub Page 构建博客,至少在现阶段有这样几个好处:

1 从域名到空间到初期使用的网络流量都是免费的
2 完全掌握博客后台,从网页模板到后台的程序,只要学会了就完全可控,免于受服务商干预。(还可以增加第三方评论框,第三方点赞服务等)
3 所有博客文章都会得到 GitHub 网站的自动备份,因硬盘损坏而丢失数据的可能性极小。
4 看上去比较酷。

大家可以看到 Jekyll + GitHub Pages 发布 的实际工作效果,我还没有为它增加评论框。
http://pimgeek.github.io/jekyll/ ;而增加了多说评论框之后的效果,可以参考这里 http://s.4ye.me/doibsF

如果群友中有人想要学习 Jekyll + GitHub Pages 的用法,可以参考阳志平老师的文章:理想的写作环境:Git + Github + Markdown + Jekyll
http://www.yangzhiping.com/tech/writing-space.html

讲到这里,我的个人信息处理流程的【收集】【验证】【研读】【整理】和【发布】等环节都介绍完毕了。

内容发布方面,我还在酝酿新思路。俗话说一图抵千言,也许用图形说话更好,这方面推荐一个我经常使用的流程图制作工具 yEd,其实用性不亚于 Microsoft Visio,但却可以免费使用。我试图用它来绘制一些信息量大的示意图。

举个简单例子,我上学期间逐步积累的的知识发展轨迹图 - http://img.teamkn.com/i/Ne48fvHf.png
再举一个例子 - 层层嵌套可折叠可展开的信息图 - http://live.yworks.com/yfiles-ajax/html/Grouped_Graph.html
对 yEd 感兴趣的话,可以打开 yworks.com 的首页下载试用。

作为网上信息的创作,加工和发布的业余爱好者,我自己也需要学习新技术,如果总是沉迷于自己的收集整理过程,很可能忽视比现在更好的信息加工技术,甚至在观念上整体落后。这也是我参与开智群分享的另外一个动机,多接触不同人的不同想法,不要总是闭门造车。

为互联网贡献高质量内容,对于绝大多数网友而言,都不是必须的。我自认为有贡献,但经历了过去的这些努力和见识,也逐渐明白自己的贡献很微小。

接下来就讲讲我对互联网现状和未来的看法。

互联网的现状在我这种信息洁癖来看还有点混乱,但是已经给全世界(包括中文互联网)带来惊人的改变了,想想看用微信与家人和朋友异地沟通保持联系,用淘宝购物支付宝交生活杂费费。。。未来它只可能变得更强大。

我的这种以一己之力构建整个信息加工流程的做法并不经济可行。为什么呢?因为经过反复的观察和思索,我觉得未来的互联网不会像加工制造业那样运作了,它会像一个不断进化的有机体那样飞速成长。

看看 Google 眼镜,Apple 智能手表,微软的 HoloLens 全息设备,再去了解一下未来令人惊愕的 触觉 味觉 嗅觉 甚至脑神经直接控制技术,我们就知道黑客帝国 The Matrix 所描述的那种未来并不是天方夜谭。

1968 年的 2001 太空漫游就已经预言了宇宙飞船和太空站的技术,而黑客帝国似乎也已经是 15 年前的科幻了。

我自己展望未来,我们的地球也不会像现在这样一直被环保人士所诟病。来自世界各地的困难,灾难等信息,会随着未来科技的发展,更快地传输到整个互联网,并以人类所熟悉的感官体验触动每个人,而不是统计数字和信息图。

全世界也会更快地做出反应,这种反应甚至让我们觉得人类与互联网形成的这个大的系统,就像是一个更懂得如何珍惜地球母亲的小孩子。

虽然对未来充满遐想,但每天的目标还是要尽量明确可行。如果用一句话总结我的每日工作目标,那就是:【把握机遇,利用有限的身心能量,在自己的影响范围内多搞定一些增进秩序的事】

我的分享就到这里告一段落吧,是开智群和这里的朋友们,给了我一个回顾过去,畅想未来的好机会。