2015年01月31日开智群演讲稿全文

31 Jan 2015

首先，自我介绍一下，80 后思维爱好者，对思辨和心理学非常感兴趣，学过数学和模式识别，写过几年的博客，做过几年的外企技术工作，现在从事互联网产品的创意和研发。

我同时也是个人信息管理爱好者。因为特别容易沉浸于博客和维基的写作乐趣中，所以自己业余时间，利用各种免费软件和网络服务拼凑出一套基于 Windows 的桌面版 Wiki 文档编辑和存储系统（含加密、自动备份和云同步功能），便于自己长期使用。

回头看来，这些兴趣爱好都可以归结到心理学和认知科学这个主线上来。

可以说正是带着对心理学和认知科学的好奇，闻香识人，才逐步在互联网上熟悉了刘未鹏，李笑来，刘夙，采铜，阳志平老师等前辈…… 这才有幸得到阳老师邀请加入开智群的热闹讨论中。

今天要分享的主题，就是【沉浸互联网——自生长的档案馆和出版社】。这个主题既包含了我的个人兴趣与经历回顾，也包含了我对互联网的理解和利用；既有对互联网现状的看法，也有对未来的展望。产生这个主题，主要因为我一直沉浸于其中吧。

继续分享之前，我先说一下注意事项。这次分享我为许多要点都给出了参考链接，但是希望群友耐心听完分享，再点击我给出的参考链接。

因为“多点一次超链接，思路就会发散一层，连续点击三次以后很容易丢失原来的目的”（我事后会把分享稿发给大家）

我是在高三时期（1998 年前后）接触到互联网的，那时候就觉得打开了一扇具有无限可能的资料库（但还谈不上出版），对它充满了好奇和遐想，一上网就觉得特别刺激。

当时曾经读过比尔盖茨的《未来之路》，觉得这本书蕴含着对互联网未来的准确预言——有用的信息像自来水和交流电那样唾手可得，不出户即可知天下。

但是随着上网经历的增多，就发现互联网，尤其是中文互联网的现状没有我预想得那么好，垃圾的重复的信息，杂乱无章的广告，充满诱惑的干扰人思维的花边新闻，让上网体验极度变差。（举例说明 - 一篇被滥用的职场文章 http://pimgeek.github.io/jekyll/1422672924.html）

我因为困惑而有所反思。把互联网假想成可以自动过滤劣质信息的有用信息网，是我的错。

后来，我逐渐明白互联网是由人的兴趣和商业利益共同推动的，免费的信息不可能像天上掉馅饼那样产生出来，需要有人持续付出努力去改善它的内容，否则就会变成靠怂人听闻的信息吸人眼球，赚取短期广告利益的注意力耗散信息网。

我当然不希望坐视不管。最初想法简单直接，就是尽我个人的努力，基于我个人的美好愿景外加我的逻辑判断和审美能力，收集真正有用的信息，剔除垃圾信息，并且尽快告知我认识的网友哪些才是真正值得关注的。。。

再后来，我逐渐发现这个互联网信息提纯的目标工程浩大，工作量大得超乎想象。

但同时我又了解到很多不同的解决思路，比如网页互链关系分析的数据挖掘思路，典型的如 Google 搜索引擎。它试图利用网页之间的引用推荐关系，给同类的网页内容排出优先顺序，受推荐程度高的网页才出现在搜索结果前列，至少这样可以基本达到去粗取精的效果。

但我对内容的质量有点偏执，还是是想亲手去做整理。所以我就在业余时间里一点一点地收集有用且公开免费的信息，并加以验证，研读，整理…… 没想到多年过来，我居然拼凑出一套基于 Windows 的桌面版 Wiki 文档编辑和存储系统。

这就进入了我今天要讲的重点，一套用于把互联网信息提纯的，面向个人知识分享者的信息处理流程，以及和它配套的软件处理系统。

我所谓的信息处理流程，大概包括【信息收集】【信息验证】【信息研读】【信息整理】【信息发布】这几个关键环节。

在分别介绍各个处理环节之前，大家或许想了解：分享者本人利用这套工具，配合他的脑力，到目前为止做到了什么呢？

粗略地说就是 2013 年 12 月发布在知乎网上回答，一年过后它得到 3000 多赞：你有哪些相见恨晚的知识想推荐 - 吴笛推荐给大家的知识合辑 - http://www.zhihu.com/question/22238159/answer/20783349

如果各位群友对信息处理流程的细节不那么感兴趣，那么我至少可以为大家奉上这份知识合辑。

对于希望了解流程细节的群友，接下来我就分各个环节来讲解，包括这个环节需要做哪些事，所用的典型工具是怎样的。

首先是【信息收集】环节，被收集的信息可能来自各种不同的渠道，门户网站，微博，微信，论坛，中小网站，各类博客等等。

当我通过这些渠道看到有用的信息，打算收集到我的私人笔记库存中时，主要会做些什么事情呢？

主要是
A) 它为何会吸引我，触动我？
B) 它的内容要点是什么？
C) 如何做到一个超链接就可以访问到它？这个超链接也就是大家俗称的“传送门”。

谈到信息收集，很多人都会想到 Evernote 印象笔记，它收集信息方面做得的确非常好，提供了各种插件，提高收集信息的效率。

其实我从 Evernote 的桌面 2.2.384 版就很喜欢这款软件了，但是它后来的版本我就渐渐不再使用了，主要因为它的功能趋于臃肿，速度也慢了下来。

出于诸多考虑，我在 2012 年左右开始用免费的开源软件 Zim 来辅助信息收集。

Zim 是一款面向个人的，所见即所得的桌面维基软件，跨平台可用，完全基于纯文本，所以它的数据是开放的。（相关知乎回答：有哪些适合个人知识管理的 wiki 系统？- Zim Desktop Wiki http://www.zhihu.com/question/19716095/answer/20910474）

Zim 不是一款消费向的软件，它只适合在桌面系统中使用，而且不太容易上手。

Zim 和 Evernote 有相似之处，都是以笔记条目为单位来记录信息，但它有非常方便的交叉引用链接生成功能，可以高效地从一个条目跳转到另一个相关的条目。

事实上，我有一部分资料就是用 Zim 生成链接并放在网上的。 http://pimgeek.github.io/zim/
（相关界面截图：http://img.teamkn.com/i/vIZRYyu4.png）

虽然利用 Zim 收集信息的手工操作步骤比 Evernote 多了一些，但毕竟可以让我专注于信息的收集和整理本身。

那么另一个问题来了，我主要会收集什么样的信息呢？

一般是那些我认为经得起推敲的，干货充足，经久不衰的信息。这个也符合采铜前辈所说的【长半衰期原则】

我并不指望像 Evernote 那样见到什么都收集，而是利用手头简单有效的工具，多收集那些“半衰期长”的信息，避免盲目跟风。（可参考采铜的回答：推荐给年轻人的可实现的成功学 - http://www.zhihu.com/question/22238159/answer/20750109）

信息收集这一块已经把要点讲到了，接下来我要讲一讲【信息验证】这一环节。

前面曾经提到过，免费信息不一定都是有用的，甚至是误导的，很早以前我读过李笑来老师的一篇博客文章，他很明确地指出了这一点。（参考链接：最少必要知识 - http://blog.sina.com.cn/s/blog_62eeb1350102vcas.html）

他推荐了一篇外文文章叫做 “Testing the Surf: Criteria for Evaluating Internet Information Resources.”（网上冲浪的信息验证：评估因特网信息资源的是否可信的判断标准）。该文章充分详实地说明了评估一条互联网（不得不说主要是英文互联网）信息是否可信的判断标准。
https://journals.tdl.org/pacsr/index.php/pacsr/article/view/6016/5645

我最初也是受李笑来老师这篇博文的启发，开始对各种网上信息更加谨慎地对待，并且努力找到我所关注的每条信息的最初来源。

最理想的情况是找到了信息的最初作者，或者找到了可信的发布机构的报道支撑这条信息，无论这条信息是中文信息还是英文信息。

我同时也意识到并不是每个人都能利用 Testing the Surf 一文中所述的那些规则去做判断，所以我总结了一套只要利用 Google 搜索引擎，机械地反复搜索，就可以发现一则网文是否原创，或者是否来自可靠源头的方法。

我没有做严格的统计，凭印象来看，这个方法至少 10 次使用有 6 次左右能行得通吧。（举例说明：知乎回答 - 如何找到库伦定律的原始文献 - 利用 Google 搜索法的操作步骤 - http://www.zhihu.com/question/21938586/answer/22906279）

前面举出的例子，仅仅是用到了“一边搜索，一边根据搜索结果的内容，调整搜索关键词再次搜索”这样的迭代搜索法来逐步接近原始文章。

在网文溯源方面，还需要充分利用 Google 搜索的网文发布时间筛选器，因为无论一篇网文被传播篡改得多么离谱，它的发布时间一般都比原文要晚上几个月甚至几年。

简言之，如果一篇文章号称原创，而且你明确看到它文章写着是 2014 年发布的。如果我利用 Google 搜索找到一篇雷同的文章，在 2007 年就发布过了，那我就会严重怀疑 2014 年那篇是转载甚至篡改过的文章。

再举一例说明，大家近年来可能听说过女子把迷路的小孩子送回家，结果被电铃按钮麻痹，醒来发现人在浴缸里肾被切掉。

其实利用 Google 的发布时间筛选器查找，就发现早在 2008 年就有人提到过类似的故事，而且当时就被辟谣了。Google 搜索引擎截图如下： http://img.teamkn.com/i/CHoO1inj.png

Google 时间筛选器实际链接 - http://s.4ye.me/eLvt5j
辟谣文章 -http://www.loongzone.com/forum.php?mod=viewthread&tid=12305

这里举的两个例子都比较简单，开智群的讨论者们想必都不会轻信，但这里介绍的信息溯源和验证方法，才是我想说的重点，只要你会使用 Google 搜索引擎，就可以掌握我说的方法。

为了方便大家熟悉 Google 的搜索技巧，我制作了多项在线入门教程，欢迎大家试用：http://pimgeek.github.io/

除了 Google 搜索引擎，我还会试着利用 archive.org 这个免费的互联网历史版本库。如果一则网文的最初链接失效了，那么很有可能能在 archive.org 这个网站上找到它历史上曾经出现过的样子。

例如著名的思维技术培训师爱德华·德博诺曾经在网上有一些免费的教程，但某些教程网页链接后来失效了，我就会试着用 archive.org 来追溯它的历史版本 - https://web.archive.org/web/20031118191440/http://www.debonothinking.com/courses/C001.htm

对于还不熟悉 archive.org 的群友们，我稍微铺垫一下：这个网站是对整个互联网上大量静态网页内容的一个多版本存档，概念上比较类似于我们 Windows 的系统还原，或者是 Mac 机上的 Time Machine。

以上两个都是借助互联网本身来验证信息可靠性，如果我们身边有某个领域的专家，如果不确定网文的可靠性，那么直接问专家反而来得快些。

为什么我首先强调 Google 和 archive.org 而最后才强调领域专家呢？主要是希望群友们提高使用互联网的“投入产出比”，毕竟互联网越来越趋于无处不在，而领域专家却未必随叫随到。

到这里已经讲完了【信息搜集】和【信息验证】两个环节，我要稍微整理一下微信聊天记录，群友朋友们也可以顺便休息两三分钟。

休息过后，接下来让我继续讲解【信息研读】这个环节。

信息验证过后，就要努力去利用它，做到知行合一，而不是纯粹以收集信息为乐趣，那样就变成集邮了。我也是在收集和整理信息的过程中，才逐步意识到这个问题的。

我们的主持人谢行知同学，或许也是深谙此道，才选择了【谢行知】这个名号，让人感觉到知行合一是多么的重要。

用偏认知科学的语言粗略描述，如果不能把所收集到的知识转变成大脑内神经网络的存储，那么遇到棘手的事情，第一反应仍然是用笨办法老办法，无论 Evernote 还是 Zim 笔记库里的资料，都不会“主动跳出来”帮忙。

在我看来，大脑与非智能程序的最大区别就在于，遇到难题时，是否能自动蹦出一个默认且靠谱的解决方案。

说到知行合一，就不得不说另一个道理，这在研读一些新的信息时尤为重要。那就是眼见未必为实，Good But Useless（GBU）的怪现象是确实存在的。

关注某项信息时，自我感觉挺好（Good）但是实际用不上（Useless），这个现象似乎存在某种矛盾。它直接引发了一个疑惑：我们的感官觉得好的事情，为什么在实践上有可能是无用的？

反过来想想还是困惑，人们自我感觉良好时，为什么就能保证它在实践上是有用的？难道上帝对人类真的有特殊眷顾，所以允许人们只凭感觉良好，就能做出明智的决策？

为了不偏离分享主题，这里不对 GBU 做过多展开，只想告诉大家，我在收集有用的认知心理学和进化心理学相关资料的时候，初步找到了一种可以接受的解释（但不是定论）。

读过《自私的基因》或者了解过进化心理学基础的人，就意识到：人类毕竟也是生物的一种，生物是通过亿万年的进化才发展出来的，人们的感觉器官也得益于这种进化，会自然而然地对一些东西感觉良好（Feel Good），对另一些东西感觉整个人都不好了（Feel Bad）

《自私的基因》也好，进化心理学也好，都是在讲这种随进化而形成的自然好恶倾向。现代社会发展很快，有些大脑在进化中形成的好恶倾向反而不适应今天的生活实际了，所以会产生 GBU 的现象。（参考链接：刘未鹏博客 - 遇见20万年前的自己 -http://mindhacks.cn/2010/03/18/escape-from-your-shawshank-part3/）

回到【信息研读】的主题上来，关注那些看似有用的信息或者书籍时，要带着警觉。不要看见大家都在转发或者点赞，就觉得必须重视，必须转发，甚至必须接受。

我有两则知乎回答说明了这一点。
反面例子：哈佛大学学生是否四点钟还在自习室里自习？辟谣并解释 - http://www.zhihu.com/question/23146712/answer/23769587
正面例子：号称终极快速学习法的费曼技巧，究竟是什么样的学习方法？可靠性可以确认 - http://www.zhihu.com/question/20576786/answer/21770899 ）

GBU 这种现象也同样会出现在后面【信息整理】和【信息发布】等环节。

在信息整理环节，我一般会按自己的思路去整理内容，但这样做过整理之后，是否方便读者发现更多有用的条目呢？所以我需要不断尝试变换信息整理方式，才能避免 GBU 的问题。

举例说明，我曾使用 Wiki 链接整理内容，自己感觉有用内容更容易被发现了，但我仍然需要读者通过评论框告诉我是否事与愿违 - http://s.4ye.me/f8xl3N 。

但让我们暂且忘记 GBU 的现象，观察问题的另一方面，作为信息整理者，我也是普通人，也会累会烦，怎样才能让自己不知疲倦地继续整理信息呢？

我的初步解决思路是：尽量保证我发布出去的信息是美观，整洁，大方的，让人看了想要点赞的。只有大家点赞（甚至直接或间接地促成经济回报），我才有进一步工作的动力和客观条件，去把这项信息加工的工作持续做下去。

这引出了【信息发布】这一环节的关键作用。

信息发布后及时收获点赞很重要，因为它似乎可以调动我体内的某种化学激励机制（这也属于认知科学范围），促使我保持工作热情，也可以说成是目标达成后产生了进一步的工作动力。

顺便说，关于工作动力，有一则知乎回答可以分享给大家 - 丹尼尔·平克在《驱动力》这本书里描述的工作驱动力究竟是什么？ - http://www.zhihu.com/question/22952141/answer/23281721）

信息发布时需要赏心悦目的关键作用已经无需赘述了，但我需要借助哪些工具才能达到预期的信息发布效果呢？

简单地说，我主要使用了免费的 GitHub Pages 网页发布服务和 Jekyll 模板引擎。

为了让大家看到我发布到互联网的内容，网站域名，网页存储空间，访问流量三者缺一不可。GitHub Pages 不仅允许我免费拥有一个 pimgeek.github.io 二级域名，还向我免费提供了充足的网页存储空间和访问流量。

而 Jekyll 则允许我用技术手段全面控制自己网站的内容版式和文章展示效果，比如我可以选择三栏还是两栏，并且确保我的文章在手机和 Pad 上都能够正常显示。

一旦网站的内容版式确定了，我就可以专心撰写文章。Jekyll 模板引擎允许我使 Markdown 语法格式发布文章。

幸运的是，Zim 软件也允许我把维基笔记条目以 Markdown 语法格式导出，所以我的个人笔记条目就通过 Markdown 这个语法格式与 Jekyll 建立了“绿色通道”————只要我觉得一则笔记条目值得发布出来，我就可以不加修改地通过 Jekyll 和 GitHub Pages 免费地发布到互联网。

有的群友可能会问，像网易 LOFTER，简书，十五言这样的写作平台也很方便啊，还有大量的读者群，为何要大费周章地使用 Jekyll + GitHub Pages？

对此我要说明，Jekyll + GitHub Pages 比较适合像我这种追求全面掌控信息加工流程的使用者。

用 Jekyll + GitHub Page 构建博客，至少在现阶段有这样几个好处：

1 从域名到空间到初期使用的网络流量都是免费的
2 完全掌握博客后台，从网页模板到后台的程序，只要学会了就完全可控，免于受服务商干预。（还可以增加第三方评论框，第三方点赞服务等）
3 所有博客文章都会得到 GitHub 网站的自动备份，因硬盘损坏而丢失数据的可能性极小。
4 看上去比较酷。

大家可以看到 Jekyll + GitHub Pages 发布的实际工作效果，我还没有为它增加评论框。
http://pimgeek.github.io/jekyll/ ；而增加了多说评论框之后的效果，可以参考这里 http://s.4ye.me/doibsF

如果群友中有人想要学习 Jekyll + GitHub Pages 的用法，可以参考阳志平老师的文章：理想的写作环境：Git + Github + Markdown + Jekyll
http://www.yangzhiping.com/tech/writing-space.html

讲到这里，我的个人信息处理流程的【收集】【验证】【研读】【整理】和【发布】等环节都介绍完毕了。

内容发布方面，我还在酝酿新思路。俗话说一图抵千言，也许用图形说话更好，这方面推荐一个我经常使用的流程图制作工具 yEd，其实用性不亚于 Microsoft Visio，但却可以免费使用。我试图用它来绘制一些信息量大的示意图。

举个简单例子，我上学期间逐步积累的的知识发展轨迹图 - http://img.teamkn.com/i/Ne48fvHf.png
再举一个例子 - 层层嵌套可折叠可展开的信息图 - http://live.yworks.com/yfiles-ajax/html/Grouped_Graph.html
对 yEd 感兴趣的话，可以打开 yworks.com 的首页下载试用。

作为网上信息的创作，加工和发布的业余爱好者，我自己也需要学习新技术，如果总是沉迷于自己的收集整理过程，很可能忽视比现在更好的信息加工技术，甚至在观念上整体落后。这也是我参与开智群分享的另外一个动机，多接触不同人的不同想法，不要总是闭门造车。

为互联网贡献高质量内容，对于绝大多数网友而言，都不是必须的。我自认为有贡献，但经历了过去的这些努力和见识，也逐渐明白自己的贡献很微小。

接下来就讲讲我对互联网现状和未来的看法。

互联网的现状在我这种信息洁癖来看还有点混乱，但是已经给全世界（包括中文互联网）带来惊人的改变了，想想看用微信与家人和朋友异地沟通保持联系，用淘宝购物支付宝交生活杂费费。。。未来它只可能变得更强大。

我的这种以一己之力构建整个信息加工流程的做法并不经济可行。为什么呢？因为经过反复的观察和思索，我觉得未来的互联网不会像加工制造业那样运作了，它会像一个不断进化的有机体那样飞速成长。

看看 Google 眼镜，Apple 智能手表，微软的 HoloLens 全息设备，再去了解一下未来令人惊愕的触觉味觉嗅觉甚至脑神经直接控制技术，我们就知道黑客帝国 The Matrix 所描述的那种未来并不是天方夜谭。

1968 年的 2001 太空漫游就已经预言了宇宙飞船和太空站的技术，而黑客帝国似乎也已经是 15 年前的科幻了。

我自己展望未来，我们的地球也不会像现在这样一直被环保人士所诟病。来自世界各地的困难，灾难等信息，会随着未来科技的发展，更快地传输到整个互联网，并以人类所熟悉的感官体验触动每个人，而不是统计数字和信息图。

全世界也会更快地做出反应，这种反应甚至让我们觉得人类与互联网形成的这个大的系统，就像是一个更懂得如何珍惜地球母亲的小孩子。

虽然对未来充满遐想，但每天的目标还是要尽量明确可行。如果用一句话总结我的每日工作目标，那就是：【把握机遇，利用有限的身心能量，在自己的影响范围内多搞定一些增进秩序的事】

我的分享就到这里告一段落吧，是开智群和这里的朋友们，给了我一个回顾过去，畅想未来的好机会。

思圆笔记（BETA） 让思考更圆融

2015年01月31日开智群演讲稿全文

相关文章

思圆笔记（BETA）让思考更圆融