【281】47周 以问题为中心的信息获取

Abe 责编: Hum
07月26日

以问题为中心的信息获取

| 本文为付费栏目文章,您已订阅,可阅读全文 |
编注:本文修改自 Matrix 投稿,文章本身内容有料、观点新颖,经过结构调整与内容修改发布于 Power+。

我曾经订阅了不少 RSS 源,也在收集知乎和其他社交网络的「干货」上花费过不少时间。后来,我转向了以少数订阅源为灵感来源,从这些内容提出问题,再大量搜索信息解答问题的信息获取方式。这个流程实际也是大部分人解决问题所用到的,但我将它借鉴到了信息获取上。
在信息获取的过程中,我们常常需要面对这两个问题:
  1. 信息焦虑:一直担心自己缺失了什么重要信息,从而引发了严重的焦虑;
  2. 认知偏见:受自己的固有印象影响,倾向赞同符合自己观点的信息,不能客观对待反面观点。
为了解决这两个问题,我进行过几种尝试,分别是:
  1. 大量订阅:针对每个类别订阅大量信息,通过阅读不同观点降低认知偏见的影响;
  2. 信息节食:保留少量精选订阅源,以此应对积压文章带来的信息焦虑;
  3. 以问题为中心的信息获取:从少量覆盖范围广的订阅源提出问题,然后针对问题进行大量阅读,以此同时缓解这两方面的影响。
以问题为中心的信息获取方式就是我现在使用的折中方案,本文中分成这几个部分介绍:
  1. 提出问题:从哪里获取灵感提出问题,以及可能会提出什么样的问题;
  2. 处理问题:怎样分类处理问题;
  3. 使用的工具:使用什么工具来践行这个流程。
最后,我还希望说明我从这种方式获得了什么收益,它又有什么不足。

焦虑与偏见

互联网以一己之力改变了大多数人的信息获取途径,除了读书,以前我们看报或是看电视,现在我们上网。在互联网上,我们能接收到全世界的信息,Web 2.0 的去中心化更让信息的生产成本降到最低,只要能写就能发布,这造成了互联网上的信息量爆炸式增长,博客、微博、知乎处处是「干货」。哪怕使用 RSS 的人,也常常面对令人绝望的信息数。
从人类进化的初期,一直到一个世纪以前,食物与信息都对人有至关重要的作用。食物能够给人提供热量,一条「哪里有食物」的信息也能够帮助人们存活下去。随着工业革命带来的生产力提高,食物的生产越来越容易,多数发达国家已经摆脱了食物的缺乏几十年,可是,人们仍没有摆脱刻在基因里的大量进食习惯,美国还有超过 30% 的人受肥胖困扰。信息上的问题更严重,信息井喷的开端至今不过十余年,人们仍然认为信息都是有用的,担心自己少知道了什么,这引发了严重的「信息焦虑」
另外,随着近年来机器学习的发展,「信息茧房」逐渐引起了人们的担忧。机器学习的算法会根据以往的阅读经历,给用户推荐更可能感兴趣的内容。这就带来了一个问题,这样的算法会让人不断阅读同类型、同态度的文章,反复加强对于一个观点的认同,让人以为这就是最客观正确的看法,而如果连其他观点都看不到,更遑论全面地认识问题了。
可是,「信息茧房」只是将这个问题强化了,让更多的人意识到了这个问题的存在,实际上这个问题自古有之。没有机器学习时,RSS 、报纸和杂志的订阅都是自主选择的,可我们难免收到确认偏误的影响,认为符合我们见解的订阅源质量更高,从而「作茧自缚」,深陷认知偏见的囹圄。在这种情况下,我们还是很容易认为自己的观点更客观、更有效,对其他的观点产生偏见。
最可怕的是,哪怕接受过良好的教育,认知偏见仍然很难避免。麻省理工科技评论的一名读者,对人类活动导致全球变暖的观点嗤之以鼻,他能在自己的资料库中找到无数相关资料,却不愿意认真地思考反面观点,哪怕它被许多专家认同。那位读者有两个博士学位,从事技术工作,在自己的领域想必有所建树。他也有一个巨大的资料库,涵盖了成千上万个话题,仍然没能避免认知偏见的问题。

探索的历程

我收集信息的尝试经历过三个阶段:一开始,我进行了大量阅读,虽然能够见到不同观点,但大量积压的文章造成了很强的焦虑;后来,我尝试进行「信息节食」——只保留少量精选订阅源,虽然这样能够细读每一篇订阅,但精选的过程本身就在加强认知偏见,减少订阅也容易引发信息焦虑;最后,我受到其他人的启发,决定尝试以问题为中心的信息获取方式。

大量订阅

最初,我希望尽量避免认知偏见,订阅大量的信息源,吸收各种各样的观点。先不谈它有没有解决认知偏见,单是阅读无数文章的时间就几乎占满了我的课余时间,纵使我已经很努力在读了,积压的文章仍然越来越多。
假如我根据标题或是首段过滤,确实可以快速处理一部分文章,可是这让我更容易身陷认知偏见——不但相反的观点没读到,还重复读了很多相同的观点。不仅如此,大量积压的文章还增加了我的心理压力,让我产生了很强的焦虑。最后,我不仅担心自己有什么不知道,还担心自己知道得不客观。

信息节食

后来,我看到了 JP Rangaswami 在 TED 的演讲——信息即食物。针对现在的食物富足,我们发展出了许多健康的饮食方式,由此启发,我决定求助生活中一直践行的极简主义,实行「信息节食」。
当时我只保留少数精选订阅源,其余全部删掉。这确实解决了我的大量积压文章,也让我能更好地阅读每一篇推送。可是,它既没能解决信息焦虑,也没帮助我摆脱认知偏见。没有什么媒体是完全客观的,我只精选出少数几个信息源,很难避免认知偏见的影响;阅读更少的文章也让我担心错过了什么——这一切都在加深我的焦虑。
由于担心认知偏见,我选择追逐各处的优质源,不堪重负时,就再「节食」一次。有段时间我甚至认为,也许这就是最好的办法了吧——毕竟事物都是在螺旋式上升中发展的,不是吗?

思考新方法的契机

一段时间以后,我有幸跟随参与起草 4G 协议的一位学者完成一个项目。令我惊讶的是,他并不进行学科内的大量阅读,也不追求了解所有的通信技术。他认为大量阅读是为了打基础,除了初入一个领域以外,都没必要进行大量阅读。知名生物学家施一公教授在博客中也曾写到,他的博士后导师 Nikola 同样不进行大量阅读,甚至更极端一些,诺贝尔获得者的交流邀请都会拒绝。这让我认识到,不定向大量阅读的价值未必那么大。
在训练阅读文献能力和完成项目期间,我还意识到了主动思考和阅读同等重要。无论是一篇文章,还是一篇论文,都提出了一个问题,并展示了一种解决方案。作者提出的解决方案固然有价值,但他试图解决的问题价值更大。如果我既思考并寻找证明作者观点的论据,又试图找到证据反驳作者的观点,在这样的过程中,我通过正反两个方向的大量阅读和思考,减小了认知偏差的影响,得到了相对更可靠的结论。
总结起来,就是怀疑地看待所有观点,对于自己有兴趣的主题,从作者观点的正反两个方向出发,自己重新解答问题。虽然我认为这个方法在解决认知偏差上有所帮助,但不得不承认,主动搜索资料、自己回答问题耗费的时间比单纯阅读多得多。这让我不得不在广泛的问题来源和针对问题的思考上做出取舍,最终我决定放弃大量订阅,转而尝试一种新的信息获取方法。

以问题为中心的信息获取流程

我认为这个流程主要有两个阶段——收集问题与处理问题。收集问题是为了提出有价值的问题,通常在碎片时间或状态不佳时进行。处理问题则使用能够专注阅读的时间,我选择将这个阶段分为两部分,一半用来解决碎片类问题,一半用来学习结构性的知识。

收集问题

这种信息收集方式中,最重要的就是提出一个好的问题,所以问题来源非常重要。我的问题小部分来源于生活,另一小部分来源于消遣时读的非虚构说理类书籍和虚构类文学书籍,大部分则来出自下面几个信息源:
  • 学科和研究领域内的几本核心期刊:阅读这些是为了打好基础,以后会放弃一部分。核心期刊的文章大多价值很高,哪怕和自己没关系,也可以从中学习研究思路和实验设计;能找到漏洞更好,也许就有机会发文章了。
  • TED:这是我认为最适合收集问题的地方。TED 邀请的大多是该领域的专家,他们认为值得一谈的问题往往价值很高,而且观点时常十分出色,参考意义很大。
  • 麻省理工科技评论:我从这里发现有兴趣的理论或是技术。麻省理工科技评论作为知名科技评论期刊,时效性更强,可以知道在发生什么,有时也会提供有价值的观点。
  • 少数派:主要收集工具功能更新和使用心得。电脑作为生活中最重要的工具之一,有必要对此保持关注。介绍类内容可信度较高,无论更新了什么、技巧有没有用,一试就知道。
  • 三联生活周刊:订阅它主要是为了扩充视野。周刊比日报有更多的撰稿时间,也不那么强调时效性,我认为他们的选题常常值得思考和拓展。
对于收集到的内容,我常常产生的问题包括但不限于:
  • 这是什么?
  • 这是真的吗?
  • 为什么提出这个问题?(这个方法试图解决什么?)
  • 这个好在哪?又有什么问题?
  • 这对现实有指导意义吗?

处理问题

通过上面的方法收集到的问题常常迥然不同,例如「这是什么?」既可能是想了解一个物品,也可能是想了解一个学科,显然它们不太适合同样的解答步骤。对此,我将遇到的问题大体分为下面三类:
  • 知识类碎片性问题——维生素 E 有什么用?蓝光对人有没有危害?
  • 知识类结构性问题——通信原理是什么?色彩心理学是怎么一回事?
  • 说理类问题——深色模式比浅色模式好吗?我们应该警惕「娱乐致死」吗?
对于知识类碎片性问题,我会通过提纲的方式提出若干子问题,然后大量搜索信息,试图解决问题。在查阅资料的过程中,也常常会发现新的问题,从而添加到提纲中,或是完全修改结构。
在面对这类问题时,我会优先寻找相关书籍或文献,同时谨慎筛选微信、微博、知乎、Quora 上面的信息。并不是说这些网站上面的作者水平有问题,而是这些地方的文章常常是一座孤岛,不提供参考文献相关文章。我认为,参考文献的好处有这么几个:
  • 确认来源:有时候我们需要确定文章提供的论据是否可靠,这时可以通过参考文献直接确定作者、文章来源与使用的方法。
  • 开拓视野:参考文献和被参考文章中常常包含了不少相关文章,不仅有相同观点,也有作者试图驳斥的观点,综述性文章更可能提供其他的思路。
  • 提供关键词:关键词在搜索中的重要性不言而喻,一个新的关键词可能带出一系列内容,参考文献的起名与摘要常常能提供新的关键词,对于检索信息有所帮助。
在找到相关的文章后,我会将网页或文献的 PDF 版、链接和自己的简单总结保存在提纲下。如果我认为一个子问题的正反两个方面论据都足够充足了,就会给出自己的答案。最后,再将所有子问题的答案汇总,形成一篇由来源、论据和个人总结组成的报告。
对于知识类结构性问题,我倾向寻找高评价的入门读物,并寻找几本经典教材,阅读它们的前言、目录和第一章。经过这样的过程,我一般能了解这个学科的研究目的是什么,大体包含哪些领域。在了解这些之后,我会确定自己只需要其中一部分还是需要系统地学习。如果不需要系统学习,那么作为碎片性问题处理;如果有必要通读,那么将问题转移到系统学习的列表上,不占用解决碎片性问题的时间。
说理类问题有时可以转化为知识类碎片性问题,也有时不好回答。比较深色模式和浅色模式时,就可以从护眼、效率等方面讨论,这时的讨论都建立在相关研究的基础上,因此转化为了许多知识类碎片性问题。说理类问题也常常指向人生意义一类的问题,比如这样的一个逻辑链条:
——我们需要警惕「娱乐至死」吗?
——需要,因为每个人都只追求娱乐会带来《美丽新世界》中的世界。
——《美丽新世界》中的世界哪里不好?
——因为人们不再思考了,不思考就不可能改变那样的现状了。
——可他们快乐啊,为什么要改变?
这直接指向了「人生终极问题」——人的意义是什么,我认为这些属于信仰的范畴,相信宗教、马克思主义或任何哲学思想都只是一种选择。对此,我们需要在长期的阅读和生活中建立起自己的观点,没必要也不可能在短时间内通过查阅资料解决这类问题。

使用的工具

在这样的信息收集流程中,我使用的工具其实很少,只有浏览器和备忘录。
收集问题的过程中,我常常在一个信息源连续阅读多篇文章,这时 RSS 带来的统一阅读体验优势并不显著。另外,我的订阅源数量不多,也没必要专门管理。所以,我一般直接从收藏夹访问各信息源主页,没有采用其他工具。
针对问题进行检索的过程中,我主要使用 Google、Google Scholar 和学校提供的数据库。Google 和 Google Scholar 本身的搜索能力无需多言,配合布尔运算、限定文件类型等功能更是如虎添翼。学校购买的数据库则起到辅助作用,大部分时候有数据库才能读全文,也有时能够在其中发现 Google 错过的文章。
在查阅资料的过程中,我使用 Safari 的阅读模式配合打印保存文章。使用阅读模式的目的是为了优化排版,毕竟如果 PDF 原样保留网页上的各种菜单、控件,导出后既占空间又不好看。通过 Safari 将网页导出成 PDF 有两种方式,一种是在文件菜单中直接导出 PDF,另一种则是进行打印,然后保存 PDF 文件。二者的区别在于直接导出没有页眉页脚,通过打印导出则会在页眉页脚标注网页标题和 URL。我希望能够在总结中追溯到原网页,所以倾向带有 URL 的版本。

打印出的 PDF
在总结部分,我主要使用备忘录进行记录。使用备忘录的原因我希望将信息源的链接或 PDF 文件附在总结中,而备忘录在全平台都能够直接附加并打开 pdf 文档。值得一提的是,macOS Mojave 给 Quick Look 增加了 Markup 功能,因此 macOS 下的备忘录也不必等待 Preview 漫长的启动过程,而是可以通过 Markup 快速预览 PDF 文件了。
MWeb 是我正在试用的一款优秀的笔记应用,我正在考虑是否以其替代备忘录。MWeb 提供的 LaTeX 公式和流程图对我吸引力很大,大纲和方便的导出功能更是锦上添花。唯一让我犹豫的一点是 MWeb 是以 URL 的形式处理 PDF 附件,点击链接后只能跳转到文件位置,仍然需要手动打开文件,添加和打开都不如备忘录方便,也无法搜索附件内容。不过,这样的形式不会像备忘录一样,每个文件单独占一块空间,可以让最后的总结更好看。如果 MWeb 能够直接打开以及搜索附件,或者什么时候我习惯了这种模式,也许会改用 MWeb 进行总结。

流程的收益与不足

首先,这样的流程帮我缓解了信息焦虑。诚然,我还有无数的内容不知道,在这种耗时不短的流程下,我获取的信息比大量阅读少得多。但是,这个过程增强了我的信心,让我明白「我知道什么」,也相信自己有能力解决没见过的问题。因此我的信息焦虑平和了下来——不知道没关系,我还可以查嘛。
其次,我有理由相信自己的结论是相对客观的。诚然,无论我做了多少工作,都不可能完全摆脱认知偏见。但是,主动进行搜索能够摆脱订阅和机器学习带来的「信息茧房」,怀疑和逆向思考又有助于降低「确认偏误」,这已经是我能想到的最好解决方案了。而且大部分情况下,我能得到比信息来源给出的更丰富,或是更可靠的答案。
除了缓解信息焦虑和降低认知偏见外,这样的流程还有另外三个优点:
第一,这样的流程可以降低碎片信息不成系统的影响。实际上,无论什么学科,都是建立在一篇篇碎片化的论文上的,将这些分散的定理、实验总结起来,才形成了系统性的专著和教材,甚至整个学科。所以,碎片化的内容没有那么可怕,只是我们应该将它们拼起来,形成系统而已。
第二,这样的流程给了我获得了很强的满足感。我们喜欢游戏,因为它们会将任务拆成一个个小目标,我们在不断达成小目标中获取快感。这个流程就像是一个游戏,我提出一个个小问题,然后不断解决它们,让人欲罢不能。
第三,这样的流程总结出的观点也给了我和其他人交流的机会。当有人认真阅读了自己的观点,甚至据此提出了自己的意见时,很多人都会对此感到高兴,也乐于进行相关讨论。我遇到疑问时曾经联系过一些论文的作者,不少人都乐于提供帮助,让我获益匪浅。另外,我通过自己的总结撰写文章后,也有幸和少数派的编辑 Minja、文刀漢三和 Hum 交流,特别是 Hum,在文章结构、文字说服力方面给了我很大帮助。
至于这个流程的问题,第一点就是耗时长。面对一篇文章,如果只吸收它的内容,几分钟就可以完成;可是一旦试图重新思考,时间就会成倍的增加。有的时候很幸运,几篇文献或是几本书就让我得到了可信的结论;可有的时候我会在一个问题上纠结几天,甚至半个月。
第二点是,这样的流程受限我的自身能力,不熟悉的学科里问题尤其严重。对于一个问题,每个人的思考都会受限于自身眼界、思维方式。寻找论据更是完全依赖搜索能力,一个关键词没想到就可能错过一大块内容,这也是为什么我更喜欢有参考的文章。对此,我没有太好的办法,只能多阅读各种学科的基础书籍。打破信息闭环恐怕没有捷径可走,只能徐徐图之。

结语

每个人对信息的获取都有自己的取舍:有人追求效率,希望用最少的时间获得最多的知识;也有人追求严谨,不喜欢被动接受,希望自己求证。这取决于每个人的价值选择,没有标准答案。我无意进行价值观的输出,只希望展示一种可能,表明有人这么做了,而且效果还行。
我们寻找更好信息获取方式的脚步恐怕永远不会停歇,愿在此与君共勉。

上一期
团队中的日历协作 | 工作日志
下一期
OmniGraffle 推出黑暗模式界面模版、微软支持 Emoji 11.0 | App 奏折 047
 
精选评论(1) 我的评论
  • prohack
    对于作者提到的流程的不足,个人认为这个不是不足。
    面对一篇文章,只吸收它的观点确实会有所成长,然而却不及自身去重新思考成长更多。虽然表面来看时间成倍的增加,但是当积累越过一个临界点时,成长速度可以很快,这类似于一个S曲线。对于不熟悉的学科,因为本来知道的就很少,前期花费的思考时间就更多。
    所以,个人认为深度学习中,积累必不可少,有些阶段就是无法快速跨越,必然经历时间长收获少的阶段,这也是为什么成功总是少数,有一部分在这个阶段拘放弃了。
    07月29日
    • 少数派编辑部
      您好,我完全赞同您关于深度学习和积累的看法,这个过程是无法避免的。不过,这里的时间长指的是筛选的时间。相比从可信赖的书籍或文章直接获取信息,这样主动搜集的过程会遇到大量相似的内容,哪怕是扫读也会花费不少时间。这确实不是有待改进的不足,更像是一种缺憾,在文中列出是为读者取舍提供参考。

      —— 作者 Abe
      07月29日