首先要知道常见的搜索引擎最起码有5个,而不是仅仅度娘,百度全球搜索份额占比不到百分之一。
2022年全球搜索引擎市场份额中,谷歌,必应,雅虎,yandex,百度,DD市场搜索占比

  • 谷歌:92.42%
  • 必应:3.45 %
  • 雅虎:1.32 %
  • yandex:0.79 %
  • 百度:0.65 %
  • DuckDuckGo:0.63%

参考链接

老规矩,工具先上。搜索工具

信息检索是一门独立的课程,里面对信息的检索有非常系统的概述。我这种学渣是做不到对那么大的框架做提炼。

因为在类互联网行业待过,自以为在信息检索方面比一般人会稍微强一点点,偶尔与人沟通时也会聊到关于信息查询方面的知识,写这篇文字一是感叹于这种捅破窗户纸的东西还是有人不知道,二是有的人竟然认为这层窗户纸比愚公移山还难。诚然,每个人的世界都是局限的,这是个哲学问题,我无法探讨。但是打破信息茧房并不是那么困难,只需要使用一点点技巧,了解一点点知识,我们的搜索能力就能大步提高。

注意,检索到信息,它最核心的作用的打破信息茧房,这不代表你具备了信息描述的能力,比如你可以轻松搜索到单片机的设计工艺,但不代表你真的会设计单片机。检索信息仅仅提供了可能性的基础。

在这里我先不谈正在爆发的技术会带来的革新,先从最简单的逻辑说起,信息检索我把它白话成以下几步

  1. 确认你的问题
  2. 知道信息大概存在于哪里
  3. 不停接近这个信息,判断信息并且缩小它所在的范围
  4. 获得信息

1,确认与分解问题

是的,第一步似乎和检索没有任何关系,但是大部分人检索不到信息,是因为他压根就不知道自己的“问题”是什么。

很可能你一直以来的提问方式就是错的,你的真正的“问题”不一定是你过去的“提问方式下的问题”

比如:如果想提高英语(提高代表你有英语基础),我去检索“如何提高英语”。相信绝大部分是广告,其次可能是匹配度不高的信息,比如你想提高的是口语,展示的信息却是对英语的写作。

也就是说,你的一个不恰当的问题,会出现80%的不相关结果,在不停地筛查中,你会放弃,因为一个不爱明确提出具体问题的人往往也没耐心去筛选信息。

那么,先要确认你要提高英语的哪个点,这时候你会发现有两种情况:

  • 你只是受环境影响,你的某个同事浏览英文网站被你看到了,所谓想提高英语仅仅是因为从众心理,实际上你压根就不想提高英语。
  • 你学习英语是因为你的岗位也很多英文咨询,所以先了解跟自己行业相关的英语网站可以帮自己解决工作问题。你就可以开始分解这个宏观的问题
    • 有哪些英文类的咨询网站
    • 看这些网站你面临哪些困难,把每一个困难变成一个问题

如果是第一种,那你大可不必做一个虎头蛇尾的事情,眼下你可能有更加重要紧急的事情需要去处理。

如果是第二种,比起“如何提高英语”,你把问题定位到了“xxx行业的英文类资讯网站有哪些”,同时对一个宏观的问题做了拆解。

这里可能会反驳,这和提高英语有关系吗?那你不妨再问自己一句,提高英语干嘛呢?你是信仰英语吗?无所指代的问题,只配得到无法应用的答案。


2,知道信息存在于哪里

我自己把信息分为,广泛传播的,未广泛传播的

  • 广泛传播的信息
    • 学术资源,如书籍,期刊,论文
    • 新闻媒体评论
    • 博客,论坛
    • 高校,企业,政府,无政府组织,公益官网
  • 未广泛传播的
    • 细分领域的圈层信息
    • 会所,部分协会等内部资料
    • 涉及隐私或不具备广泛传播特征的信息,如:小企业的财务状况,你喜欢的女孩子是不是单身

对于广泛传播的信息,似乎比较贴切我们的主题。而未广泛传播的更加适合于身体力行,但是似乎逻辑都是一致的。

如果你的问题是“某某女孩是否单身”

1,确认问题是什么,“xxx是否单身”
2,这个事情,她自己必然知道,其次可能他的身边朋友
3,接近她的朋友或者直接找到她,侧面打听
4,你会得到一些列回答,再进行判断

当然,这种未广泛传播的信息,更多的是需要社交方案,自己的平台及形象。并且未广泛传播的信息本身可能不具备合法性,比如你如果想了解竞争公司的财务状况去贿赂人家的财务,就已经踏进牢房半步了。另外还有暗网,黑产如社工库这些,都是非法的。


3,接近与获得信息

这里要做两个假设前提,当然,即使这样你也能处理99%的信息获取壁垒了

1,你需要的信息是广泛传播的信息
2,你具备条件检索到它(特指技术层面,如权限,防火墙等)

如何接近信息呢?

1,将拆解的问题,分步搜索,比如:搜索信息所在的地方,回到案例1,我们先得到了一些英文行业资讯【确定了信息存在于哪里】。
2,你发现很多单词非常陌生,那你的问题就是“某某行业的英文术语”,因为你甚至这些可能是书籍的形式出现,那你可以通过搜索技巧“某某行业的英文术语 filetype:pdf”。这样出来的结果就是PDF的文件,内容关于“某某行业的英文术语”。
3,你发现单词量太多了,你认识的不到10%,那你就需要思考如何”背单词“,所以你可以搜索”背单词的常见方法“。
4,或者你需要注重发音,那你就需要去查询发音,但是一个个查询太慢了,那你可以搜索”单词的发音规律“,也可以”单词的发音规律 filetype:pdf“。
5,你可能会重新接触到音标,那么思考下”音标是发音“,所以你明确这个信息会存在于视频中,所以你开始搜索视频”英语音标教程“

综合,你从一个提高英语的问题(似乎非常宽泛),根据你的实际背景拆分了以下步骤

1,找到你要解决的问题【行业英文咨询】
2,导向第二个信息【行业的英文术语】
3,导向第三个信息【背单词的常见方法】
4,导向第四个信息【单词的发音规律】

….

这个过程就是接近你想要的信息(为了解决问题),是的,他不是独立的一个信息,而是一系列的信息等你分布消化,且这个过程并非发生在一瞬间,而是和你互动。