(全文字数:2189字,阅读完大约需要7分钟)
哥哥姐姐弟弟妹妹们,大家好,我是王同学。
时间对所有的人都是公平的,每人每天都只有24个小时,古人是这样,现在的人也是这样。但是,现代社会的信息量在爆炸式增长。当我们用有限的时间除以无限的信息,我们发现,可以分配到每个信息上的时间几乎为零。
现代人搜索有用信息的难度越来越大,无关的,干扰的,难以辨别真伪的信息铺天盖地。搜索能力比以往任何时候都有必要成为我们的必备能力。
01 | 搜索引擎的原理
搜索引擎抓取数据的时候,有广度和深度两个维度。对于我们日常使用的综合类搜索引擎,原理是广度优先,深度次之。
搜索引擎会派出爬虫去整个互联网进行遍历,扒取网页信息,将抓取到的网页存放到一个临时库当中,进行分析,不符合规则的,清除掉,符合规则的放入到自己的索引区,在索引区内对网页进行分类,归档,排序。
当客户在搜索引擎上输入关键词的时候,将符合这个关键词的网页一次性推送给搜索者,于是,我们可以在一瞬间得出成百上千,甚至几百万个搜索结果,这个搜索结果是搜索引擎早就在索引区分析好的,不是我们输入词之后才去爬的。
当然,对于爬取过的网页,搜索引擎的爬虫,隔一段时间还要再爬一次,因为网页有可能更新的,也有可能作废。
另外,尽管很多搜索引擎非常强大,但是任何一个搜索引擎可以搜到的网页不超过整个互联网总网页数量的30%。还有大量的网页是搜索引擎所搜不到的。[1]同时,不同的搜索引擎之间,他们的网页重合度也在70%以下。对于那些我们想要搞得非常清楚,非常重要的内容,可以结合谷歌,必应,百度等各种搜索引擎来获取信息。
前面我们说了,综合的搜索引擎以广度为优先原则进行网页的抓取,那有没有以深度为优先原则进行抓取的搜索引擎呢?
有的,这就是垂直搜索。
02 | 垂直搜索
搜索领域有句话说的很有意思,用户无法清晰描述他想要什么,除非让他看到具体的东西。百度搜不到的数据可以垂直搜索,垂直搜索的特点是专,精,深,满足用户越来越细分的需求,在垂直细分的领域内,只有用户想不到,没有平台搜不到。
举个例子,我们想要看看最新的新能源汽车行业报告,我们可以去哪里看呢?百度/谷歌上搜索吗?[2]用上我们在前面文章中用到的搜索指令?其实效果都不好。
麦肯锡,波士顿咨询和贝恩是全球三大咨询公司,[3]他们对行业的分析处于全球顶尖地位。我们可以很方便的在他们的官网上找到对于这个行业的分析和看法。这些资源比我们使用公共搜索引擎搜索到的资料纯度更高,可信度更高。
使用这种垂直搜索,搜索到的资料不是其他方法可以比拟的。
还有,网盘搜索,盘搜是一个神器,很多很难找到的资源,如文档,PPT,电影,电视都可以通过网盘直接搜到。比如说,56网盘等。
还有就是磁力链搜索了,这个男生都比较懂,无师自通。磁力链接类似于商品条码,是一串用来识别文件的,由数字和字母组成的数码指纹。往往可以找到很多不方便公开的资源和很冷门的资源。
03 | 搜索的重要性有多少
最后,我们来看一个小案例,比如说小赵同学刚刚大学毕业,需要找一份工作。那么,他该如何通过搜索解决问题呢?
比如,小赵想要入职ABC人力资源公司,该如何搜索呢?直接百度吗?绝对不行的,搜出来基本都是这家公司的广告。一般情况是去拉钩网,BOSS直聘,智联招聘这些垂直网站上去看看这家公司的招聘,看他们公司有什么岗位需求。如果还不放心的话可以去看准网上面,看看这家公司离职和在职员工的评价,不同岗位的薪水。职友集是一家专门做公司点评的网站,把这家公司的名字输进去,看看公司的概况,招聘,薪酬,照片,评论,新闻,公司产品还有融资情况,这样就对公司有了一个全面的了解。最后一步,实在不行就实地考察一下。
最后,王同学想说的是,其实上面这些步骤有必要但是都不重要。最重要的是我们为什么要进入一个行业?为什么要选择这座城市?为什么要进入一家公司?为什么要做那个岗位?我们对自己的职业规划大概是什么样?这些问题其实才是最重要的,具体选择的那家公司往往不是最重要的。
当我们想好了这些之后,应该对自己有一个规划和定位,直接去联系这家公司的招聘人员,说出自己心目中的职位,而非等着别人安排给我们,一定是自己选公司,而不要等着公司来选自己,实在不行就下一家,清楚自己的定位,达到自己的目的才是最重要的。
于是,我们会发现,这些和具体的搜索技术无关,最重要的是关于思维方式的。搜索技术只能帮助我们解决一些鸡毛蒜皮的小事。甚至,对于大多数人而言,搜索技术只是拿不上台面的一些细枝末节技能,能够决定我们走向和高度的还是思维方式。搜索技术,我们需要掌握,但是千万不要在上面花费太多时间。
这是关于搜索技术的倒数第二篇文章,下一篇再写一下搜索的思维方式,就直接结束这一部分。搜索技术对于我们的能力提高重要性不大,不值得花费太多时间。
未完。
祝勇猛精进,心想事成。
王同学
2022.8.12
[1] 我们一般可以用搜索引擎搜到的网络叫做表层网络。只是互联网的一小部分,其实大量的网页,普通的引擎无法到达,叫做深层网络。深层网络当中还有一部分,数据加密性极强,数据需要多节点传输来保证访问者匿名,这种叫做暗网,一般需要通过洋葱登陆,为什么是洋葱?如果大家有兴趣,可以自己探索一下。
[2] 百度学术和谷歌学术上面很靠谱,我们说的是普通搜索。
[3] 不同行业的垂直细分需要自己日常积累。
创业项目群,学习操作 18个小项目,添加 微信:jjs406 备注:小项目!
如若转载,请注明出处:https://www.jjsgsy.com/2711.html