老司机的goole搜索技术

内容纲要

小事儿用百度,大事儿用谷歌,这个大家都知道,但是google有一些高级的搜索语法和搜索技巧可能大家还不太了解,这么俺在这里就给大伙总结了一下,希望大家多多运用下面的技巧,假以时日,必能百搜百中。

关键词的逻辑关系

  • and
    xx 空格 xx,关键字越多越精确,要善于总结关键字,一般也是最常用的技巧
  • or
    xx OR xx, OR 一定要【大写】
  • not
    xx -xx, (-后面没有空格)从搜索结果中排除特定字词,如: android 网络定位时 -GPS, 搜索结果不带GPS
  • 近义词
    ~ 紧挨着关键词之前放波浪号 ~ 表示搜索同义词。
    有了这个功能,你就不必用 OR 写一堆关键词。因为 Google 是足够聪明的,知道哪些词汇是近义词。 如: ~college

精确搜索

所谓的精确搜索,就是采用某些特定语法,尽量缩小搜索结果的范围,使结果更加符合自己的预期

  • 限定关键词的排列
    使用"" 搜索完全匹配的结果, "关键字",通过给关键字加双引号的方法,得到的搜索结果就是完全按照关键字的顺序来搜,以此来排除搜索选项。
    如:android 网络定位, 会出来android 网络定位,但顺序先后不固定,加上双引号关键词顺序就固定了
  • 限定搜索的网站
    在相应网站或网域前加上“site:”。例如:site:youtube.com 或 site:.gov。 如: unity site:zhihu.com
    还可以限制网站的目录名 例如:site:sunxvming.com/articles
  • 限定搜索的网页元素
    1. 只搜索标题
      用如下语法,要求 关键词2 必须在标题中,关键词1 可以在任何网页的地方
      关键词1 intitle:关键词2
      用如下语法,则要求两个关键词都在标题中
      allintitle:关键词1 关键词2
      出现在title中的结果质量一般会更高
    2. 只搜索网页正文
      语法同上,使用 intext: 和 allintext: 语法。
    3. 只搜索网页的 URL 网址
      语法同上,使用 inurl: 和 allinurl: 语法。
      (网页的网址,就是你在浏览器地址栏里面看到的那串)
    4. 只搜索网页中的超链接
      语法同上,使用 inanchor: 和 allinanchor: 语法。
      (使用此语法,只搜索网页中可以点击的链接的文字)
  • 限定文件格式
    使用filetype指定文件类型 如: 深入理解android filetype:pdf 完美世界 研报 filetype:pdf 注:只有Google支持的filetype才可用,比较常用的文件格式有:pdf、doc、rtf、ppt、xls

用通配符 * 进行模糊匹配

如:神舟
星号也可以配合刚才提到的 site: 语法一起使用
关键词 site:sina.com.
*可以是cn hk tw

括号的使用

如果你需要混用上述几种语法,就得考虑使用括号——看起来清晰而且不容易搞错不同语法的优先级。
举例:
关键词1 关键词2 (关键词3 OR 关键词4)

禁用“国别重定向”

Google 通常会根据“发起搜索的 IP 地址”来进行“国别重定向”。
比如:天朝的网民不翻墙直接访问 Google 搜索,就会被重定向到 Google 的香港站点;或者给你重定向到google.cn上,感觉上就想是上了个假的google。
要想禁止国别重定向可以点击如下网址http://www.google.com/ncr
ncr=no country redirect不做国家跳转

使用加密搜索

Google 大概是在 2011 年开始提供基于 HTTPS 的加密搜索。在那之前,主流的搜索引擎都是明文搜索的。
为啥 Google 要提供 HTTPS 的加密搜索捏?主要目的是:避免你的搜索行为被别人监控。
加密搜索后

  1. 你在搜索引擎上搜了哪些关键字,监控者是看不到的
  2. 搜索引擎返回给你的查询结果,监控者是看不到的
    不过现在google和百度都是默认https的连接,都是加了密的,如果浏览器网址旁边有个小锁子说明就是加密的连接
  • 加密搜索能规避浏览器的监控吗?
    答案是:不能!
    前几年 360 浏览器就被曝光过严重的用户隐私问题。它的行为很恶劣,会把用户访问的每一个网址都收集下来,然后发送到 360 自己的服务器上。这种情况下,加密搜索是帮不了你的。因为浏览器可以直接拿到地址栏里面的内容(也就是网址)。如果你使用搜索引擎,那么,根据相应的网址就可以判断出你输入了哪些搜索关键字。

使用Google的网页缓存(快照)

访问【加密的】搜索引擎缓存(快照)。目前 Google 的缓存是支持 HTTPS 加密的。所以,你可以通过 HTTPS 方式访问某个网页的缓存,就可以部分降低(但不是完全避免)被监控的风险。
为啥不是“完全避免”捏?因为 Google 的缓存,只是保存了页面本身的 HTML 内容。它并不保存页面上附加的网页元素(比如:图片、JS、CSS)。如果某个网页元素是通过 HTTP 明文传输的,那么,当你打开这个页面的缓存时,这些明文传输的内容还是会被监控到。
要想解决此问题,有一个替代方法——仅查看缓存的“纯文字版”
Google 在缓存网页的时候,会检查页面上是否有恶意代码。这样有一个额外的好处——规避网页上的挂马。另外,Google 的缓存有两种:一个是完全版,另一个是纯文字版。完全版基本上是页面的原貌,而纯文字版会滤掉网页的附加元素(JavaScript 脚本、CSS 样式表)。显然,“纯文字版”比“完全版”更加安全。
在 Google 的搜索框中输入:cache:你要看的网址 例如:cache:sunxvming.com
述方式看到的是缓存的“完全版”,在页面上方有一个链接,可以让你切换到“纯文字版”。
如果你想用缓存的方式,查看某个有风险的网页。这时候你自然想直接打开“纯文字版”,那么可以在浏览器地址栏输入如下:
https://webcache.googleusercontent.com/search?strip=1&q=cache:
然后把你要看的网址,追加到上述地址后面,变成这样
https://webcache.googleusercontent.com/search?strip=1&q=cache:sunxvming.com
上述网址中的 strip=1 表示“纯文字版”,滤掉页面的附加元素(JavaScript、CSS、等);如果改为 strip=0 就表示“完全版”,不滤掉页面的附加元素。
提醒一下,有些网站的功能非常依赖于 JavaScript 和 CSS,用纯文字版的缓存,可能会显示不正常。

其他搜索技巧

  • 搜索图片
    图片可以加筛选器进行各种条件的筛选
  • 以图搜图
    可以支持url 和图片上传
  • 搜索论文用google学术
    搜索的时候可以选择作者什么的以缩小范围