Google Search Tips

Google搜索技巧的清单

  • link:URL = 列出到链接到目标URL的网页清单.
  • related:URL = 列出于目标URL地址有关的网页.
  • site:domain.com 搜索区域仅限于目标网站.
  • allinurl:WORDS = 只显示在URL地址里有搜索结果的页面.
  • inurl:WORD = 跟allinurl类似,但是只在URL中搜索第一个词.
  • allintitle:WORD = 搜索网页标题.
  • intitle:WORD = 跟allintitle类似,但是只在标题里搜索第一个词.
  • cache:URL = 将显示关于URL的Google缓存(中国不可用).
  • info:URL = 将显示一个包含了这些元素的页面:类似结果的链接,反向链接,还有包括了这个URL的页面.在搜索框里直接输入URL会起到同样的效果.
  • filetype:SOMEFILETYPE = 指定文件类型.
  • -filetype:SOMEFILETYPE = 剔除指定文件类型.
  • site:www.somesite.net “+www.somesite.net” = 显示该站点有多少网页被google收录
  • allintext: = 搜索文本,但不包括网页标题和链接
  • allinlinks: = 搜索链接, 不包括文本和标题
  • WordA OR WordB = 搜索包含两关键词之一的页面
  • “Word” OR “Phrase” = 精确的要求搜索单词或者句子
  • WordA -WordB = 包含单词A但是不包含单词B
  • WordA +WordB = 都包含
  • ~WORD = 寻找此单词和它的同义词
  • ~WORD -WORD = 只搜索同义词,不要原词

top10 wrong way 4 big data

[From] (http://www.cnblogs.com/wentingtu/archive/2012/03/16/2399921.html)

我们很容易犯以下错误,如果:

  1. 缺乏数据(Lack Data)
  2. 太关注训练(Focus on Training)
  3. 只依赖一项技术(Rely on One Technique)
  4. 提错了问题(Ask the Wrong Question)
  5. 只靠数据来说话(Listen (only) to the Data)
  6. 使用了未来的信息(Accept Leaks from the Future)
  7. 抛弃了不该忽略的案例(Discount Pesky Cases)
  8. 轻信预测(Extrapolate)
  9. 试图回答所有问题(Answer Every Inquiry)
  10. 随便地进行抽样(Sample Casually)
  11. 太相信最佳模型(Believe the Best Model)