Google Hacking
Google Hacking就是利用搜索引擎强大的搜索功能,选用搜索语法和特殊的搜索关键字,将隐藏在目标网站中的不恰当配置信息和后门信息找出来。
基本语法
- and :逻辑与
- or :;逻辑或
- +:强制包含搜索项
- -:逻辑非
- “关键词”:完整匹配
- *?:通配符
高级搜索
- site:搜索具体服务器或域名的网页
- filetype:搜索特定类型的文件
- intitle:搜索网页标题
- inurl:搜索URL
- intext:搜索正文
- link:搜索连接到指定网页的网页
- allintitle:用法和intitle类似,但可以指定多个词
这些方法可以互相可以组合。
附:Filetype所支持的文件类型
• Adobe Portable Document Format (pdf)
• Adobe PostScript (ps)
• Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
• Lotus WordPro (lwp)
• MacWrite (mw)
• Microsoft Excel (xls)
• Microsoft PowerPoint (ppt)
• Microsoft Word (doc)
• Microsoft Works (wks, wps, wdb)
• Microsoft Write (wri)
• Rich Text Format (rtf)
• Text (ans, txt)
实例
实例1:site、filetype、intext 配合
1
| site: scu.edu.cn filetype:xls intext:冯玮
|
实例2:google搜索自己的blog是否被收录
网络攻防技术课程实验–>域名信息收集工具
实验要求
- 支持百度搜索引擎的域名提取,其中从百度搜索引擎提取的域名需为真实域名,而非百度的域名跳转链接。
- 可扩充其他功能,比如域名所在的标题等信息。
python代码的实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
| import requests from bs4 import BeautifulSoup from urllib.parse import urlparse import time import random
def baidu_search(pages): Subdomains = [] Subdomains_dict = {} hearders = { 'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36 Edg/90.0.818.56', } for start in range(pages): url=f'https://www.baidu.com/s?wd=site%3Adouban.com&pn={start*10}' resp = requests.get(url,headers=hearders) time.sleep(random.uniform(0.5,1.5)) soup = BeautifulSoup(resp.content,'html.parser') class_name = "result c-container xpath-log new-pmd" div_elements = soup.find_all('div', class_=class_name) for i in div_elements: link = i.get('mu') domain = str(urlparse(link).scheme + "://" + urlparse(link).netloc) if domain in Subdomains: pass else: Subdomains.append(domain) Subdomains_dict[domain] = i.h3.a.get_text() return Subdomains_dict
dict = baidu_search(10) for key, value in dict.items(): print(f'{key}: {value}')
|
运行结果:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
| https: https: https: http: https: http: https: https: https: https: https: https: https: https: https: http: http: http: https: https:
|