1. Como fazer pesquisas melhores no Google
1
Postado por: Pedro Pereira em: Google, Segurança
Você já parou pra pensar em quantas pesquisas faz no Google diariamente? Pesquisar a solução de um problema com seu servidor, o
endereço de alguma empresa onde você precisa ir, uma alternativa para um software, tutoriais, receitas, qual a hora exata em um
outro fuso-horário, etc. Praticamente qualquer coisa que você pergunte para o Google, ele vai saber responder. O problema é que
nem sempre ele responde claramente e muito lixo vem junto com os resultados relevantes à sua pesquisa.
Muita gente vai pensar que este post não tem nada a ver com segurança da informação. Porém, não poderiam estar mais enganados .
Saber usar o Google corretamente, usando os comandos que ele oferece permite que você encontre muito mais informações sobre
um alvo. Já vi muitos casos de empresas que não configuraram o robots.txt corretamente no site e permitiram que o Google
indexasse arquivos ou mesmo páginas e aplicações web que revelavam muitas informações confidenciais. Usar o Google para esta
finalidade chama-se Google Hacking. Além disso, conseguir informações de qualidade e rápido através desta excelente ferramenta de
busca vai fazer uma diferença enorme na sua vida, mesmo que você não trabalhe com segurança da informação.
Vou tentar ser o mais completo possível em relação aos comandos oferecidos pelo Google para que você entenda como encontrar
informações mais facilmente utilizando esta excelente ferramenta. Tenha em mente que nem todos estão aqui nesta lista, mas o que
estão irão realmente fazer uma grande diferença em como você usa o Google e na qualidade dos resultados que você ob tém.
Sintaxe dos comandos
Todos os comandos que você pode usar na pesquisa do Google compartilham uma mesma sintaxe:
comando:parâmetro
É sem pre a ssim: o comando que vo cê quer usar, o cara ctere “ :” e o parâmetro para o comando (extensão do a rquivo, texto a ser
busca do, etc., como ve remos mais a diante). No te que não há e spaço nenhum entre o comando e o “:” e nem entre o “:” e o
parâmetro. Além disso:
O “.” substitui um único ca ractere ;
O “*” substitui qualquer caractere, qualquer quantidade de vezes;
O “+” o briga o Go ogle a co nsiderar uma pa lavra que e le normalmente ignoraria na pesquisa. P or e xemplo, “livro +de
filo sofia” va i fazer com que o Goo gle co nsidere também o “de” como re levante para a pesquisa em questão;
O “-” e x clui palavras da pesquisa. P or e xemplo, uma pesquisa por “bateria -ca rro” vai excluir todos os resultados que
co nte nham “carro ”.
É bem simples usar os comandos do Google, o único trabalho que você vai ter é decorar os comandos! :)
Procurar apenas em um domínio ou site específico
Muitas vezes, enquanto você está juntando informações, você vai precisar focar a sua pesquisa em um domínio específico. Assim,
sempre que você fizer uma pesquisa no Google apenas as páginas e arquivos disponibilizados através daquele domínio (e
subdomínios) irão aparecer nos resultados da pesquisa.
Vo cê po de fazer uma pesquisa deste tipo usando o comando “site:” seguido do nome do domínio no qual vo cê deseja procurar. Então,
por exemplo:
site:pedropereira.net “ssh sem senha”
Va i pro cura r o te rmo “ssh sem senha ” a penas no domínio pedropereira.net e qualquer subdomínio que exista lá. Em bora e ste
comando sozinho já seja bastante útil, a utilidade de aumenta muito mais quando você o combina com outros. Por exemplo, para
procurar arquivos PDF no pedropereira.net você poderia fazer a seguinte pesquisa:
site:pedropereira.net filetype:pdf “ssh sem senha”
Assim, se existir algum arquivo no formato PDF hospedado no servidor do domínio pedropereira.net e que seja relevante à pesquisa
que vo cê fez, e le será e xibido na página de re sultados da busca. A propó sito, não se pre ocupe com o comando “filetype:” por
enquanto. A gente vai ver ele em mais detalhes mais à frente.
Procurar palavras similares ou sinônimos
Muitas vezes, você não tem certeza se a palavra que você precisa passar para o Google é exatamente aquela. Nestas ocasiões, você
pode falar para o Google buscar também por palavras semelhantes ou sinônimos de uma palavra. Isto é feito utilizando-se o “~”. A
pesquisa seria assim:
painel de ~administração
Assim , palavras semelhantes como “admin” também irão a parecer no s re sultados a umentando um pouco a a brangência da pesquisa.
2. Especificar tipos de documento
Em alguns casos, você quer procurar um tipo de documento específico que contém as palavras usadas na pesquisa. Por exemplo,
você está querendo encontrar um e-bo ok em PDF co ntendo a s palavras “iptables” e “intro duçã o”. Para isso, você precisa usar o
com a ndo “filetype:”:
filetype:pdf iptables introdução
Vo cê também pode procurar por vá rios tipos de arquivo ao m esmo tempo, separando cada um deles com uma “,”:
filetype:pdf,doc iptables introdução
2
Atualmente o Google suporta os seguintes tipos de arquivo:
Adobe Flash (.swf)
Adobe PDF (.pdf)
Adobe PostScript (.ps)
Autodesk Design Web Format (.dwf)
Google Earth (.kml e .kmz)
GPS eXchange Format (.gpx)
Hancom Hanword (.hwp)
HTML (.html, .htm e outras não informadas pelo Google)
Microsoft Excel (.xls, .xlsx)
Microsoft PowerPoint (.ppt, .pptx)
Microsoft Word (.doc, .docx)
Apresentações do OpenOffice (.odp)
Planilhas do OpenOffice(.ods)
Texto do OpenOffice (.odt)
Rich Text Format (.rtf, .wri)
Scalable Vector Graphics (.svg)
TeX/LaTeX (.tex)
Texto (.txt, .text entre outros) e também arquivos com código-fonte de várias linguagens de programação como Basic
(.bas), C/C++ (.c, .cc, .cpp, .cxx, .h e .hpp), C# (.cs), Java (.java), Perl (.pl) e Python (.py)
Wireless Markup Language (.wml, .wap)
XML (.xml)
NOTA: O Google vai buscar apenas a extensão do nome do arquivo. Ou seja, o Google não analisa o arquivo em si para definir se um
arquivo com extensão .xml é realmente um arquivo XML, por exemplo. Ele vai apenas confiar na extensão utilizada para nomear o
arquivo.
T am bém é uma boa ideia combinar o “filetype:” com o “-” para que e le exclua a penas as e xtensões de a rquivo que vo cê não quer que
apareçam nos resultados da pesquisa:
download ebook -filetype:pdf
Vai excluir os resultados no formato PDF da pesquisa.
Fazer pesquisas no cache do Google
Sempre que o Google indexa uma página, ele guarda uma versão dela no seu banco de dados. Este banco de dados pode ser
a ce ssado atra vés do comando “cache:”. Assim, lo go que você pedir para o Go ogle fazer a pesquisa, a ve rsão mais re cente da página
em cache será exibida para você. Isso pode acabar confundindo um pouco da primeira vez que você usa pois não irão aparecer
resultados da busca, apenas a página será aberta em um frame do Google.
Para ver o cache do pedropereira.net você pode usar o comando em dois formatos diferentes:
cache:http://www.pedropereira.net
cache:pedropereira.net
Se você não fornecer uma URL válida, o Google vai simplesmente fazer a pes quisa como se você não quisesse usar o cache. Por
e x emplo, uma pesquisa por “ca che:segurança” vai mostrar o s mesmos re sultados que uma pesquisa por “cache segurança”.
Além de permitir que você analise conteúdo mesmo de arquivos que já não estão mais no servidor alvo, você também vai poder
acessar o site como se fosse através de um proxy. Como um efeito colateral, acessar o cache do Google permite que você fique
anônimo enquanto navega pelo site da vítima.
Buscas por palavras contidas apenas no título
Se vo cê quer forçar o Go ogle a procurar o s te rmos que você pre cisa apenas no título das páginas, use o “intitle:”. Este comando faz
com que o sistema de buscas foque somente no título das páginas dos sites indexados para encontrar os resultados relevantes para
você.
3. 3
A busca fica assim:
intitle:teste
T o das as páginas que tiverem “teste” no título irão a parece r nos re sultados da sua busca. Este o perador é útil para auxiliar você a
encontrar listagens de diretório de sites. Uma busca como:
intitle:index.of “parent directory”
Vai mostrar as páginas que contém a listagem de todos os arquivos e diretórios de um site. Este tipo de listagem oferece a vo cê
muita informação valiosa sobre a estrutura do site e sobre quais páginas você pode pesquisar e encontrar problemas de seguran ça.
Buscas por palavras contidas na URL do site
Fazer a busca por elementos presentes na URL do site pode ser muito mais complicado do que fazer a busca baseada no título do site,
com o vimos a nteriormente com o “intitle:”. O problema com URLs é que elas podem mudar muito e conter ca racteres especiais com
os quais o Google pode não trabalhar muito bem. Isso pode fazer com que alguns resultados relevantes acabem não aparecendo na
pesquisa que você fez e omite informações importantes para o pentest. Além disso, o Google não usa eficientemente o identificador
de protocolo presente na URL (http://, ftp://, etc.).
Uma outra questão a se considerar é que o utros comandos como “site:” e “filetype:” podem procurar por e lemento s na URL de modo
m uito mais e ficiente que o pró prio “inurl:”. P ortanto, tome cuidado ao usar o “inurl:”. Porém, nem por isso e le deixa de ser um
comando importante a se aprender!
Usá-lo é exatamente a mesma coisa que já vimos anteriormente:
inurl:admin
R e pare que não há e spaços entre o “:” e o termo que vo cê está procurando. Assim, o Google irá co nsidera r apenas o s termos
encontrados na URL do site e em nenhum outro lugar. Além disso, você também pode adicionar mais termos para a sua pesquisa com
um e spaço depois de “admin”:
inurl:admin senha
Assim , em todas as URLs que tiverem “admin” também será procura do o termo “senha” e só depois o s resultados serão e xibidos pa ra
você.
Combinando comandos
Saber o papel de cada um dos comandos que o Google oferece para facilitar a sua vida nem sempre vai fazer com que você tenha os
melhores resultados na pesquisa. Alguns comandos não funcionam bem (ou simplesmente não funcionam) quando são combinados
com outros.
Para saber qual vai bem com outros e qual vai acabar dando pau eu fiz a lista abaixo:
intitle: Pode ser usado com outros comandos e também pode ser usado sozinho;
inurl: Pode ser usado com outros comandos e também pode ser usado sozinho;
filetype: Pode ser usado com outros comandos mas não pode ser usado sozinho;
site: Pode ser usado com outros comandos e também pode ser usado sozinho;
cache: Não pode ser usado com outros comandos e, obviamente, pode ser usado sozinho.
Espero que a lista deixe um pouco mais claro quando você pode ou não fazer as combinações de comandos.
Conclusão
Usar bem o Google não só vai facilitar a sua vida quando você estiver pesquisando sobre um assunto. O Google também vai te ajudar
nos seus penetration tests, mostrando informações que você possivelmente deixaria passar se buscasse manualmente. Por isso, é de
extrema importância que você saiba usá-lo corretamente.
Não pense que este texto aborda tudo o que você precisa saber. Existem livros inteiros a respeito deste assunto publicados, como o
livro do Jo hnny Long chamado “Google Hack ing for P enetration T esters” o nde e le aborda o uso do Go ogle com o foco em pentests ,
como o nome deixa claro. Leitura obrigatória para quem trabalha com segurança da informação, mesmo estando já um pouco datado
(foi publicado por volta de 2005)!
Existem também sites que oferecem pesquisas prontas para você digitar no Google e encontrar informações sensíveis de vários s ites
na Internet. Um grande exemplo disso é o Google Hacking Database do exploit-db.com em http://www.exploit-db.com/google-dorks/.