Utilisez MetaGoofil pour extraire les méta-données des documents trouvés sur Internet
Par Korben | Nb visites : 266

MetaGoofil est un outil conçu pour extraire les méta-données de fichiers comme les doc, xls, ppt, pdf…etc
La particularité de cet outil est qu’il scanne en ligne les documents se trouvant sur un site particulier (grâce à Google… Ce sont donc des documents publics) et vous faire un petit rapport très interressant sur les infos qu’ils contiennent. Evidement, ces informations comme des noms, des dates de créations, des versions de logiciels…etc pourraient très bien servir à un attaquant potentiel.
Pour tester Metagoofil, vous devez le télécharger en cliquant ici.
Ensuite, décompressez le dans un répertoire.
Vous devez avoir « extract » installé sur votre PC
sudo apt-get install extract
Executez ensuite Metagoofil
./metagoofil
Voici les options que nous avons à notre diposition
usage: metagoofil options
-d: domain to search
-f: filetype to download (all,pdf,doc,xls,ppt, etc)
-l: limit of results to work with (default 100)
-o: output file, html format.
-t: target directory to download files.
Essayons par exemple sur le site de la Poste… (Pourquoi la Poste ? Je sais pas, j’ai pris le premier truc qui me passait par la tête)
./metagoofil.py -d laposte.fr -f all -l 100 -o lapost.html -t toto
Le script nous récupère 100 fichiers sur le site de laposte et nous générera un lapost.html dans lequel on verra les méta données de tous les documents.
Voici par exemple ce qu’on trouve dans les documents du site laposte (j’ai masqué les noms des gens) :
mimetype - application/msword
revision history - Revision #9: Author 'DE COQ**********NT Hervé' worked on 'F:\diagnostic_voies-2-3.doc'
revision history - Revision #8: Author 'DE COQ**********NT Hervé' worked on 'F:\diagnostic_voies-2-3.doc'
revision history - Revision #7: Author 'DE COQ**********NT Hervé' worked on 'F:\Contrats de Services\diagnostic_voies-2.doc'
revision history - Revision #6: Author 'DE COQ**********NT Hervé' worked on 'C:\diagnostic_voies-2.doc'
revision history - Revision #5: Author 'AR******ANT' worked on 'C:\SiteSPIP\res\doc\diagnostic_voies.doc'
revision history - Revision #4: Author 'AR******ANT' worked on 'C:\Documents and Settings\AR******ANT\Application Data\Microsoft\Word\Enregistrement automatique dediagnostic.asd'
revision history - Revision #3: Author 'AR******ANT' worked on 'C:\Documents and Settings\AR******ANT\Application Data\Microsoft\Word\Enregistrement automatique dediagnostic.asd'
revision history - Revision #2: Author 'AR******ANT' worked on 'C:\Documents and Settings\AR******ANT\Bureau\diagnostic.doc'
revision history - Revision #1: Author 'TR****D' worked on 'C:\Internet\sna\Mairies\documents\diagnostic.doc'
revision history - Revision #0: Author 'TR****D' worked on 'C:\Documents and Settings\TR****D\Local Settings\Temporary Internet Files\OLK5\FICHIERS DIAGNOSTIC POUR INTERNET.doc'
language - U.S. English
paragraph count - 5
line count - 24
last saved by - DE COQ**********NT Hervé
character count - 2994
template - Normal
creation date - 2007-07-05T14:43:00Z
title - MEMO â??STRATEGIE AVEC LES COA POUR LIENS MAIRIES
word count - 525
page count - 2
creator - WIN98
date - 2007-07-05T14:44:00Z
generator - Microsoft Word 9.0
Et j’en passe des pages et des pages… On a bien sûr à la fin un petit topo sur les noms des personnes qui ont travaillés sur les documents. Bref que du bonheur pour tout social engineer qui se respecte… mais très dangereux pour les entreprises.
Par contre, je n’ai pas pris le temps de chercher mais je ne sais pas si il existe des softs pour nettoyer ces méta-données…
Le tuto en vidéo est dispo chez IronGeek
A bon entendeur…
Je vous recommande aussi la lecture des sujets suivants
- Quelques outils pour mieux gérer vos créations sous Creative Commons
- Le bug de la mort qui tue MSN
- Enlever les watermarks sur les fichiers PDF
- Adobe propose son espace de stockage de documents
- Convertisseur en ligne universel !
- Avoir une barre de progression avec la commande cp sous Linux
- DocX Converter et pack de compatibilité Office 2007
- Microsoft va sortir un plugin Word pour les non-voyants
- Activer l’accès aux anciens formats de fichiers sour Office 2003 Service Pack 3
- Convertissez tout et n’importe quoi grâce à ce site !







shadeone
le social engineering est la faille numéro 1 dans toutes les entreprises. Sans formation du personnel, on peut prendre toutes les precautions que l’on veut pour proteger ses données…
on ne le repetera jamais assez, il y a des tresors dans vos poubelles ! alors imaginez dans les signatures electroniques de vos documents
Posté le 16 octobre 2007 à 23:18:53
Stam
Ca me rappelle l’époque ou je faisais du Trashing à la Défense, de belles choses me sont passées sous le nez ^^
Dans mon emploi actuel je sensibilise les PME a ce problème, le problème c’est qu’a chaque fois ils ne me font pas confiance vu mon jeune âge, suffit de camper et de fouiller les poubelles et hop le lendemain sont convaincus
Bref comme le dit mon tshirt « Because There Is No Patch Against Human Stupidity ».
Encore merci pour ce superbe blog qui est passé n°1 dans mes favoris.
Posté le 17 octobre 2007 à 03:37:10
MarcBernard
Est-ce-que ça pourrait fonctionner pour lancer sur nos répertoires de documents internes? Disons qu’on cherche une façon d’obtenir le data de tous nos documents???
Merci beaucoup
Posté le 24 août 2008 à 01:42:16