BlogBang

Utilisez MetaGoofil pour extraire les méta-données des documents trouvés sur Internet

capturegoofil Utilisez MetaGoofil pour extraire les méta données des documents trouvés sur Internet

MetaGoofil est un outil conçu pour extraire les méta-données de fichiers comme les doc, xls, ppt, pdf…etc

La particularité de cet outil est qu’il scanne en ligne les documents se trouvant sur un site particulier (grâce à Google… Ce sont donc des documents publics) et vous faire un petit rapport très interressant sur les infos qu’ils contiennent. Evidement, ces informations comme des noms, des dates de créations, des versions de logiciels…etc pourraient très bien servir à un attaquant potentiel.

Pour tester Metagoofil, vous devez le télécharger en cliquant ici.

Ensuite, décompressez le dans un répertoire.

Vous devez avoir « extract » installé sur votre PC

sudo apt-get install extract

Executez ensuite Metagoofil

./metagoofil

Voici les options que nous avons à notre diposition

usage: metagoofil options

-d: domain to search
-f: filetype to download (all,pdf,doc,xls,ppt, etc)
-l: limit of results to work with (default 100)
-o: output file, html format.
-t: target directory to download files.
Essayons par exemple sur le site de la Poste… (Pourquoi la Poste ? Je sais pas, j’ai pris le premier truc qui me passait par la tête)


./metagoofil.py -d laposte.fr -f all -l 100 -o lapost.html -t toto

Le script nous récupère 100 fichiers sur le site de laposte et nous générera un lapost.html dans lequel on verra les méta données de tous les documents.

Voici par exemple ce qu’on trouve dans les documents du site laposte (j’ai masqué les noms des gens) :


mimetype - application/msword

revision history - Revision #9: Author 'DE COQ**********NT Hervé' worked on 'F:\diagnostic_voies-2-3.doc'

revision history - Revision #8: Author 'DE COQ**********NT Hervé' worked on 'F:\diagnostic_voies-2-3.doc'

revision history - Revision #7: Author 'DE COQ**********NT Hervé' worked on 'F:\Contrats de Services\diagnostic_voies-2.doc'

revision history - Revision #6: Author 'DE COQ**********NT Hervé' worked on 'C:\diagnostic_voies-2.doc'

revision history - Revision #5: Author 'AR******ANT' worked on 'C:\SiteSPIP\res\doc\diagnostic_voies.doc'

revision history - Revision #4: Author 'AR******ANT' worked on 'C:\Documents and Settings\AR******ANT\Application Data\Microsoft\Word\Enregistrement automatique dediagnostic.asd'

revision history - Revision #3: Author 'AR******ANT' worked on 'C:\Documents and Settings\AR******ANT\Application Data\Microsoft\Word\Enregistrement automatique dediagnostic.asd'

revision history - Revision #2: Author 'AR******ANT' worked on 'C:\Documents and Settings\AR******ANT\Bureau\diagnostic.doc'

revision history - Revision #1: Author 'TR****D' worked on 'C:\Internet\sna\Mairies\documents\diagnostic.doc'

revision history - Revision #0: Author 'TR****D' worked on 'C:\Documents and Settings\TR****D\Local Settings\Temporary Internet Files\OLK5\FICHIERS DIAGNOSTIC POUR INTERNET.doc'

language - U.S. English

paragraph count - 5

line count - 24

last saved by - DE COQ**********NT Hervé

character count - 2994

template - Normal

creation date - 2007-07-05T14:43:00Z

title - MEMO â??STRATEGIE AVEC LES COA POUR LIENS MAIRIES

word count - 525

page count - 2

creator - WIN98

date - 2007-07-05T14:44:00Z

generator - Microsoft Word 9.0
Et j’en passe des pages et des pages… On a bien sûr à la fin un petit topo sur les noms des personnes qui ont travaillés sur les documents. Bref que du bonheur pour tout social engineer qui se respecte… mais très dangereux pour les entreprises.

Par contre, je n’ai pas pris le temps de chercher mais je ne sais pas si il existe des softs pour nettoyer ces méta-données…

Le tuto en vidéo est dispo chez IronGeek

A bon entendeur…

Publicité

Je vous recommande aussi la lecture des sujets suivants


Faites un lien vers cette news sur votre site



3 commentaires

  1. shadeone Reply to this comment


    le social engineering est la faille numéro 1 dans toutes les entreprises. Sans formation du personnel, on peut prendre toutes les precautions que l’on veut pour proteger ses données…

    on ne le repetera jamais assez, il y a des tresors dans vos poubelles ! alors imaginez dans les signatures electroniques de vos documents ;)

    Posté le 16 octobre 2007 à 23:18:53

  2. Stam Reply to this comment


    Ca me rappelle l’époque ou je faisais du Trashing à la Défense, de belles choses me sont passées sous le nez ^^
    Dans mon emploi actuel je sensibilise les PME a ce problème, le problème c’est qu’a chaque fois ils ne me font pas confiance vu mon jeune âge, suffit de camper et de fouiller les poubelles et hop le lendemain sont convaincus :D
    Bref comme le dit mon tshirt « Because There Is No Patch Against Human Stupidity ».

    Encore merci pour ce superbe blog qui est passé n°1 dans mes favoris.

    Posté le 17 octobre 2007 à 03:37:10

  3. MarcBernard Reply to this comment


    Est-ce-que ça pourrait fonctionner pour lancer sur nos répertoires de documents internes? Disons qu’on cherche une façon d’obtenir le data de tous nos documents???

    Merci beaucoup

    Posté le 24 août 2008 à 01:42:16