Cuidado con los metadatos-Parte I

Bueno siguiendo el magnífico tutorial de Chema Alonso, voya  explicar como funciona una herramienta llamada FOCA para la extracción de los metadatos.

Pero…que són los metadatos…?

Un metadato es información relativa a un documento, tales como el autor, el programa utilizado o la catalogación que el usuario ha hecho del mismo. En un típico entorno colaborativo, como el que disfrutamos en una empresa o en un organismo público, estos datos son de gran utilidad y permiten coordinar las tareas de elaboración, edición y localización de los documentos.

Si lo veis así puede ser un peligro…sobretodo si esos archivos se cuelgan en Internet…

Nadie debería saber que software utilizamos, ni que usuarios, han tocado el documento, ni la ruta a servidores ni impresoras que tenemos…

Bueno empezaremos descargando la FOCA

Descargar

Una vez que la hayamos descargado, escogeremos un sitio web para su análisis.

NOTA: Existe una versión Online de la FOCA pero es para documentos sueltos, este tutorial es para sitios webs enteros

Una vez que hayamos descargado e instalado la FOCA lo iniciamos.

creando_proyecto

Bueno así creríamos unnuevo proyecto, le damos ahí y empezamos a llenar los datos de el sitio web que hemos escogido:

editando_proyecto

En nombre hemos de poner el nombre del proyecto, esto da igual lo que le pongamos, luego en Domain WebSite ponemos el Site de la página ..por ejemplo dragonjar.org

Y luego la ruta de donde guardaremos los documentos que nos descarguemos de la página que vamos a analizar.

Le damos a create, y ahora en la pantalla que nos aparece le damos a search all, utilizará la tecnología de Google y Live Search y buscara las extensiones marcadas.

descubriendo_documentos

Ahora escojeremos unos cuantos documentos y nos los descargaremos para  su análisis:

descargando_documentos

Después de descargar los documentos le damos con el botón derecho y le damos a la opción de Extract all Metadata, y veremos que a la izquierda se llenan los datos de los metadatos que el programa a extraído.

extraer_metadatos

Después de darle a extract all metadata, deberíamos ser capaces de ver que usuarios hay, por ejemplo:

usuarios_extraidos

Ya también deberíamos ser capaces de ver que rutas hacia carpetas hay,

carpetas_extraidas

También podríamos hasta ver el software que han utlizado, lo que es un problema, por el tema de las licencias.

software_extraido

Y hasta podemos sacar direcciones de email de la entidad…

emails_extraidos

Bueno todo esto es para que veias lo peligroso que es dejar los ficheros con información colgada en Internet.

En artículos mas adelante se explicará como limpiar dicha información, pdf, jpeg,word etc…

Etiquetas: ,

Acerca de Marc Rivero López

Si alguien quiere saber como soy que se preocupe por averiguarlo.

Trackbacks / Pingbacks

  1. Manual de usuario FOCA I « Caminando entre bits… - 2011/01/26

Deja un comentario

Fill in your details below or click an icon to log in:

Logo de WordPress.com

You are commenting using your WordPress.com account. Log Out / Cambiar )

Twitter picture

You are commenting using your Twitter account. Log Out / Cambiar )

Facebook photo

You are commenting using your Facebook account. Log Out / Cambiar )

Connecting to %s