PDA

Ver la Versión Completa : La discreción de los archivos Jpeg


seoane
29-11-2006, 14:38:21
Leo hoy en kriptopolis (http://www.kriptopolis.org/la-tijera-de-photoshop-no-es-de-fiar) el caso de una tal Cat Schwartz que decidió poner unas fotos jpeg recortadas con photoshop en su blog y descubrió horrorizada, después, que el programa había guardado una miniatura de la imagen completa (léase topless) dentro del mismo archivo.

Lo primero, me extraña que los de kriptopolis se sorprendan del hecho, no entiendo como una publicación dirigida a gente mas o menos iniciada no tuviera noticias del formato de los archivos jpeg, ni del formato Exif que es el culpable de la indiscreción. Aun que parece que ya han echo una actualización aclarándolo.

De todas formas para quien no lo sepa, los archivos jpeg permiten almacenar en su interior toda clase información adicional, a cada cual mas exótica. Desde miniaturas de la imagen original, hasta información sobre la cámara, lugar, tiempo de exposición, etc. donde fue tomada la foto. De hecho ya hay programas que analizan las fotos que van encontrando por la web en busca de estos descuidos. Pero eso no acaba ahí, el formato admite incluir por parte de cualquier aplicación la información que considere oportuna.

Para todos aquellos que estéis preocupados por vuestra intimidad, o simplemente queréis eliminar toda esa basura para dejar vuestros archivos jpeg mas livianos, podéis usar el truco 34 (http://www.clubdelphi.com/trucos/index.php?id=41&scroll=34), donde pongo el código necesario para eliminar los "segmentos de aplicación" (este es el nombre que reciben) de los archivos jpeg. Si alguien se anima puede meter esto dentro de un bucle que limpie todo un directorio ... ahi dejo la idea :rolleyes:

PD: Si no quieres que nadie vea una foto, la experiencia nos dice que lo mejor es que no te la saques. Otro día ya hablaremos de las cámaras digitales y los programas de recuperación de archivos ;)

Albano
29-11-2006, 18:11:38
¿Es por esa información que cuando abrimos una imagen JPG con el paint y le ponemos "guardar como", sin modificar nada, el tamaño de la imagen se reduce? Supongo que el paint no guarda nada de esa información.

seoane
29-11-2006, 18:16:50
¿Es por esa información que cuando abrimos una imagen JPG con el paint y le ponemos "guardar como", sin modificar nada, el tamaño de la imagen se reduce? Supongo que el paint no guarda nada de esa información.


Puede que si, aunque también puede que recomprima la imagen con una calidad inferior. El comportamiento normal en un programa que manipule imágenes es que elimine toda la información anterior al guardar la imagen, pero como vemos en el caso del photoshop no siempre se hace y pasan estas cosas.

jorge1987
30-11-2006, 06:52:49
Para todos aquellos que estéis preocupados por vuestra intimidad, o simplemente queréis eliminar toda esa basura para dejar vuestros archivos jpeg mas livianos, podéis usar el truco 34 (http://www.clubdelphi.com/trucos/index.php?id=41&scroll=34), donde pongo el código necesario para eliminar los "segmentos de aplicación" (este es el nombre que reciben) de los archivos jpeg. Si alguien se anima puede meter esto dentro de un bucle que limpie todo un directorio ... ahi dejo la idea :rolleyes:


OK, con ese truco, borra dicha info?

Y como puedo hacer para revisar y poder ver en el caso de que exista, dicha informacion??

Saludos :D:D

seoane
30-11-2006, 15:38:33
Y como puedo hacer para revisar y poder ver en el caso de que exista, dicha informacion??


Te recomiendo para eso que utilices algún programa como photoshop, gimp, photostudio, etc.

Aunque para seguir experimentando podemos jugar un poco con el formato Exif e intentar sacarlo con el siguiente código. Básicamente busca dentro del jpeg el segmento que contiene la información Exif, una vez lo tiene busca la marca $FFD8 que indica el inicio de una imagen jpeg. Esto no es la forma mas correcta de hacerlo, ya que nos saltamos toda la estructura de datos Exif, pero el caso es que funciona :D y para jugar un rato nos sirve.

El codigo:

function ReadThumb(Source, Dest: TStream): Boolean;
var
Buffer: array[0..$FFFF] of Char;
Header: array[1..4] of byte;
Size: Integer;
i: Integer;
begin
Result:= FALSE;
Source.Seek(0,soFromBeginning);
Source.ReadBuffer(Header,2);
if (Header[1] <> $FF) or (Header[2] <> $D8) then
raise Exception.Create('Identificador incorrecto');
repeat
Source.ReadBuffer(Header,4);
Size:= ((Header[3] shl 8) + Header[4]) - 2;
case Header[2] of
$E1: begin
Source.ReadBuffer(Buffer,Size);
i:= 0;
while i < Size - 1 do
begin
if CompareMem(@Buffer[i],PChar(#$FF#$D8),2) then
begin
Dest.WriteBuffer((@Buffer[i])^, Size - i);
Result:= TRUE;
break;
end;
inc(i);
end;
break;
end;
$01,$D0..$D9: Source.Seek(-2,soFromCurrent);
else Source.Seek(Size,soFromCurrent);
end;
until (Header[2] = $DA);
end;

procedure ExtractThumb(Filename: string);
var
Source: TFileStream;
Thumb: TMemoryStream;
begin
Source:= TFileStream.Create(Filename, fmOpenRead);
try
Thumb:= TMemoryStream.Create;
try
if ReadThumb(Source,Thumb) then
Thumb.SaveToFile(ChangeFileExt(Filename,'_thumb.jpg'));
finally
Thumb.Free;
end;
finally
Source.Free;
end;
end;

// Por ejemplo
ExtractThumb('D:\1.jpg');


En el ejemplo anterior si "d:\1.jpg" contiene un imagen en miniatura, se guardara en el archivo "d:\1_thumb.jpg", y si no contienen ninguna no se crea ningún fichero. Ahora solo tenemos que buscar un directorio con un buen numero de jpegs y hacerlo con todas las imágenes para ver si descubrimos algo :D