Tema: Parsear HTML
Ver Mensaje Individual
  #8  
Antiguo 26-03-2018
Avatar de Ñuño Martínez
Ñuño Martínez Ñuño Martínez is offline
Moderador
 
Registrado: jul 2006
Ubicación: Ciudad Catedral, Españistán
Posts: 6.000
Reputación: 25
Ñuño Martínez Tiene un aura espectacularÑuño Martínez Tiene un aura espectacular
Como te han dicho, analizar código HTML es complejo, y más si quieres cumplir con la norma de forma estricta y manejar correctamente código HTML mal construido. Es más, para hacerlo bien tendrás que construir un parser completo.

De todas formas, puedes simplificar un poco la cosa. Te lo pongo en pseudo-código:
Código:
  BUCLE
    SI se encuentra "<img " en HTML
       Desde esa posición, buscar 'src="', si no se encuentra ERROR
       Extraer el texto desde esa posición hasta las siguientes comillas
       quitar de HTML todo lo que preceda al texto extraido
    SINO
      Salir del BUCLE
    FIN SI
  REPETIR
Sigue sin manejar bien código mal formado (por ejemplo, si se encuentra un <img /> sin "src") pero en los casos bien construidos debería funcionar.
__________________
Proyectos actuales --> Allegro 5 Pascal ¡y Delphi!|MinGRo Game Engine
Responder Con Cita