FTP | CCD | Buscar | Trucos | Trabajo | Foros |
|
Registrarse | FAQ | Miembros | Calendario | Guía de estilo | Temas de Hoy |
|
Herramientas | Buscar en Tema | Desplegado |
#1
|
||||
|
||||
Obtener HTML con ligas completas de paginas hechas con CMS
Hola que tal, eh estado probando hacer un spider bot que obtenga las ligas de la pagina y las guarde.
toodo bien con la libreria curl de php, se obtiene el codigo HTML generado por las paginas, y se busca href= para obtener la liga. href="http://drupal.org.es/node pero me eh encontrado con el problema que las paginas hechas en CMS (drupal,jommla wikis,etc). las ligas hacia su mismo sitio salen como rutas locales las cuales las da asi: Código:
<li class="leaf"><a href="/planeta">Planeta DH</a></li> <li class="leaf"><a href="/manuales">Manuales</a></li> <li class="leaf"><a href="/foros">Foros</a></li> <li class="leaf"><a href="/servicios" title="">Servicios</a></li> <li class="leaf"><a href="/faq">FAQ</a></li> <li class="leaf"><a href="/drupal">Sobre Drupal</a></li> saludos gracias |
|
|
Temas Similares | ||||
Tema | Autor | Foro | Respuestas | Último mensaje |
Obtener RGB a partir de HTML | Niko | Varios | 4 | 05-01-2009 14:17:58 |
almacenar imagenes video y paginas html en interbase | carasucia | Conexión con bases de datos | 0 | 15-11-2007 18:43:03 |
Obtener Código HTML | hcalero | Varios | 0 | 06-02-2007 12:55:10 |
Busco HOSTING para mis paginas ASP.NET hechas en delphi con ECO 3 | edalmasso | Internet | 1 | 12-07-2006 19:20:08 |
Código en Delphi de un editor de páginas HTML | Leo171166 | Varios | 2 | 16-12-2005 19:06:13 |
|