parser Html

Discussion dans 'Web, design' créé par dagibbon, 16 Janvier 2004.

Statut de la discussion:
Fermée.
  1. Offline
    dagibbon Elite
    et hop, amis du jour, bonjour!

    Ben voila, je m'emmerde à crever, alors je fais de tout et de rien. Partant du programme de pompage de babez, je m'étais dit 'tiens fiston, amuses toi et fait un aspirateur web'... La belle affaire :wink:

    C'est juste une question qui me turlupine:
    je fais ca en Delphi6 (donc sous windows), je voudrai ne pas utiliser des api windows (pour garder une compatibilité Kylix sous linux);
    et donc je dois me contenter d'un parsing bien bourrin.
    La question est:
    est ce qu'un parsing bourrin d'une page de type html, php ect suffit pour faire un beau copiage de site;
    ou alors je dois passer par d'autres possibilités (robots.txt; ect ect); et surtout, est-ce que l'utilisation de multi-threading pour le téléchargement est bien indiqué? (surchagre bande passante/server)...enfin bref, rien de bien fou, juste des précisions, car je ne suis pas un html-master ni web master pGm :wink:

    et surtout, encore bonne bourre :p
    dagibbon, 16 Janvier 2004
    #1
  2. Offline
    Dans la mesure où ce que tu dois pomper n'est que du texte interprété par un navigateur, oui un "bète" parser suffit.
    Après tout, il ne sagirait ds ce cas que de chaînes de caractères. (html, javascript, txt, ..)
    TITM4v3rick, 16 Janvier 2004
    #2
  3. Offline
    dagibbon Elite
    en fait j'avais dans l'idée de lancer les telechargements en "simultané" via du multi threading, ca risque pas de trop surcharger la bp? (j'ai quand meme limité à 32 threads de dl)
    dagibbon, 16 Janvier 2004
    #3
  4. Offline
    Alors là je ne sait point t'aider. Normalement non mais faudrait tester...
    TITM4v3rick, 16 Janvier 2004
    #4
  5. Offline
    dagibbon Elite
    j'oserai pas tester ca sur un server 'non consentant' lol

    d'apres les vagues notions de rezo qu'il doit merester, la bp est bien départagée entre users, c'est pas le premier servi qui a tout qd meme?
    dagibbon, 16 Janvier 2004
    #5
Statut de la discussion:
Fermée.