parser Html

Statut
N'est pas ouverte pour d'autres réponses.

dagibbon

Elite
et hop, amis du jour, bonjour!

Ben voila, je m'emmerde à crever, alors je fais de tout et de rien. Partant du programme de pompage de babez, je m'étais dit 'tiens fiston, amuses toi et fait un aspirateur web'... La belle affaire :wink:

C'est juste une question qui me turlupine:
je fais ca en Delphi6 (donc sous windows), je voudrai ne pas utiliser des api windows (pour garder une compatibilité Kylix sous linux);
et donc je dois me contenter d'un parsing bien bourrin.
La question est:
est ce qu'un parsing bourrin d'une page de type html, php ect suffit pour faire un beau copiage de site;
ou alors je dois passer par d'autres possibilités (robots.txt; ect ect); et surtout, est-ce que l'utilisation de multi-threading pour le téléchargement est bien indiqué? (surchagre bande passante/server)...enfin bref, rien de bien fou, juste des précisions, car je ne suis pas un html-master ni web master pGm :wink:

et surtout, encore bonne bourre :p
 
Dans la mesure où ce que tu dois pomper n'est que du texte interprété par un navigateur, oui un "bète" parser suffit.
Après tout, il ne sagirait ds ce cas que de chaînes de caractères. (html, javascript, txt, ..)
 
1er
OP
dagibbon

dagibbon

Elite
TITM4v3rick a dit:
Dans la mesure où ce que tu dois pomper n'est que du texte interprété par un navigateur, oui un "bète" parser suffit.
Après tout, il ne sagirait ds ce cas que de chaînes de caractères. (html, javascript, txt, ..)
en fait j'avais dans l'idée de lancer les telechargements en "simultané" via du multi threading, ca risque pas de trop surcharger la bp? (j'ai quand meme limité à 32 threads de dl)
 
Alors là je ne sait point t'aider. Normalement non mais faudrait tester...
 
1er
OP
dagibbon

dagibbon

Elite
TITM4v3rick a dit:
Alors là je ne sait point t'aider. Normalement non mais faudrait tester...
j'oserai pas tester ca sur un server 'non consentant' lol

d'apres les vagues notions de rezo qu'il doit merester, la bp est bien départagée entre users, c'est pas le premier servi qui a tout qd meme?
 
Statut
N'est pas ouverte pour d'autres réponses.
Haut