Unter Schirmherrschaft von
Factory Seven Media & Consulting
running-cool.de
   X   

[Krankheiten von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Medikamente von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Diagnostik & Laborwerte von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Therapieverfahren von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Gesundheitsthemen von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   

[Symptome von A bis Z]

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

   X   
Suche

HTML::Parser

Das Parsen von HTML-Seiten mit Regulären Ausdrücken besitzt seine Tücken und ist für Programme mit einem generischen, umfassenden Ansatz nicht zu empfehlen. Das Hauptproblem bei den Regulären Ausdrücken ist, dass sich komplexe Strukturen nur sehr schwer und umständlich abbilden lassen. Diese Ausdrücke sind zudem nicht sehr robust gegenüber kleinsten Veränderungen in der Zieldatei. Auf den Punkt gebracht kann man sagen, dass HTML-Code in Webseiten nicht regulär genug ist, um mit Regulären Ausdrücken flexible und effektive Perl-Scripte zu entwicklen.

Ein wesentlich eleganterer und deutlich robusterer Ansatz zum parsen von HTML-Seiten lässt sich mit dem CPAN-Modul HTML::Parser realisieren.

In der Praxis stellt sich sehr häufig das Problem, dass man gezielt auf einzelne Bereiche einer HTML-Seite (z.B. News) zugreifen muss.

 

 

Haben Sie eigene Erfahrungen oder eine andere Meinung? Dann schreiben Sie doch einen Kommentar (bitte Regeln beachten).

Kommentar schreiben

Inhaltsverzeichnis Top