html auswerten ?

Spezielle Fragen zu Netzwerk-Protokollen, DNS, Socket ...
Antworten
yoda
Moderator
Beiträge: 623
Registriert: Mo 2. Jan 2006, 22:35
Wohnort: bei Nörten-Hardenberg
Kontaktdaten:

html auswerten ?

Beitrag von yoda » Fr 20. Mai 2016, 08:54

Moin,

ich lese eine Webseite mit Adressen von mp3s (Podcast) und speichere sie ab.

Wie kann ich nu die MP3 Files und die Texte dazu extrahieren so das ich sie in ein Columnview schreiben kann ?

es geht um diese Seite : http://www.alximedia.de/radio/

Flotte Grüße

tux_
Moderator
Beiträge: 950
Registriert: Di 11. Nov 2008, 20:05
Kontaktdaten:

Re: html auswerten ?

Beitrag von tux_ » Fr 20. Mai 2016, 11:58

Dafuer eignet sich die Komponente gb.xml.html[1] bestens (s. auch gb.xml[2]). Alle Links in einem HTML-Dokument zu finden, deren URL auf "mp3" endet, ist essentiell ein Dreizeiler. Wenn du sie herunterladen moechtest, kommen mit gb.net.curl noch ein paar Zeilen hinzu: gambas code
Dim u As String = "http://www.alximedia.de/radio/"
Dim c As New HttpClient, s As String
Dim x As New HtmlDocument, h As XmlElement, f, g As String

c.Async = False
c.URL = u
c.Get()
s = Read #c, Lof(c)

x.FromString(s)
For Each h In x.GetElementsByTagName("a", gb.IgnoreCase)
  f = h.GetAttribute("href", gb.IgnoreCase)
  If f Not Ends ".mp3" Then Continue
  f = u &/ f
  c.URL = f
  g = "/tmp" &/ File.Name(f)
  Debug "Downloading";; f;; "->";; g
  c.Get(Null, g)
Next
Der Code ist schrecklich, aber ich bin auch in Eile. Das Projekt liegt nochmal im Anhang.
download-all-mp3s-0.0.1.tar.gz
(11.5 KiB) 456-mal heruntergeladen
[1] http://gambaswiki.org/wiki/comp/gb.xml.html/
[2] http://gambaswiki.org/wiki/comp/gb.xml/
Achtung: Es passiert, dass ich einen frisch geschrieben Beitrag innerhalb von 10 Minuten noch 3-4 Mal aendere!

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste