Beautiful Soup

Programmbibliothek für Screen Scraping

Beautiful Soup ist eine freie Programmbibliothek für Screen Scraping. Mit der in Python geschriebenen Software lassen sich XML- und HTML-Dokumente parsen. Das Projekt wurde von Leonard Richardson gegründet und wird bis heute[2] von ihm gepflegt.

Beautiful Soup
Basisdaten

Hauptentwickler Leonard Richardson
Erscheinungsjahr 2004
Aktuelle Version 4.12.3[1]
(17. Januar 2024)
Betriebssystem plattformübergreifend
Programmier­sprache Python
Kategorie Scraper
Lizenz Python Software Foundation License (BSD-Lizenz)
www.crummy.com/software/BeautifulSoup/

Eine frühere Version der Bibliothek, Beautiful Soup 3, funktionierte nur mit Python 2.x. Die aktuelle Version Beautiful Soup 4 kann mit Python 2.7 und 3 benutzt werden. Installiert werden kann es mit Hilfe von pip:

pip install beautifulsoup4

Beautiful Soup selbst ist ein Frontend zu den grundlegenderen Parsern lxml und html5lib.[3]

Einzelnachweise

Bearbeiten
  1. Changelog. (abgerufen am 18. Januar 2024).
  2. Leonard Richardson: Code : Leonard Richardson. 9. April 2021, abgerufen am 28. April 2021 (englisch).
  3. Beautiful Soup Documentation