Beautiful Soup
Programmbibliothek für Screen Scraping
Beautiful Soup ist eine freie Programmbibliothek für Screen Scraping. Mit der in Python geschriebenen Software lassen sich XML- und HTML-Dokumente parsen. Das Projekt wurde von Leonard Richardson gegründet und wird bis heute[2] von ihm gepflegt.
Beautiful Soup | |
---|---|
Basisdaten
| |
Hauptentwickler | Leonard Richardson |
Erscheinungsjahr | 2004 |
Aktuelle Version | 4.12.3[1] (17. Januar 2024) |
Betriebssystem | plattformübergreifend |
Programmiersprache | Python |
Kategorie | Scraper |
Lizenz | Python Software Foundation License (BSD-Lizenz) |
www.crummy.com/software/BeautifulSoup/ |
Eine frühere Version der Bibliothek, Beautiful Soup 3, funktionierte nur mit Python 2.x. Die aktuelle Version Beautiful Soup 4 kann mit Python 2.7 und 3 benutzt werden. Installiert werden kann es mit Hilfe von pip:
pip install beautifulsoup4
Beautiful Soup selbst ist ein Frontend zu den grundlegenderen Parsern lxml und html5lib.[3]
Einzelnachweise
Bearbeiten- ↑ Changelog. (abgerufen am 18. Januar 2024).
- ↑ Leonard Richardson: Code : Leonard Richardson. 9. April 2021, abgerufen am 28. April 2021 (englisch).
- ↑ Beautiful Soup Documentation