feedgenerator ist ein einfaches Werkzeug zur Erzeugung von Newsfeeds aus diversen Quellen.

Über feedgenerator

feedgenerator liest Webseiten und bestehende Newsfeeds aus und erzeugt aus deren Inhalten Newsfeeds im Atom-Format. Bisher implementierte Feeds:

  • Antenne Münster : Erzeugt aus dem Newsticker des Lokalradios einen Feed.
  • Deutschlandfunk : Erzeugt aus dem Teaser-Feed zur Nachrichtenseite einen Volltextfeed mit der Möglichkeit unerwünschte Inhalte auszufiltern
  • Heise : Erzeugt aus einem oder mehreren Feeds von Heise Online einen Volltextfeed mit der Möglichkeit unerwünschte Inhalte auszufiltern

Entwicklung

feedgenerator wurde in Python programmiert. Der Quellcode kann aus dem öffentlichen Git-Repository heruntergeladen werden. Für die Entwicklung wird ein möglichst aktuelles Python 3 benötigt. Abhängigkeiten sind in der Datei requirements.txt hinterlegt.

Ich verwende zipapp, um feedgenerator zu bauen und auf meinem Server zu deployen. Der Build erfolgt in vier Schritten:

git clone https://git.ortlepp.eu/feedgenerator.git/
cd feedgenerator
pip3 install --upgrade -r requirements.txt --target feedgenerator/
python3 -m zipapp feedgenerator/

Verwendung

Wurde das Tool wie im Abschnitt Entwicklung beschrieben gebaut, kann es einfach mit python3 feedgenerator.pyz ausgeführt werden. Im selben Verzeichnis kann eine Datei feedgenerator.ini abgelegt werden, über welche dann der Dateiname der Feeds, die Anzahl der Einträge pro Feed und Inhaltsfilter konfiguriert werden können. Eine Beispielkonfiguration ist im Git-Repository enthalten.

Die von feedgenerator erzeugten Feeds werden lokal als XML-Dateien gespeichert. Sinnvoll ist ein zum Beispiel stündlich ausgeführter Cronjob, welcher die Feeddateien regelmäßig mit den aktuellsten Inhalten neu generiert.

Roadmap

Es ist geplant, noch weitere Funktionen zu implementieren. Aktuell geplante Features:

  • Feed für Twitter-Profile implementieren