Skip to main content
Open Source · DMS · OCR & Volltext

BEKOM OPEN PROPaperless-ngx DokumentenarchivOpen-Source-DMS mit OCR und Volltext

Paperless-ngx als bewährtes Open-Source-Dokumentenarchiv für OCR-Erfassung, Volltextsuche und Posteingangs-Workflows: DSGVO-konform, selbst gehostet im DACH-Raum, mit definierten SLAs durch BEKOM.

Open-Source-Portfolio ansehen
OCR & Volltextsuche
Open Source (GPLv3)
DSGVO & DACH-Hosting
Posteingang & Workflows
Im Überblick

Was ist Paperless-ngx?

Paperless-ngx ist ein etabliertes Open-Source-Dokumentenarchiv mit OCR-Erfassung, Volltextsuche und Tagging-Workflows für eingehende Dokumente. Als bewährte Standardlösung wird es im DACH-Mittelstand, in Kanzleien, Steuerberatungen, Bildungseinrichtungen und im öffentlichen Bereich eingesetzt. BEKOM führt Paperless-ngx im Rahmen von BEKOM OPEN PRO Applications exemplarisch ein und betreibt es.

Paperless-ngx wird geschäftskritisch für die Auftragsverarbeitung in Kanzleien und Steuerberatungen eingesetzt, wo die Verfügbarkeit des Dokumentenarchivs eine operative Betriebsvoraussetzung für mandantenbezogene Compliance-Prozesse darstellt.

BEKOM betreibt auch alternative Dokumenten-Plattformen. Im Rahmen eines Assessments wird geprüft, welche Lösung zu Ihrer Ausgangslage passt.

Herkunft und Projekt-Pflege

Paperless-ngx ist die aktiv weiterentwickelte Community-Fortführung des ursprünglichen Paperless-Projekts (Daniel Quinn, 2015) und seines Zwischenforks Paperless-ng. Seit 2022 wird das Projekt unter dem Namen Paperless-ngx von einem internationalen Maintainer-Team auf GitHub gepflegt. Es gibt keinen kommerziellen Hersteller; die Software steht ohne Lizenzgebühren unter GPLv3 zur Verfügung.

Eckdaten zum Projekt:

Ursprung 2015 als Paperless von Daniel Quinn

Community-Fork als Paperless-ngx seit 2022 mit aktiver Roadmap

Hauptlinie 2.x mit regelmäßigen Minor-Releases

Markt-Verankerung:

  • DACH-Mittelstand mit Bedarf an Posteingangs-Digitalisierung
  • Kanzleien und Steuerberatungen mit hohem Beleg- und Aktenvolumen
  • Bildungseinrichtungen mit Verwaltungsbedarf

Positionierung im Markt

Paperless-ngx steht im Markt für Dokumentenmanagement-Systeme als Open-Source-Alternative zu proprietären DMS-Lösungen wie ecoDMS, DocuWare oder M-Files. Die Plattform fokussiert auf den klassischen DMS-Kern – Erfassung, OCR, Klassifikation, Volltextsuche, Wiederfindung – ohne kostenpflichtige Modul-Pakete oder nutzerbasierte Lizenzgebühren.

Differenzierende Merkmale:

Selbst gehostet auf eigener Infrastruktur oder bei DACH-Anbietern

Posteingangs-Erfassung über Watch-Folder, IMAP und REST-API

OCR-Pipeline mit OCRmyPDF und Tesseract auf offener Basis

Typische Wahl-Gründe:

  • Datensouveränitäts-Anforderungen mit Verarbeitung in Deutschland
  • Vermeidung nutzerbasierter Lizenzkosten klassischer DMS-Anbieter
  • Open-Source-Strategie bei Bürokommunikation und Aktenführung

Lizenzmodell und Editionen

Paperless-ngx steht vollständig unter GPLv3 zur Verfügung – es gibt keine kommerzielle Edition, keine Modul-Pakete und keine nutzerbasierten Lizenzgebühren. Sämtliche Funktionen sind im Quelltext enthalten. Hersteller-Support im klassischen Sinn existiert nicht; der Betrieb erfolgt entweder im Selbst-Betrieb mit Community-Unterstützung oder über Begleitung durch einen IT-Dienstleister wie BEKOM, der die Service-Levels und Reaktionszeiten vertraglich zusagt.

Verfügbare Form:

Vollständige GPLv3-Lizenzierung ohne Modul-Trennung

Keine nutzerbasierten Lizenzgebühren oder Volumen-Tarife

Releases als Container-Images, Git-Tags und Installations-Pakete

Regelmäßige Minor-Releases der Hauptlinie 2.x mit Migrationspfad

Support-Optionen:

  • Community-Support über GitHub-Diskussionen und Issue-Tracker
  • Begleitung durch IT-Dienstleister wie BEKOM mit definierten Leistungen
  • Fully-Managed- oder Co-Managed-Betrieb bei BEKOM mit vertraglichen SLAs
  • Kein kommerzieller Hersteller-Support – Risiko-Übernahme über den Dienstleister
BEKOM-Leistungen

BEKOM-Leistungen für Paperless-ngx

BEKOM begleitet Paperless-ngx-Einsätze von der Eignungsprüfung bis zum Regelbetrieb. Die Leistungen sind modular buchbar.

Assessment und Architektur

BEKOM prüft, ob Paperless-ngx zum Dokumentenaufkommen, zur Aktenstruktur und zu den Compliance-Anforderungen passt – ergebnisoffen, ohne Lizenz-Vertriebsinteresse. Geprüft werden Posteingangs-Quellen (Scan, Mail, Upload), Volumen und Spitzenlasten, Identity-Anbindung, Berechtigungs-Modell, Aufbewahrungspflichten und Migrationspfad aus dem aktuellen DMS oder aus Ablage-Strukturen im Dateisystem.

Assessment-Schwerpunkte:

Bestandsaufnahme der Dokumentenflüsse, Volumen und Mediendichte

Bewertung der Identity-Anbindung (LDAP, Active Directory, OIDC, Keycloak)

Analyse der Migrationskomplexität aus ecoDMS, DocuWare oder Datei-Ablagen

Vergleichs-Analyse mit ecoDMS, Mayan EDMS und DocuWare

Typische Auslöser:

  • Auslaufende Wartung des bestehenden DMS oder Ende-of-Life-Ankündigung
  • Neuer Compliance-Bedarf mit auditierbarer Dokumenten-Ablage
  • Konsolidierung verstreuter Datei-Ablagen und Mailbox-Archive

Einführung und Migration

Für Neu-Einführungen plant BEKOM die Plattform-Dimensionierung (Anwendungsserver, Datenbank, Object Storage, OCR-Worker), das Berechtigungs- und Mandanten-Konzept, die Integration in Identity- und Monitoring-Landschaft sowie die Anbindung der Posteingangs-Quellen. Bei Migrationen aus bestehenden DMS-Systemen oder Datei-Ablagen übernimmt BEKOM den strukturierten Daten-Transfer mit Metadaten-Übernahme, OCR-Nachverarbeitung und stufenweisem Rollout.

Leistungen in dieser Phase:

Dimensionierung von Compute, Storage, Object Storage und OCR-Workern

Mandanten-, Tag- und Berechtigungs-Konzept gemäß Organisations-Struktur

Daten-Transfer aus Bestandssystemen mit Metadaten- und OCR-Nachverarbeitung

Stufenweiser Rollout in Phasen mit definierten Übergabe- und Cutover-Punkten

Ergebnis dieser Phase:

  • Produktive Instanz mit dokumentierter Architektur
  • Migrierte Bestandsdaten mit Metadaten-Mapping und durchsuchbarer OCR-Schicht
  • Übergabepunkt in den Regelbetrieb mit klaren Service-Levels

Betrieb und Weiterentwicklung

Im Managed-Service-Modus übernimmt BEKOM den produktiven Betrieb: dokumentierter Change-Prozess für Konfigurations-Änderungen und Workflow-Anpassungen, Patch-Zyklen entlang der Paperless-ngx-Hauptlinie, Monitoring von Anwendungs-, Datenbank- und Storage-Schicht, Bearbeitung von Störungen und regelmäßige Capacity-Reviews. Welche Architektur-, Berechtigungs- und Aufbewahrungs-Entscheidungen vom Kunden freigegeben werden, ist im Vertrag geregelt.

Operative Aufgaben im Managed Service:

Dokumentierter Change-Prozess für Konfigurations- und Workflow-Updates

Patch-Management entlang der Paperless-ngx-Hauptlinie über Container-Tags

Monitoring von Web-Frontend, OCR-Workern, Datenbank und Object Storage

Quartalsweise Capacity-Reviews und Reporting an die Geschäftsleitung

Reporting an Stakeholder:

  • Monatlicher Service-Bericht mit Verfügbarkeit, Incidents und Changes
  • Quartalsbericht mit Kapazitäts-Trend und Empfehlungen
  • Ad-hoc-Reports bei Audit-Anfragen oder Compliance-Nachweisen
Posteingang & OCR

Funktionen — Posteingang, OCR und Klassifikation

Paperless-ngx verarbeitet eingehende Dokumente in einer durchgängigen Pipeline: Erfassung über Scan- und Mail-Quellen, OCR-Aufbereitung, automatische Klassifikation und Ablage im durchsuchbaren Archiv – die drei Kernbereiche der täglichen Dokumenten-Verarbeitung.

Erfassung über Posteingangs-Quellen

Eingehende Dokumente werden aus mehreren Quellen automatisiert übernommen: über einen überwachten Datei-Ordner (Consume-Folder) für Scanner und manuelle Uploads, über IMAP-Postfächer für Mail-Anhänge sowie über die REST-API für Drittanbieter-Anwendungen. Jede Quelle kann mit eigenen Vorab-Tags, Korrespondenten und Dokumenttypen versehen werden. Unterstützt werden PDF, gängige Bildformate (JPG, PNG, TIFF) sowie Office-Formate über Apache Tika und Gotenberg.

Verfügbare Funktionen:

Watch-Folder für Multifunktionsgeräte und Scan-Stationen

IMAP-Postfach-Anbindung mit Filter-Regeln je Postfach

REST-API für Upload aus Fachanwendungen oder Skripten

Unterstützung für PDF, JPG, PNG, TIFF und Office-Formate via Tika

Typische Einsatzszenarien:

  • Posteingang aus Multifunktionsgeräten in zentrales Archiv
  • Automatische Erfassung von Rechnungs- und Beleg-Mails
  • Anbindung von Fachanwendungen über die REST-API
  • Manuelle Nacherfassung historischer Akten über Drag-and-Drop

OCR und Volltextsuche

Paperless-ngx führt eingescannte oder bildbasierte PDFs durch eine OCR-Pipeline auf Basis von OCRmyPDF und Tesseract – das Resultat ist ein durchsuchbares PDF mit eingebetteter Textebene. Der extrahierte Text wird zusätzlich in den Volltext-Index aufgenommen, sodass Dokumente über Stichworte, Phrasen und Filter-Kombinationen wiedergefunden werden. Tesseract liefert Sprachmodelle für Deutsch, Englisch und weitere Sprachen, parallel anwendbar.

Verfügbare Funktionen:

OCR über OCRmyPDF und Tesseract mit Mehrsprachen-Modellen

Erzeugung durchsuchbarer PDFs mit eingebetteter Textebene

Volltext-Index für Stichwort- und Phrasen-Suche

Schnell-Filter über Tags, Korrespondent und Dokumenttyp

Typische Einsatzszenarien:

  • Wiederfinden alter Belege über Stichwort statt Ordnerpfad
  • Auffinden von Vertrags-Klauseln über Phrasen-Suche
  • Auswertung von Korrespondenz-Verläufen über Korrespondenten-Filter
  • Nachverfolgung von Aktenständen über Tag-Kombinationen

Automatische Klassifikation und Workflows

Paperless-ngx ordnet Dokumenten automatisch Tags, Korrespondenten und Dokumenttypen zu – auf Basis trainierter Klassifikations-Regeln (Matching-Algorithmen wie „Any", „All", „Literal", „Regular Expression" oder Auto). Über Workflows lassen sich Folgeaktionen auslösen, beispielsweise Ablagepfade setzen, Custom Fields füllen oder Benachrichtigungen anstoßen.

Verfügbare Funktionen:

Automatische Vergabe von Tags, Korrespondent und Dokumenttyp

Matching-Algorithmen Any, All, Literal, Regex und Auto

Workflows mit Trigger-Events (Erfassung, Aktualisierung, Löschung)

Custom Fields für strukturierte Zusatz-Daten je Dokumenttyp

Typische Einsatzszenarien:

  • Automatische Zuordnung eingehender Rechnungen zu Lieferanten
  • Vorbelegung von Ablagepfaden über trainierte Korrespondenten-Erkennung
  • Strukturierte Erfassung von Aktenzeichen, Belegnummern und Fristen
  • Trigger-basierte Folgeaktionen wie Benachrichtigungen oder Tag-Updates
Plattform & Endgeräte

Funktionen — Plattform, API und Endgeräte

Über die Posteingangs-Pipeline hinaus stellt Paperless-ngx Plattform-Funktionen für Web-Frontend, Schnittstellen und Identity-Integration bereit.

Web-Frontend und Mobile-Zugriff

Das Paperless-ngx-Web-Frontend ist eine browserbasierte Single-Page-Anwendung (Angular) mit Listen-, Detail- und Vorschau-Ansichten. Über die REST-API stehen zusätzlich Community-Mobile-Apps (iOS, Android) zur Verfügung, mit denen sich Dokumente unterwegs erfassen, durchsuchen und mit Tags versehen lassen.

Verfügbare Funktionen:

Responsive Web-Oberfläche für Desktop, Tablet und Smartphone

Listen- und Galerie-Ansicht mit konfigurierbaren Spalten und Filtern

Inline-Vorschau für PDF und Bilddokumente im Browser

Typische Einsatzszenarien:

  • Zentrale Recherche im Browser ohne Client-Installation
  • Mobile Erfassung von Belegen aus dem Außendienst
  • Ad-hoc-Zugriff von BYOD-Endgeräten ohne Plattform-Bindung

REST-API und Integrationen

Paperless-ngx bietet eine umfassende REST-API für Upload, Suche, Metadaten-Pflege und Verwaltung. Damit lassen sich Fachanwendungen, ETL-Skripte und Drittanbieter-Systeme anbinden. Über Webhooks können Folgeprozesse in benachbarten Anwendungen angestoßen werden – beispielsweise eine Rechnungsfreigabe, eine Buchhaltungs-Übergabe oder eine Aufgabenverwaltung.

Verfügbare Funktionen:

REST-API für Dokumente, Tags, Korrespondenten und Custom Fields

Bulk-Operationen für Massen-Tagging und -Verschiebung

Webhook-Auslösung für externe Systeme

Typische Einsatzszenarien:

  • Anbindung an Buchhaltungs- oder Warenwirtschafts-Systeme
  • ETL-gesteuerte Erstbefüllung aus Bestandsablagen
  • Workflow-Integration mit Aufgaben- oder Ticket-Systemen

Identity-Integration und Berechtigungen

Paperless-ngx unterstützt Nutzer- und Gruppen-Berechtigungen auf Dokumenten- und Tag-Ebene. Über OpenID Connect (OIDC) und vorgeschaltete Reverse-Proxy-Authentifizierung lässt sich die Plattform an zentrale Identity-Provider wie Keycloak, Active Directory Federation Services oder Authentik anbinden. Damit funktionieren Single Sign-On, Multi-Faktor-Authentifizierung und konsistente Lebenszyklen für Nutzerkonten.

Integrations-Optionen:

OIDC-Anbindung an Keycloak, Authentik oder andere OIDC-Provider

Reverse-Proxy-Authentifizierung für SAML- oder Header-basierte Szenarien

Lokale Nutzer- und Gruppenverwaltung als Rückfall-Option

Typische Einsatzszenarien:

  • Single Sign-On in bestehende Identity-Landschaft mit MFA-Pflicht
  • Trennung zwischen Sachbearbeitung, Leitung und Revisions-Lesezugriff
  • Mandanten-Trennung über Gruppen, Tags und Berechtigungen
Betriebsmodelle

Betriebsmodelle für Paperless-ngx

Paperless-ngx kann in unterschiedlichen organisatorischen Konstellationen betrieben werden. Die Modelle lassen sich kombinieren oder im Zeitverlauf anpassen.

Fully Managed – BEKOM übernimmt den Betrieb

BEKOM betreibt die Paperless-ngx-Plattform als vollständigen Managed Service. Welche Architektur-, Berechtigungs- und Aufbewahrungs-Entscheidungen vom Kunden freigegeben werden, ist im Vertrag geregelt; die operative Verantwortung für Betrieb, Wartung und Reaktion liegt bei BEKOM.

BEKOM übernimmt:

Dokumentierter Change-Prozess für Konfigurations-, Workflow- und Mandanten-Updates

Patch-Zyklen entlang der Paperless-ngx-Hauptlinie über Container-Tags

Monitoring von Web-Frontend, OCR-Workern, Datenbank, Redis und Object Storage

Quartalsweise Capacity-Reviews und Reporting an die Geschäftsleitung

Typische Szenarien:

  • Organisationen mit begrenzter interner Plattform-Kapazität
  • Compliance-Programme nach ISO 27001 oder TISAX
  • DACH-Mittelstand mit DSGVO-Anforderungen an Dokumentenarchive
  • Aufbewahrungs-pflichtige Branchen (Steuer, Recht, Gesundheit, Bildung)

Co-Managed – geteilte Verantwortung

Im Co-Managed-Modell behält das interne Team Konfigurations-Hoheit und fachliche Verantwortung; BEKOM übernimmt definierte operative Bereiche und Spezialthemen. Aufgaben können im Zeitverlauf verschoben werden – mehr intern, wenn Kompetenz wächst; mehr extern, wenn Kapazitäten anderweitig gebunden sind. Die Verteilung wird in einer Verantwortungs-Matrix dokumentiert.

BEKOM übernimmt:

Major-Release-Wechsel und kritische Update-Fenster

Spezialthemen wie Migration aus Bestands-DMS oder Mandanten-Setup

Monitoring-Auswertung und Capacity-Empfehlungen

Bereitschafts-Begleitung außerhalb der Geschäftszeiten

Internes Team:

  • Konfigurations-Hoheit und finale Freigabe von Workflow-Änderungen
  • Pflege der Tags, Korrespondenten und Dokumenttypen im Tagesgeschäft
  • Direkter Kontakt zu Fachbereichen und Anwendern
  • Strategische Entscheidungen zu Aufbewahrung und Mandanten-Struktur

Wann welches Modell passt

Die Wahl folgt drei Kriterien: interne Plattform-Kompetenz, regulatorische Anforderungen und gewünschtes Tempo. Ein Wechsel zwischen den Modellen ist später über die Verantwortungs-Matrix möglich.

Kriterien für Fully Managed:

Keine eigene Linux- oder Container-Betriebskompetenz im Haus

Schnelle Einführung mit dokumentierten Service-Levels

Begrenzte Personalkapazität für Plattform-Wartung

Kriterien für Co-Managed:

  • IT-Team mit Linux- und Container-Erfahrung
  • Konfigurations-Hoheit bei Tags, Workflows und Mandanten
  • Schrittweiser Kompetenzaufbau im Produktivbetrieb
Plattform-Vergleich

Paperless-ngx im Vergleich

Paperless-ngx tritt nicht allein an. Für eine fundierte Einschätzung ist der Blick auf Alternativen entscheidend – sowohl proprietäre DMS-Lösungen aus dem DACH-Markt als auch andere Open-Source-Plattformen. Die folgenden drei Vergleichs-Achsen helfen bei der bewussten Plattform-Wahl.

Paperless-ngx vs. ecoDMS

ecoDMS aus Aachen ist im DACH-Mittelstand ein verbreitetes proprietäres DMS mit Schwerpunkt auf Standard-Funktionen für Posteingang, Klassifikation und Archivierung. Paperless-ngx fokussiert auf den gleichen DMS-Kern, jedoch als Open-Source-Plattform unter GPLv3 ohne nutzerbasierte Lizenzkosten und mit voller Quelltext-Einsicht.

Differenzierende Merkmale:

ecoDMS mit kommerziellem Lizenzmodell je Nutzer; Paperless-ngx unter GPLv3

ecoDMS mit Hersteller-Support; Paperless-ngx über Community oder Dienstleister

ecoDMS als geschlossene Plattform; Paperless-ngx mit Quelltext-Einsicht

Wann passt Paperless-ngx besser:

  • Strategische Open-Source-Ausrichtung der Bürokommunikation
  • Vermeidung nutzerbasierter Lizenzkosten bei wachsender Nutzerzahl
  • Container- und Infrastructure-as-Code-Deployment
  • Quelltext-Einsicht für Compliance- oder Sicherheits-Bewertung

Paperless-ngx vs. Mayan EDMS

Mayan EDMS ist eine weitere Open-Source-DMS-Plattform mit Apache-2.0-Lizenz und Python/Django-Basis. Mayan deckt einen breiteren Funktionsumfang ab – inklusive komplexerer Workflow-Engine, virtueller Ordner und feingranularer Index-Strukturen. Paperless-ngx konzentriert sich auf den schlanken Posteingangs-Workflow mit OCR-Pipeline und automatischer Klassifikation.

Differenzierende Merkmale:

Mayan EDMS mit umfangreicher Workflow-Engine und virtuellen Ordnern

Paperless-ngx mit fokussiertem Posteingangs- und OCR-Workflow

Mayan EDMS unter Apache 2.0; Paperless-ngx unter GPLv3

Wann passt Paperless-ngx besser:

  • Schlanker Posteingangs-Workflow ohne komplexe Ordner-Hierarchien
  • Schneller Einstieg mit Container-Deployment und überschaubarer Konfiguration
  • Mittelständische Nutzerzahl mit OCR-Bedarf als Hauptmotivation

Paperless-ngx vs. DocuWare

DocuWare ist ein etabliertes proprietäres DMS aus Deutschland mit Cloud- und On-Premise-Variante und einem breiten Funktions- und Branchen-Portfolio. Paperless-ngx bleibt eine selbst betriebene Open-Source-Plattform mit voller Kontrolle über Standort, Datenflüsse und Konfiguration – und ohne nutzungsabhängige Cloud-Tarife.

Differenzierende Merkmale:

DocuWare mit Cloud- und On-Premise-Optionen; Paperless-ngx selbst gehostet

DocuWare mit nutzungsabhängiger Subscription; Paperless-ngx ohne Lizenzkosten

DocuWare mit breitem Branchen-Portfolio; Paperless-ngx fokussiert auf DMS-Kern

Wann passt Paperless-ngx besser:

  • Datensouveränitäts-Anforderungen mit Verarbeitung in Deutschland
  • Vorhersehbares Kostenprofil ohne nutzungsabhängige Cloud-Tarife
  • Open-Source-Strategie für Bürokommunikation und Aktenführung
Technische Details

Technische Details

Paperless-ngx läuft auf einer Linux-basierten Container-Plattform und bietet eine klar dokumentierte technische Architektur mit definierten Schnittstellen.

Plattform und Systembasis

Paperless-ngx ist eine Python-basierte Anwendung (Django) mit mehrschichtiger Architektur: Web-Frontend (Angular SPA), Application-Backend (Django/Python), relationale Datenbank (PostgreSQL empfohlen, optional SQLite oder MariaDB), Cache und Task-Queue (Redis), OCR- und Konvertierungs-Worker (OCRmyPDF, Tesseract, Tika, Gotenberg). Die offizielle Distribution erfolgt als Container-Image mit dokumentierten Compose-Dateien.

Kern-Komponenten:

Django-Backend mit Celery-Worker für asynchrone Verarbeitung

PostgreSQL als Konfigurations- und Metadaten-Speicher

Redis als Cache und Task-Queue

OCR-Worker mit OCRmyPDF, Tesseract, Tika und Gotenberg

Release- und Update-Logik:

  • Hauptlinie 2.x mit regelmäßigen Minor-Releases auf GitHub
  • Container-Tags für stabile Versionen und Pre-Releases
  • Datenbank-Migrationen als Bestandteil der Versions-Updates

Hardware und Skalierung

Paperless-ngx läuft auf gängigen Linux-Distributionen wie Debian, Ubuntu und Red Hat Enterprise Linux. Die Dimensionierung folgt dem Dokumenten-Aufkommen, der Anzahl gleichzeitiger Nutzer, dem OCR-Volumen und der Komplexität der Klassifikations-Regeln. Im Mittelstand reichen moderne Multi-Core-x86-Systeme; größere Bestände skalieren über zusätzliche OCR-Worker, getrennte Datenbank-Knoten und Object Storage als Datei-Backend.

Unterstützte Plattformen:

Debian und Ubuntu LTS als Standard-Linux-Distributionen

Red Hat Enterprise Linux und Rocky Linux für Enterprise-Setups

Container-Deployment mit Docker Compose oder Kubernetes

Virtuelle Maschinen unter KVM, Proxmox VE und VMware ESXi

Dimensionierungs-Faktoren:

  • Anzahl täglich erfasster Dokumente und Seitenanzahl
  • Anteil OCR-pflichtiger Scan-Dokumente versus textbasierter PDF
  • Anzahl paralleler OCR-Worker für Lastspitzen

Schnittstellen und Ökosystem

Paperless-ngx bietet eine umfassende REST-API für Verwaltungs- und Konfigurations-Aufgaben sowie Webhooks für ereignisgesteuerte Folgeprozesse. Die Plattform integriert sich über IMAP-Postfächer, Watch-Folder und Container-Konfiguration in bestehende Infrastruktur und bindet sich über OIDC- oder Reverse-Proxy-Authentifizierung an zentrale Identity-Provider an.

Standard-Schnittstellen:

REST-API für Dokumente, Tags, Korrespondenten und Custom Fields

Webhooks für Erfassungs-, Aktualisierungs- und Lösch-Ereignisse

IMAP-Anbindung für Mail-basierte Posteingänge

OIDC- und Reverse-Proxy-Authentifizierung für Single Sign-On

Erweiterungen über Workflows und Add-ons:

  • Workflow-Engine mit Trigger-Events und Folgeaktionen
  • Custom Fields für strukturierte Zusatz-Daten je Dokumenttyp
  • Community-Mobile-Apps für iOS und Android via REST-API
BEKOM-Ansatz

BEKOM-Ansatz und Kostenstruktur

Über die technischen Eigenschaften hinaus entscheidet das Betriebsmodell, wie eine Paperless-ngx-Plattform langfristig wirkt. Der BEKOM-Ansatz setzt auf einen festen Ansprechpartner mit DMS-Expertise, ein Hosting in zertifizierten deutschen Rechenzentren mit deutschsprachiger Betreuung und eine Kostenstruktur, die variable Eigenbetriebs-Aufwände in eine planbare Monatspauschale überführt.

Fester Ansprechpartner mit DMS-Expertise

Jede Paperless-ngx-Installation wird einem festen Ansprechpartner mit DMS- und OCR-Erfahrung zugeordnet, der Posteingangs-Konfiguration, Klassifikations-Regeln und Storage-Themen direkt bearbeitet. Reaktionspfade und Eskalationsstufen sind je Installation im Service-Vertrag dokumentiert — statt anonymer Ticket-Queues oder rotierender Bereitschaft.

Aufgaben des festen Ansprechpartners:

Posteingangs-Konfiguration (Mail, IMAP, Scan-Verzeichnisse)

Pflege der OCR-Pipeline (Tesseract, Sprachpakete, Pre-Processing)

Klassifikations-Regeln, Tags, Korrespondenten und Dokumenttypen

Archivierungs- und Aufbewahrungs-Strategien

Reaktionspfade und Eskalation:

  • Service-Levels und Reaktionspfade je Paperless-ngx-Installation im Vertrag fixiert
  • Definierte Eskalation an 2nd- und 3rd-Level-Spezialisten im Störungsfall
  • Quartalsweise Service-Reviews mit Dokument-Volumen und Storage-Statistik
  • Reporting in Abstimmung mit Geschäftsleitung und Compliance-Stellen

Hosting und Betrieb im DACH-Raum

BEKOM nutzt für Paperless-ngx-Installationen zertifizierte Rechenzentren in Deutschland. Konfigurations- und Wartungs-Tätigkeiten erfolgen durch deutschsprachige DMS-Techniker; die Konfiguration bleibt nahe am Paperless-ngx-Standard, sodass ein Wechsel zu anderen Paperless-Partnern jederzeit möglich bleibt.

Betriebsumgebung:

Hosting in zertifizierten deutschen Rechenzentren (BEKOM als Nutzer)

Deutschsprachige DMS-Techniker für Konfiguration und Incident-Response

Patch-Management entlang der offiziellen Paperless-ngx-Release-Linie

Monitoring von OCR-Pipeline, Storage und Posteingangs-Verarbeitung

Portabilität und Exit:

  • Standard-Paperless-ngx-Konfiguration ohne proprietäre BEKOM-Anpassungen
  • Export der Dokumente und Metadaten in offenen Formaten (PDF, JSON)
  • Wechsel zu anderen Paperless-Partnern jederzeit möglich
  • Übergabe-Dokumentation als Bestandteil des Service-Vertrags

Planbare Kostenstruktur statt variabler Aufwände

Im Eigenbetrieb fallen Kostentreiber an, die in der internen Kalkulation oft unterschätzt werden — von der OCR-Pipeline bis zur Volltext-Indexierung. BEKOM überführt diese Aufwände in eine monatliche Pauschale; ein vorgelagertes Assessment klärt den konkreten Betriebsumfang und die zugehörige Kostenstruktur.

Typische Kostentreiber im Eigenbetrieb:

Wartung der Linux-Basis und Sicherheits-Patches

Pflege der Tesseract-OCR-Pipeline und Sprachpakete

Skalierung von Storage und Volltext-Index für wachsendes Dokumentvolumen

Backup-Strategien für Archivbestände, Metadaten und Such-Index

Inhalte der Monatspauschale:

  • Hypervisor- und Linux-Patches sowie Paperless-ngx-Updates
  • Monitoring von OCR-Verarbeitung, Storage und Index-Status
  • Incident-Response über die definierten Reaktionspfade
  • Service-Reviews und Reporting für Geschäftsleitung und Compliance

Häufige Fragen zu Paperless-ngx

Ist Paperless-ngx für Enterprise-Einsätze und produktive Mittelstandslandschaften ausgereift genug?

Ja, mit Einschränkungen zum Support-Modell. Paperless-ngx wird seit 2022 als aktiver Community-Fork weiterentwickelt und in DACH-Mittelstand, Kanzleien, Steuerberatungen und Bildungseinrichtungen produktiv betrieben. Die Hauptlinie 2.x ist stabil und liefert regelmäßige Minor-Releases. Es gibt keinen kommerziellen Hersteller-Support – der Betrieb erfolgt entweder im Selbst-Betrieb mit Community-Unterstützung oder über einen Dienstleister wie BEKOM mit definierten SLAs.

Wie verhält sich Paperless-ngx bei Aufbewahrungs-Pflichten und Revisionssicherheit?

Paperless-ngx selbst trägt kein Revisionssicherheits-Zertifikat – die Plattform liefert die technischen Bausteine wie Audit-Log, Dokument-Versionierung, granulare Berechtigungen und Volltextindex. Revisionssicherheit entsteht erst durch das Zusammenspiel dieser Bausteine mit organisatorischen Maßnahmen (Aufbewahrungs-Konzept, Berechtigungs-Matrix, Vier-Augen-Freigaben) und einer geeigneten Storage-Schicht (unveränderliche Backups, Object-Lock-fähige Speicher, getrennte Aufbewahrungs-Bereiche). BEKOM begleitet diese Konzeption gemeinsam mit der internen Compliance-Funktion und betreibt die zugehörige Infrastruktur, ohne dabei rechtliche Bewertungen zu übernehmen – diese verbleiben beim Steuer- oder Rechtsberater.

Passt Paperless-ngx in eine bestehende Microsoft- oder Active-Directory-Landschaft?

Ja. Paperless-ngx integriert sich über OpenID Connect (OIDC) an zentrale Identity-Provider wie Keycloak, Authentik oder Active Directory Federation Services. Alternativ funktioniert die Anbindung über vorgeschaltete Reverse-Proxy-Authentifizierung, die SAML 2.0 oder Header-basierte Mechanismen abbildet. Damit greifen bestehende Identity-Strukturen, Multi-Faktor-Authentifizierung und etablierte Lebenszyklen für Nutzerkonten ohne Zusatz-Lizenzen. Eine separate Microsoft-Ablösung ist keine Voraussetzung – Active Directory bleibt führendes System für Identitäten, Paperless-ngx wird als zusätzliche Anwendung darin integriert.

Wie funktioniert die Migration aus einem bestehenden DMS oder aus Datei-Ablagen zu Paperless-ngx?

Die Migration erfolgt in Stufen, geordnet nach fachlicher Relevanz und Volumen. Aktuelle Posteingänge und laufende Akten werden zuerst übernommen; historische Bestände folgen als Bulk-Import mit OCR-Nachverarbeitung. Daten werden strukturiert übernommen: Metadaten aus dem Quellsystem werden auf Tags, Korrespondenten und Dokumenttypen abgebildet; Dateipfade werden in die Paperless-ngx-Speicherstruktur überführt. BEKOM begleitet die Migration mit dokumentiertem Daten-Mapping und Pilot-Phasen.

Wie verhält sich Paperless-ngx zur DSGVO bei Dokumenten-Verarbeitung?

Paperless-ngx unterstützt eine DSGVO-konforme Verarbeitung durch Berechtigungen auf Dokumenten- und Tag-Ebene, lückenlose Audit-Logs und nachvollziehbare Datenflüsse zwischen Posteingang, OCR-Pipeline und Archiv. BEKOM betreibt die Plattform in deutschen Rechenzentren mit klar dokumentierten Verarbeitungsbeschreibungen, einem Auftragsverarbeitungs-Vertrag (AVV) nach Art. 28 DSGVO und definierten Sub-Auftragsverarbeitern. Die rechtliche Bewertung der konkreten Verarbeitungs-Szenarien bleibt bei der internen Datenschutz-Funktion oder externen Datenschutz-Beauftragten – BEKOM liefert die technischen Bausteine und Nachweise auf Service-Ebene.

Lassen sich Mandanten oder Tochtergesellschaften getrennt voneinander betreiben?

Ja, in zwei Varianten. Innerhalb einer Instanz lässt sich eine logische Mandanten-Trennung über Gruppen, Tags und Berechtigungen abbilden – geeignet für Tochtergesellschaften mit gemeinsamem Verwaltungs-Team. Bei strikten Trennungs-Anforderungen, beispielsweise bei Kanzlei-Sozietäten oder Konzern-Strukturen mit unabhängigen Compliance-Pflichten, betreibt BEKOM eine eigene Instanz je Mandant – mit jeweils eigener Anmeldung, eigenem Branding und unabhängigen Berechtigungen.

Wie sind Vertrag, Kündigung und Datenrückführung beim Paperless-ngx-Betrieb geregelt?

Der Managed-Service-Vertrag legt Laufzeit, Kündigungsfristen, Service-Level und den Datenrückführungs-Prozess für das Vertragsende fest. Daten bleiben über offene Standards (REST-API, SQL-Dump, Object-Storage-Export, Original-PDFs mit OCR-Textebene) jederzeit portabel. BEKOM stellt am Vertragsende einen vollständigen Daten- und Konfigurations-Export bereit. Ein Wechsel in den Eigenbetrieb oder zu einem anderen Anbieter ist ohne proprietäre Hürden möglich; konkrete Vertragspunkte werden vor Auftragserteilung schriftlich vereinbart.

Wer trägt die GoBD-Verantwortung beim Paperless-ngx-Betrieb durch BEKOM?

Die GoBD-Verantwortung bleibt grundsätzlich beim Kunden – BEKOM liefert die technischen Voraussetzungen. Im Service-Design-Dokument wird die Aufgabenteilung als RACI festgehalten: BEKOM verantwortet revisionssichere Archivierung (unveränderbare Ablage, Hashing, Versionierung), Backup, Verfügbarkeit, Patch-Management und protokollierten Zugriff. Der Kunde verantwortet die Verfahrensdokumentation, Aufbewahrungsfristen pro Dokumenttyp, Mandanten- und Berechtigungsmodell sowie die GoBD-konforme Buchführungs-Integration. Bei Betriebsprüfungen liefert BEKOM auf Anforderung die technischen Nachweise (Audit-Logs, Hash-Listen, Recovery-Tests); die fachliche Auskunftsfähigkeit liegt bei der Kanzlei oder Buchhaltung des Kunden.

Nächster Schritt: Paperless-ngx-Einführung oder -Betrieb evaluieren

Den Einstieg bildet ein Erstgespräch zur Bedarfsermittlung: Bestandsaufnahme der aktuellen Dokumentenflüsse, Eignungsprüfung für Paperless-ngx und Abstimmung des Assessment-Umfangs. Das Gespräch ist unverbindlich und löst keine Folgeverpflichtung aus; ein schriftliches Angebot entsteht erst nach gemeinsamer Abgrenzung von Umfang und Architektur-Vorstellung.

Das Assessment für Paperless-ngx verschafft Ihnen Klarheit über Ihren aktuellen Dokumenten-Workflow und den Ist-Zustand Ihrer OCR- und Archivierungsanforderungen. Sie erhalten eine konkrete Bestandsaufnahme Ihrer Scan-Volumina, Tag-Strukturen und Integrationsbedarfe sowie eine Service-Design-Empfehlung für den optimalen Betriebsumfang der Paperless-ngx-Plattform in Ihrer Infrastruktur.

1

Bedarf ermitteln

In einem ersten Termin erfasst BEKOM Ihre aktuellen Dokumentenflüsse (Scan, Mail, Upload), das Volumen, die Aktenstruktur, die Identity-Anbindung und die organisatorischen Rahmenbedingungen. Sie erhalten eine erste Eignungsbewertung mit Hinweisen auf Migrationskomplexität und Architektur-Optionen.

2

Paperless-ngx-Assessment beauftragen

Auf Basis der Bestandsaufnahme erstellt BEKOM eine technische Bewertung mit Architektur-Vorschlag (Plattform-Dimensionierung, OCR-Worker, Berechtigungs-Modell, Migrationspfad) und Vergleich zu Alternativen wie ecoDMS oder Mayan EDMS. Das Assessment ist Ihre Verhandlungs- und Planungsgrundlage – Sie entscheiden über Reihenfolge und Tempo der Umsetzung.

3

Einführung oder Betrieb begleiten

Sofern das Konzept freigegeben wird, startet die strukturelle Einführung in vereinbarten Stufen. Nach Abschluss erfolgt der geordnete Übergang in den Regelbetrieb über BEKOM OPEN PRO Applications – wahlweise als Fully Managed Service oder im Co-Managed-Modus mit dokumentierten Aufgabenverteilungen und definierten Service-Levels.