Docspell - Belege digitalisieren und automatisch zuordnen

Docspell - Belege digitalisieren und automatisch zuordnen

Docspell ist ein selbstgehostetes Dokumentenarchiv, das eingescannte Belege automatisch per OCR erkennt, taggt und auffindbar macht.

Was ist Docspell?

Docspell automatisiert die Ablage von Dokumenten: Hochgeladene PDFs oder Scans werden per OCR in Text umgewandelt, automatisch mit Metadaten versehen (Datum, Absender, Tags) und in einem durchsuchbaren Archiv abgelegt. Intelligente Vorschläge helfen dabei, ähnliche Dokumente konsistent zu benennen. Docspell unterstützt mehrere Nutzer und Organisationen in einer Instanz. Die Anwendung besteht aus einem REST-Server und einem Joq-Prozessor für die asynchrone Verarbeitung.

Voraussetzungen

  • Docker 20.10+ oder Docker Compose
  • PostgreSQL als Datenbank (SQLite für kleine Setups möglich)
  • Mindestens 1 GB RAM (mehr für große Dokumentenmengen)

Compose-Beispiel

services:
  restserver:
    image: docspell/restserver:latest
    container_name: docspell-server
    restart: unless-stopped
    ports:
      - "7880:7880"
    volumes:
      - ./docspell.conf:/opt/docspell.conf
    environment:
      - DOCSPELL_SERVER_BACKEND_JDBC_URL=jdbc:postgresql://db:5432/docspell
      - DOCSPELL_SERVER_BACKEND_JDBC_USER=docspell
      - DOCSPELL_SERVER_BACKEND_JDBC_PASSWORD=passwort

  joex:
    image: docspell/joex:latest
    container_name: docspell-joex
    restart: unless-stopped
    volumes:
      - ./docspell.conf:/opt/docspell.conf
    environment:
      - DOCSPELL_JOEX_JDBC_URL=jdbc:postgresql://db:5432/docspell
      - DOCSPELL_JOEX_JDBC_USER=docspell
      - DOCSPELL_JOEX_JDBC_PASSWORD=passwort

  db:
    image: postgres:15
    container_name: docspell-db
    restart: unless-stopped
    volumes:
      - ./postgres:/var/lib/postgresql/data
    environment:
      - POSTGRES_USER=docspell
      - POSTGRES_PASSWORD=passwort
      - POSTGRES_DB=docspell

Hinweise

  • Docspell benötigt eine docspell.conf-Datei; die offizielle Dokumentation liefert eine vollständige Vorlage.
  • Der Joex-Prozessor übernimmt alle asynchronen Aufgaben (OCR, Texterkennung, Vorschläge) und kann separat skaliert werden.
  • Per dsc-CLI (Docspell Client) lassen sich Dokumente direkt aus dem Terminal hochladen oder Watchfolder einrichten.
  • Docspell kann E-Mails direkt aus IMAP-Postfächern importieren und als Dokumente ablegen.