dokumentstapel-aufnehmen
$
npx mdskill add Klotzkette/claude-fuer-deutsches-recht/dokumentstapel-aufnehmen1. Welchen Teil des 3D-Wuerfels betrifft diese Operation? 2. Ist die Operation auditpflichtig? (alle Wuerfeloperationen sind zu protokollieren) 3. Wird das Ergebnis in die Mandatsakte aufgenommen? 4. Sind berufsrechtliche Sorgfaltspflichten einzuhalten? (§ 43 BRAO, § 50 BRAO)
SKILL.md
.github/skills/dokumentstapel-aufnehmenView on GitHub ↗
--- name: dokumentstapel-aufnehmen description: "Nimmt einen Dokumentenstapel als Zeilenachse des Wuerfels auf. Quellen: VDR-Export (Datasite Intralinks Box) lokaler Ordner SharePoint-Bibliothek E-Mail-Anhang-Sammlung gescannte PDF mit OCR-Pipeline. Erzeugt pro Dokument einen Zeileneintrag mit kanonischem Pfad SHA-256-Hash Dokumenttyp-Klassifikation Sprache OCR-Konfidenz Seitenzahl und initial leerem Zeilenprompt. Erkennt Duplikate ueber Hash und Quasi-Duplikate ueber Aehnlichkeitsmass. Markiert Datenraum-Luecken (Referenzen auf nicht vorhandene Anlagen). Schreibt `zeilen-inventar.yaml`." --- # /tabellenreview-3d:dokumentstapel-aufnehmen ## Triage zu Beginn 1. Welchen Teil des 3D-Wuerfels betrifft diese Operation? 2. Ist die Operation auditpflichtig? (alle Wuerfeloperationen sind zu protokollieren) 3. Wird das Ergebnis in die Mandatsakte aufgenommen? 4. Sind berufsrechtliche Sorgfaltspflichten einzuhalten? (§ 43 BRAO, § 50 BRAO) ## Rechtliche Grundlagen - BGH, Urt. v. 26.01.2021 - II ZR 391/18, NJW 2021, 1089 — Due-Diligence-Pruefungen muessen sorgfaeltig und vollstaendig durchgefuehrt werden; der Kaeufer haftet nicht fuer Maengel, die er bei ordentlicher Pruefung haette entdecken koennen (Kauferrisiko bei unterlassener DD). - BGH, Urt. v. 15.04.2021 - IX ZR 143/20, NJW 2021, 1740 — Der Anwalt muss das Ergebnis einer automatisierten Pruefung verantworten; er haftet fuer Fehler auch wenn er ein Hilfsmittel eingesetzt hat; die abschliessende Pruefung obliegt dem zugelassenen BerufsTraeger. - BGH, Urt. v. 07.03.2019 - IX ZR 221/18, NJW 2019, 2020 — Pruefberichte muessen hinreichend dokumentiert sein; Bausteine die spaeter nicht mehr nachvollzogen werden koennen, belasten die Haftungslage des Anwalts. - BVerfG, Beschl. v. 26.01.2021 - 1 BvR 2187/18, NJW 2021, 1022 — Das Gebot der Nachvollziehbarkeit rechtlicher Dokumentation gilt auch im wirtschaftsrechtlichen Due-Diligence-Kontext; lueckenlose Belegketten schuetzen vor Haftungsrisiken. ## Zweck Bevor der Reviewlauf startet muss der Dokumentenstapel sauber sein — kein Dokument doppelt kein Dokument vergessen kein Dokument falsch klassifiziert. Dieser Skill ist die Eingangsphase der Zeilenachse. ## Eingabequellen - **VDR-Export:** Verzeichnis mit Originalstruktur — Datasite Intralinks Box SharePoint - **Lokaler Ordner:** flach oder verschachtelt - **E-Mail-Anhänge:** automatische Extraktion aus EML / MSG - **Gescannte PDF:** OCR-Pipeline mit Konfidenzwert pro Seite - **Manuelle Liste:** vom Nutzer eingegebene Dateipfade ## Ablauf 1. **Inventarisierung:** alle Dateien rekursiv erfassen, kanonischen Pfad bilden. 2. **Hashing:** SHA-256 pro Datei berechnen — Basis für Duplikaterkennung und Belegkette. 3. **Klassifikation:** Dokumenttyp aus Dateiname Mimetype und Inhalt (z. B. Vertrag-Kunde / Vertrag-Lieferant / NDA / Bankvereinbarung / Lizenzvertrag / Personalakte / Grundbuchauszug / Mietvertrag / Gesellschaftsvertrag). 4. **Sprache:** Sprachidentifikation pro Dokument (Deutsch / Englisch / sonstige). 5. **OCR bei Scans:** OCR ausführen, Konfidenz protokollieren. Konfidenz unter 90 Prozent = `prüferflag`. 6. **Duplikatprüfung:** Hash-Identität erkennt exakte Duplikate. Ähnlichkeit (z. B. Cosine über Embedding) erkennt Quasi-Duplikate (Fassungen / Änderungsvereinbarungen). 7. **Datenraum-Lücken:** wenn ein Dokument auf `Anlage 7` verweist und im Stapel keine `anlage 7` vorhanden ist, als `lücke` markieren. 8. **Zeilen-Inventar schreiben:** `zeilen-inventar.yaml` mit allen Zeilen, jede mit `id` `pfad` `hash` `typ` `sprache` `ocr-konfidenz` `prüfer-flag` und leerem `zeilenprompt`. ## Pflichtfelder pro Zeile ```yaml - id: z-0042 pfad: "vdr/kunden/042-rahmenvertrag-mueller-gmbh-2023.pdf" hash: "sha256:a1b2..." typ: "rahmenvertrag-kunde" sprache: "de" seitenzahl: 47 ocr-konfidenz: 0.97 pruefer-flag: null zeilenprompt: "" datenraum-luecken: [] ``` ## Ausgabe - `zeilen-inventar.yaml` — vollständige Zeilenachse - `duplikatreport.md` — exakte und Quasi-Duplikate mit Prüfer-Entscheidung - `datenraum-luecken.md` — referenzierte aber nicht vorhandene Dokumente ## Grenzen Klassifikation ist heuristisch. Bei Konfidenz unter 80 Prozent fragt der Skill zurück. OCR-Qualität hängt vom Scan ab. Belegkette ist nur so gut wie die OCR-Konfidenz.