JSON-Ausgabe unbrauchbar - was mache ich falsch?

#1
by raimocom - opened

Hallo Keyvan,

ich bin Neuling beim Thema lokale KI und habe jetzt mal dein Modell nach deiner Anleitung mit llama-server ausprobiert. Die Ergebnisse sind mangelhaft und inkonsistent. Ich vermute, ich mache irgendwo einen Fehler.

Mein Setup:

  • Hardware: AMD Ryzen 7500F, 16GB RAM, GPU Intel Arc Pro B60 24GB VRAM
  • Software: Windows 11, Intel AI Playground

Intel AI Playground verwendet (optional) als eine seiner Komponenten llama.cpp. Das habe ich zur Nutzung deines Modells verwendet.

Mein Vorgehen:

  • Modell herunterladen (german-ocr-3.1-Q8_0.gguf)
  • MMPROJ-Datei herunterladen (mmproj-german-ocr-3.1-F16.gguf)
  • llama-server starten ( llama-server -m german-ocr-3.1-Q8_0.gguf --mmproj mmproj-german-ocr-3.1-F16.gguf --port 8080 -ngl 99)
  • http://localhost:8080 aufrufen
  • gut aufgelösten Screenshot einer einfachen einseitigen Rechnung hochgeladen + Prompt "Extrahiere als JSON"

Das Ergebnis ist JSON-artig. Allerdings kaputt (ein JSON-Validator zeigt Fehler) und gar nicht in der strukturierten Form , wie auf deiner Modellseite angegeben.
Die extrahierten Daten an sich sind fast alle korrekt, aber unvollständig.

Hier ein Beispiel einer Ausgabe:
{
"Rechnung": {
"Rechnungsnummer": "R12233455",
"Kundennummer": "D12345",
"Angebotsnummer": "445566",
"Leistungsdatum": "20.01.2025",
"Datum": "23.01.2025"
},
"Rechnung": {
"Bahnhof Schildburghausen - Reinigungsarbeiten",
"Position": "1",
"Art-Nr.": "CLE",
"Artikel": "Reinigung des Bahnsteiges",
"Anzahl": "1",
"Einheit": "Stck",
"Preis": "200,00",
"Gesamt": "200,00"
},
"Zahlungskonditionen": {
"Summe vor Steuern": "200,00",
"Umsatzsteuer": "19%",
"Gesamtbetrag": "238,00"
},
"Reinigung Cleantec": {
"Name": "Hans Saubermann",
"Adresse": "Wanderweg 13",
"Postleitzahl": "12345",
"Ort": "Wutzelwitz"
}
}

Was mache ich hier nicht richtig, hast du eine Idee?

Viele Grüße!
Raimo

Sign up or log in to comment