Treffen Sie DOTS.OCR: Ein neues 1,7B-Visionsprachmodell, das die SOTA-Leistung bei mehrsprachiger Dokument analysiert
dots.oc ist ein Open-Supply-Visionsprachtransformatormodell, das für mehrsprachige Dokumentenlayout-Parsen und optische Charaktererkennung (OCR) entwickelt wurde. Es führt sowohl die Layouterkennung als auch die Inhaltserkennung innerhalb einer…