Michael Wesolek

Kompression von Englischen Texten unter Verwendung von Lexikalischer Kategorisierung und PPM

Betreuer: Prof. Dr. Wolfgang Mulzer
Abschluss: Bachelor of Science (B.Sc.)

Kurzbeschreibung

Die Englische Sprache hat ein starke SPO Struktur. (Subjekt, Prädikat, Object)

Diese Struktur/Redundanz des Satzbaues könnte potenziell zusätzlich genutzt werden um höhere Kompressionsraten zu erhalten. Hierfür wurde ein Kompressionsverfahren entwickelt/erweitert und ausgewertet. Ein Vergleich mit einer PPMC (mit exclusion) Referenz-Implementierung zeigt, dass die Ergebnisse durch das in der Bachelorarbeit vorgestellte Verfahren sich leicht verschlechtert haben. (Vergleich der besten Ergebnisse bei ca. 2000 Datensätzen) Potenzielle Gründe dafür wurden genannt, sodass die Ergebnisse aus dieser Arbeit noch weiter verbessert werden können.