Über SSDDiff:

SSDDiff, kurz für “Semistructured data differencing”, ist ein Programm, um die Unterschiede (oder genauer gesagt Ähnlichkeiten) zwischen zwei Dokumenten zu finden. Das Programm vergleich dabei die Struktur der beiden Dokumente, macht also nicht einfach “nur” einen Textvergleich.

Interessant ist so etwas natürlich nur auf Dokumenten, bei denen eine komplexe, variable Struktur vorliegt. So macht es z.B. keinen Sinn, so eine flache Liste von Namen zu vergleichen.

Die aktuelle Version unterstützt beliebige XML-Dateien, ist also gewissermaßen ein “xmldiff”-Programm. Es liefert aber meist andere — typischerweise bessere — Ergebnisse als andere Tools für diesen Zweck und ist besser an das genaue Problem anpassbar; ist dafür aber auch deutlich langsamer und braucht mehr Speicher.

SSDDiff ist ein Prototyp, entwickelt im Rahmen einer Projektarbeit (auch: Fortgeschrittenenpraktikum) an dem Institut für Informatik, LMU München.

Der Quellcode ist OpenSource, und auf der Projekthomepage verfügbar.