Duplikatssuche für Office Dateien auf SharePoint
Frage / Problem
Ich möchte auf einer SharePoint-Seite nach Duplikaten suchen. Ich weiß, dass sich duplizierte Office-Dateien auf dieser Seite befinden, TreeSize zeigt sie mir aber nicht als solche an.
Andere Dateitypen werden wie erwartet gefunden.
Antwort / Lösung
Wird eine Office Datei auf einer SharePoint Seite hochgeladen, vermerkt der SharePoint selbst diesen Vorgang in der Datei selbst und fügt den Meta-Daten der Datei u.a. den aktuellen Zeitstempel hinzu. Dadurch unterscheiden sich zwei ansonsten vollkommen identische Office Dateien binär und sind bzgl. ihrer Prüfsummen keine Duplikate mehr.
Andere Dateiformate (z.B. PDF, PNG, ..) werden standardmäßig vom SharePoint nicht verändert. Die entsprechenden Meta-Daten werden stattdessen in anderen Strukturen auf dem SharePoint gespeichert. Diese Dateien können in der Duplikatssuche entsprechend wie erwartet behandelt werden.