Lupuz.de: Artikel-Portal / Magazin

Zurück   Postpla.net - die Forum Community > PC, Internet und Technik > Netzwerke und Internettechnik

gleiche dateien auf versch. servern ausfindig machen

Anzeigen:

Thema geschlossen
 
Themen-Optionen Thema durchsuchen
oraider
Alt 21.06.2006, 16:27   #1
Standard gleiche dateien auf versch. servern ausfindig machen

hallo hallo!

gibt es eine möglichkeit, gleiche dateien ausfindig zu machen, die auf drei versch servern gelagert sind? die server sind über vpn miteinander verbunden. Ich will die halt ein wenig freiräumen, und ich weiß dass auf allen drein zt gleiche dateien vorhanden sind. hab nur keine lust die alle einzeln zu suchen

danke euch
 
 
Nach oben
doomhammer
Alt 21.06.2006, 16:58   #2
Standard

Ich würde auf einem Server einen aktuellen Datenbestand erstellen, in dem sämtliche Dateien der aktuellesten Version liegen, die anderen beiden Server plattmachen bzw. eben die Dateien da löschen und dann wieder trennen, was auf srv1, srv2 und srv3 muss. Setzt jede Menge Bandbreite voraus was erfahrungsgemäß bei VPNs nicht so gegeben ist
 
 
Nach oben
oraider
Alt 21.06.2006, 17:20   #3
Standard

also gehts nur manuell?
 
 
Nach oben
Registrierter PPler
Anonymisierungsmodus aktiv!
Alt 21.06.2006, 17:28   #4
Standard

Zitat von oraider
gibt es eine möglichkeit, gleiche dateien ausfindig zu machen, die auf drei versch servern gelagert sind?
Theoretisch schon, die Frage ist nur, was für Server das sind und wie du Zugriff darauf hast.

Um z.B. drei FTP Server abzugleichen, bei denen du keine Möglichkeit hast direkt im Dateisystem zu werkeln oder irgendwelche 'dupecheck' (...) Erweiterungen einzubauen: du würdest einen Tabelle mit allen Dateien auf allen Servern erstellen, verdächtige, z.B. Dateien mit gleicher Größe zu dir transferieren und lokal vergleichen, dann Duplikate löschen.

Wenn du direkt im Dateisystem arbeiten und auf den Servern auch Programme ausführen kannst musst du nicht alle verdächtigen Dateien übertragen und dann vergleichen, sondern nur die jeweilige Tabelle:

Dazu würdest du in diese Tabelle in allen Fällen die Position jeder getesteten Datei schreiben, - wenn für diese Dateien die Gefahr besteht, dass sie zwischen der Erstellung deiner Tabelle und dem Löschen der Duplikate, geändert werden: auch die Zeit der letzten Änderung, - ihre Größe und eine Prüfsumme über die Datei. In Verbindung mit der Dateigröße dürfte für den letzten Eintrag CRC32, besser MD5 hinreichend geeignet sein. "Cryptographic strength" wäre overkill1ldeluxe.
x Einträge mit gleicher Prüfsumme und Größe sind Duplikate, x-1 der Dateien werden gelöscht.

Natürlich würdest du sicherstellen, dass das nicht mit Betriebssystemdateien oder ähnlichem passiert..

###

Weg von der Theorie, hin zu bestehenden Implementierungen: ich weiß nicht was da im Moment für verschiedene Betriebssysteme kursiert..
Irgendeines davon, hiervon, oder aus früheren Threads? Oder du wartest auf Empfehlungen hier, wofür es praktisch wäre zu wissen, auf welchen Betriebssystemen und über welche Zugriffsarten du das veranstalten willst.

Über einen reinen FTP Zugang ist das sicher am grausamsten zu realisieren und die einmalige Arbeit, alle lokal zu laden, mit einem Programm zu vergleichen und bereinigt wieder zurückzuschieben noch die geringste. Sollte es nicht schon ein Programm geben, das Absatz 2 automatisiert. Keine Ahnung *g.

Geändert von F@S (21.06.2006 um 17:35 Uhr).
 
 
Nach oben
Sidolin
Alt 21.06.2006, 17:42   #5
Standard

Würd ich auch so machen. Angenommen linux (oder bsd oder was in der art) läuft auf dem server lassen sich die Prüfsummen so erstellen:

find /diesen/ordner/durchsuchen -type f -exec md5sum "{}" > /home/sid/log.txt \;

/home/sid ist da natürlich durch das verzeichnis in dem du die dateiliste dann haben willst zu ersetzen. /diesen/ordner usw. ist der ordner den du durchsuchen willst, _nicht_ / weil wenn du die gesamte festplatte durchsuchst wirst du sicher dateien haben (configs, kernel, systemprogramme, libs) die auf zwei der server gleich sind und wenn du die löschst ist ziemlich viel kaputt.

Die gleichen md5summen suchen, ist auch einfach, wenn du willst schreib ich dir auch dafür nen kleines skript, aber ich hab jetzt keine lust das zu machen und dann brauchts niemand.
 
 
Nach oben
oraider
Alt 18.07.2006, 12:42   #6
Standard

hey, danke, aber das is mir ehrlich gesagt ein bißchen kompliziert. gibt es nicht einfach ein programm, welches mir alle identischen ordner/dateien anzeigt, welche ich wiederrum dann manuel löschen kann?

ach ja, bs is hier überall xp, bzw windows server 2003 glaub ich...
 
 
Nach oben
ElLute
Alt 19.07.2006, 00:54   #7
Standard

ein einzelner kommandozeilenbefehl ist kompliziert?!? ja dann viel spass beim klickibuntisuchen...

mein ansatz wäre rsync gewesen, aber auch nur, weil ich davon weiss, dasses einen schnellen prüfalgorithmus hat...
 
 
Nach oben
Registrierter PPler
Anonymisierungsmodus aktiv!
Alt 19.07.2006, 02:00   #8
Standard

 
 
Nach oben
Ähnliche Themen, die dich vielleicht interessieren
Thema Autor Forum Antworten Letzter Beitrag
Kein Zugriff mehr auf Dateien wegen Verschlüsselung ! tj Betriebssysteme und Software 15 28.04.2006 15:30
Programm zum gruppieren von dateien gesucht Anarchnophobia Betriebssysteme und Software 2 21.04.2004 17:40
Doppelte Dateien ausfindig machen Ziggy Stardust Betriebssysteme und Software 4 28.01.2004 19:32
PHP- nur .jpg dateien in einem verzeichnis auslesen tt-nightliner Coder's Area 3 08.10.2003 18:36
Prob mit .*exe und rar dateien Schra'][' Betriebssysteme und Software 43 02.08.2002 17:29
Anzeigen:
Thema geschlossen

Lesezeichen

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche



Alle Zeitangaben in WEZ +2. Es ist jetzt 09:39 Uhr.


Lupuz.de - wir können auch anders!
©1998 - 2008, Lupuz:Information-Network
Powered by vBulletin Version 3.7.1 (Deutsch), Jelsoft Enterprises Ltd.
Grüne Links?

SEO by vBSEO 3.2.0 ©2008, Crawlability, Inc.