chrislm
Goto Top

Zwei dateien auf Dubletten untersuchen.

Hallo.
Ich suche eine Möglichkeit 2 Dateien auf Dubletten zu untersuchen. Es gibt eine große Masterdatei und eine kleine die mit dieser abgeglichen werden soll. Entweder erstelle ich eine neue Datei oder lösche die Dubletten in der kleinen, das wäre mir egal.

Ich habe ein Post gefunden, leider ist es nur zum zusammenführen:
2 Excel-Tabellen mit jeweise mehr als 45.000 Datensätzen ohne Dubletten zusammenführen
kann man das irgendwie für meine Bedürfnisse abändern...?

Content-ID: 182419

Url: https://administrator.de/forum/zwei-dateien-auf-dubletten-untersuchen-182419.html

Ausgedruckt am: 23.12.2024 um 02:12 Uhr

d4shoerncheN
d4shoerncheN 22.03.2012 um 11:41:18 Uhr
Goto Top
Um was für eine Art "Datei" handelt es sich denn?
chrislm
chrislm 22.03.2012 um 11:46:52 Uhr
Goto Top
Kommt als Excel, kann daraus auch eine CSV oder so machen...
mak-xxl
mak-xxl 22.03.2012 um 14:06:00 Uhr
Goto Top
Moin chrisIM,

ich lese im angegebenen Link die Aufgabenstellung "... Die Doppelten können ruhig wegfallen ..."

Bei Dir doch auch - schreibst Du also in eine csv-Datei (wie dort auch) und machst diese dann (nach einem letzten Kontrollblick) zur zweiten?! Die originalen Tabellen bleiben durch das Script unberührt.

Freundliche Grüße von der Insel - Mario
bastla
bastla 22.03.2012 um 14:29:48 Uhr
Goto Top
@mario

Nicht ganz - im verlinkten Beitrag ging es darum, die Datensätze aus beiden Dateien zusammenzufassen, ohne dabei Dupikate zu erhalten, wogegen hier - ja was soll denn hier eigentlich genau das Ergebnis sein?

Vermuten würde ich ja, dass alle Datensätze aus der "kleinen" Datei, die nicht in der "Masterdatei" enthalten sind, in die Ergebnisdatei geschrieben werden sollen ...

Grüße
bastla
mak-xxl
mak-xxl 22.03.2012 um 14:35:45 Uhr
Goto Top
Zitat von @bastla:

Nicht ganz - im verlinkten Beitrag ging es darum, die Datensätze aus beiden Dateien zusammenzufassen, ohne dabei Dupikate zu erhalten ...

@bastla

Moin - Davon bin ich auch ausgegangen: Masterfile bleibt - Ablegerfile entsteht neu (wird aufgefüllt und von Dubletten befreit).

Wenn aber ... Na schaun wir mal, dann werden wir schon sehen ...

Freundliche Grüße von der Insel - Mario
bastla
bastla 22.03.2012 um 14:45:04 Uhr
Goto Top
Hallo Mario!
Na schaun wir mal, dann werden wir schon sehen ...
Irgendwie halte ich die Spannung nicht mehr aus face-wink:
findstr /v /x /g:Master.csv Kleine.csv>Duplikatfrei.csv
Grüße
bastla
chrislm
chrislm 22.03.2012 um 15:44:45 Uhr
Goto Top
Vielen dank für die Antworten.
ich bin erst einmal Platt wegen der kleinen Zeile vom Bastla, ich habe es getestet und sie scheint wohl wirklich die Doppler zu finden. aber ich muss noch den Härtetest machen...
mak-xxl
mak-xxl 22.03.2012 um 16:21:31 Uhr
Goto Top
@ bastla,

ich habe beim zwischenzeitlichen Kaffetrinken mit <fc> (in Gedanken!) rumgemacht und ein schwülstiges Konstrukt zur Auswertung des resultierenden Bithaufens errichtet - mittlerweile entsorgt (>NUL 2>&1).
Danke für den Schubs in Richtung 'back to the roots'.

Freundliche Grüße von der Insel - Mario