sylvia
Goto Top

2 Excel-Tabellen mit jeweise mehr als 45.000 Datensätzen ohne Dubletten zusammenführen

mehr als 65.xxx geht ja nicht.. Excel 2003

Hallo

Wir haben 2 Tabellen mit Adressen ohne eindeutigen Schlüssel, die wir in einer Tabelle zusammenführen müssen.
Von den jeweils mehr als 45.000 Datensätzen sind nur 6.000 etwa NICHT absolut identisch, die anderen sind absolut identisch.
Hat jemand eine Idee, wie ich die 6.000 rausfinden kann ? Die Doppelten können ruhig wegfallen. (Access vorhanden)

(Beide in eine Tabelle und ohne Dubletten filtern geht wegen der großen Menge nicht)

Grüße
Sylvia

Content-ID: 73121

Url: https://administrator.de/contentid/73121

Ausgedruckt am: 21.11.2024 um 18:11 Uhr

bastla
bastla 08.11.2007 um 22:22:51 Uhr
Goto Top
Hallo Sylvia!

In welchen Spalten stehen die Adressen?
Gibt es Adressen, die ein Semikolon enthalten?
Bedeutet "absolut identisch", dass auch Groß- und Kleinschreibung übereinstimmen?

Grüße
bastla
Sylvia
Sylvia 08.11.2007 um 23:28:06 Uhr
Goto Top
Hallo bastla,

ja, absolut identisch heisst halt absolut identisch auch in der Groß-Kleinschreibung - ist ein Export aus dem gleichen Datenbestand.
Ein Semikolon enthalten die Daten nicht (soweit ich weiss Tab-getrennt) aber man kann sie als csv exportieren wenn nötig...
Name, Vorname, Strasse, plz, ort alles steht in einem eigenen Feld und die Daten die gleich sind sind auch wirklich gleich.
Grüße
Sylvia
bastla
bastla 09.11.2007 um 00:06:41 Uhr
Goto Top
Hallo Sylvia!

Versuchen wir's über .csv:
Alle in weiterer Folge genannten Dateien sind in den selben Ordner zu speichern.

- Speichere die erste Tabelle als "Adr1.csv" (im Format CSV (Trennzeichen-getrennt) (*.csv))
- Speichere analog dazu die zweite Tabelle als "Adr2.csv".
- Speichere das folgende VBScript unter "AdrFiltern.vbs"
Set fso = CreateObject("Scripting.FileSystemObject")  
Set InFile = fso.OpenTextFile(WScript.Arguments(0), 1)
Set OutFile = fso.OpenTextFile(WScript.Arguments(1), 2, True)
Latest = ""  
Do Until InFile.AtEndOfStream
	Line = InFile.ReadLine
	If Line = Latest Then
		Latest = ""  
	Else
		If Latest <> "" Then OutFile.WriteLine Latest  
		Latest = Line
	End If
Loop
If Latest <> "" Then OutFile.WriteLine Latest  
InFile.Close
OutFile.Close
- Speichere den folgenden Batch als "Make.bat":
copy Adr1.csv + Adr2.csv Adr12.txt
sort Adr12.txt /o Adr.txt
AdrFiltern.vbs Adr.txt Adr.csv
del Adr12.txt
start Adr.csv
- Starte den Batch "Make.bat" per Doppelklick.
- Wenn alles geklappt hat, öffnet sich Excel mit der CSV-Datei "Adr.csv" mit den "einzigartigen" face-wink Adressen (die idententischen Datensätze sollten jeweils alle beide verworfen worden sein).

Grüße
bastla
Sylvia
Sylvia 09.11.2007 um 09:20:45 Uhr
Goto Top
Super !
vielen, vielen Dank, Du hast mir damit echt sehr geholfen !! Es tut ! face-smile

Grüße

Sylvia