Redundanzen in .csv finden und entfernen mittels PowerShell Skript
Werte Community
Ich muss die Dateien File_A.csv & File_B.csv bereinigen & in einer neuen zusammenfassen. Dies muss ich mit einem PowerShell Skript umsetzen. Die Beiden Dateien enthalten zum Teil die gleichen Inhalte mehrfach, es soll jedoch am Schluss alles nur Einfach im Ergebnis_File.csv vorhanden sein.
Folgendes soll das Skript machen:
File_A.csv + File_B.csv müssen auf Redundanzen untersucht werden & jede Zeile 1x in Ergebnis_File.csv geschrieben werden.
Spalten getrennt durch ";" sind: ID; Vorname; Nachname; Strasse; Nr; Plz; Ort; Telefonnummer
Hinweis: Die Spalte ID darf nicht für die Filterung verwendet werden, da diese nur die Zeilennummer beschreibt, die Filterung muss nach den anderen Spalten erfolgen um Fehler zu vermeiden.
Ich habe leider überhaupt keine Kenntnisse in PS & leider nur begrenzte Ressourcen, ansonsten würde ich mir die Sachen zusammensuchen.
Es grüsst euch
Pomme16
Folgenden Code habe ich aktuell:
Ich muss die Dateien File_A.csv & File_B.csv bereinigen & in einer neuen zusammenfassen. Dies muss ich mit einem PowerShell Skript umsetzen. Die Beiden Dateien enthalten zum Teil die gleichen Inhalte mehrfach, es soll jedoch am Schluss alles nur Einfach im Ergebnis_File.csv vorhanden sein.
Folgendes soll das Skript machen:
File_A.csv + File_B.csv müssen auf Redundanzen untersucht werden & jede Zeile 1x in Ergebnis_File.csv geschrieben werden.
Spalten getrennt durch ";" sind: ID; Vorname; Nachname; Strasse; Nr; Plz; Ort; Telefonnummer
Hinweis: Die Spalte ID darf nicht für die Filterung verwendet werden, da diese nur die Zeilennummer beschreibt, die Filterung muss nach den anderen Spalten erfolgen um Fehler zu vermeiden.
Ich habe leider überhaupt keine Kenntnisse in PS & leider nur begrenzte Ressourcen, ansonsten würde ich mir die Sachen zusammensuchen.
Es grüsst euch
Pomme16
Folgenden Code habe ich aktuell:
##################Pseudo Code######################
#Import File_A.csv getrennt durch ";"
#Import File_B_.csv getrennt durch ";" Import-CSV
#Alle Zeilen durchschauen ForEach-Object...
#Matches suchen (alle Felder ausser ID)
#Wenn mehrere Zeilen identisch, ausgeschlossen ID = redundanzen löschen
#Export nach Ergebnis_File.csv
####Produktiver Code####
#Daten aus File A importieren:
Import-Csv -Delimiter ";" -Path '.\File_A.csv'
#Daten aus File B importiern:
Import-Csv -Delimiter ";" -Path '.\File_B.csv'
#Redundanzen finden & löschen:
ForEach-Object
#Bearbeitete Daten in Ergebnis speichern:
Export-Csv -Path '.\Ergebnis_File.csv' -Delimiter ";"
3 Antworten
- LÖSUNG 147069 schreibt am 13.01.2021 um 11:52:00 Uhr
- LÖSUNG Pomme16 schreibt am 13.01.2021 um 12:06:56 Uhr
- LÖSUNG 147069 schreibt am 13.01.2021 um 12:07:18 Uhr
- LÖSUNG Pomme16 schreibt am 13.01.2021 um 12:06:56 Uhr
LÖSUNG 13.01.2021, aktualisiert um 12:09 Uhr
Compare-Object ist dein Freund
https://administrator.de/forum/auslesen-vergleichen-zweiter-csv-dateien- ...
https://administrator.de/forum/vergleich-zweier-csv-dateien-powershell-s ...
https://administrator.de/forum/powershell-script-inhalt-dateien-vergleic ...
https://administrator.de/forum/auslesen-vergleichen-zweiter-csv-dateien- ...
https://administrator.de/forum/vergleich-zweier-csv-dateien-powershell-s ...
https://administrator.de/forum/powershell-script-inhalt-dateien-vergleic ...
$a = Import-Csv -Delimiter ";" -Path '.\File_A.csv'
$b = Import-Csv -Delimiter ";" -Path '.\File_B.csv'
Compare $a $b -Property 'Vorname','Nachname','Strasse','Nr','Plz','Ort','Telefonnummer' -IncludeEqual -Passthru | select * -Exclude SideIndicator | export-csv .\Ergebnis_File.csv -Delimiter ";" -NoType -Encoding UTF8
LÖSUNG 13.01.2021 um 12:06 Uhr
LÖSUNG 13.01.2021, aktualisiert um 12:16 Uhr