93578
Goto Top

Wie kann man 2 Textdateien vergleichen (OHNE SORTIERUNG!) und die gleiche Zeilen in einer Datei lassen und den Rest löschen?

Ich habe 2 Textdateien mit deutschen Wörtern. Erste Datei ist nach Häufigket von Wörtern sortiert (frequency list) und zweite nach Alphabet (A-Z).

Mein Problem:

Datei 1 enthält Wörter, die nach ihre Häufigkeit sortiert sind. Diese Datei ist größer als die Datei 2.

Datei 2 enthält Wörter, die alphabetisch (A-Z) sortiert sind. Sie ist kleiner als Datei 2.

Der Wortbestand in beiden Dateien ist nicht ganz identisch, jedoch hat ca. 75% Übereinstimmungen.

Ich will:

1) Dateien vergleichen

2) In der Datei 1 nur solche Wörter lassen, die in der Datei 2 vorhanden sind. Der Rest soll gelöscht werden.

3) Die Wörter in der Datei 1 sollen in ihrer usprunglichen Reihenfolge bleiben (also es sollte vorher nichts sortiert werden - sonst verliert man die Reihenfolge).

Wie kann man es tun? Kann mir jemand helfen?


Datei 1:

ich
sie
das
ist
du
nicht
die
es
und
der
wir
was
zu
er
ein
in
mir
mit
arbeit
den
dokumente
personal

Datei 2:

aber
auf
das
dass
den
der
die
du
ein
eine
er
es
haben
hat
hier
ich
in
ist
ja
mich
mir
mit
nicht
sie
so
und
was
wie
wir
zu

Das Endergebnis soll so aussehen (Datei 1):

ich
sie
das
ist
du
nicht
die
es
und
der
wir
was
zu
er
ein
in
mir
mit
den

Content-Key: 334001

Url: https://administrator.de/contentid/334001

Printed on: April 27, 2024 at 05:04 o'clock

Member: BassFishFox
BassFishFox Apr 03, 2017 at 17:46:32 (UTC)
Goto Top
Hallo,

Bin zu faul heute selbst viel zu suchen. face-wink

https://forum.ubuntuusers.de/topic/doppelte-eintraege-aus-einer-datei-en ...
https://wiki.ubuntuusers.de/Textdateien_vergleichen/

Ackere Dich da durch und lass das sortieren wech.

BFF
Mitglied: 132692
Solution 132692 Apr 03, 2017 updated at 18:11:01 (UTC)
Goto Top
grep -wf Datei1.txt Datei2.txt
Gruß p.
Member: Spirit-of-Eli
Solution Spirit-of-Eli Apr 03, 2017 at 18:38:43 (UTC)
Goto Top
Hm Notepad++ kann das doch mit dem Compare Plugin.
Member: BassFishFox
BassFishFox Apr 03, 2017 at 18:39:13 (UTC)
Goto Top
Och p.

So eine schoene Antwort und dann..... face-wink

Wie war die Werbung? "Ob er jemals wieder kommt?"

BFF
Member: BassFishFox
BassFishFox Apr 03, 2017 at 18:41:51 (UTC)
Goto Top
face-wink

Der TO benutzt wohl ein Ubuntu.

OK, NPP++ wuerde ja per WINE laufen.

BFF
Member: Spirit-of-Eli
Spirit-of-Eli Apr 03, 2017 at 18:44:30 (UTC)
Goto Top
Oh Sorry wenn ich mein Wissen in dem Moment nicht derart erweitert habe als das ich mich erkundigt hätte ob es Notepad++ für Ubuntu gibt.

Dieses Standart Tool gehört doch sonst immer ins repertuar.
Member: Kraemer
Kraemer Apr 03, 2017 at 19:05:07 (UTC)
Goto Top
Member: Lochkartenstanzer
Lochkartenstanzer Apr 03, 2017 at 19:11:03 (UTC)
Goto Top
man grep

lks
Mitglied: 93578
93578 Apr 04, 2017 updated at 09:37:48 (UTC)
Goto Top
Ich habe EmEditor und kann zwar vergleichen, aber wie ich da löschen kann - bleibt ein Geheimnis... Zu unverständlich und nicht selbst erklärend für mich... Notepad++ werde ich ausprobieren, danke!
Mitglied: 93578
93578 Apr 04, 2017 at 09:38:17 (UTC)
Goto Top
Werde heute abends testen. Danke!
Mitglied: 93578
93578 Apr 04, 2017 at 09:39:54 (UTC)
Goto Top
Die Sachen kenne ich schon, aber sort und diff helfen in diesem Fall nicht. Danke.