sven289
Goto Top

Daten von txt-Dateien zusammenführen und in Ordnerstruktur speichern auf Raspberry Pi mittels Bash oder Python

Hallo,

ich bin auf der Suche nach einem Script, dass mehrere .txt-Dateien zusammenführt und diese in einer neuen Datei speichert.

Die Daten stammen von meiner Wetterstation und werden jede Stunde in Form einer txt-Datei gespeichert.
Die Dateien sehen so aus:
weatherdatalog2014-10-28-17-01-02.txt
weatherdatalog2014-10-28-18-01-02.txt
weatherdatalog2014-10-28-19-01-02.txt
weatherdatalog2014-10-28-20-01-02.txt
usw....(24 Stück pro Tag)

Der Inhalt einer txt-Datei enthält u.a. die Temperaturen jeder Minute in Zeitraum von einer Stunde. Eine txt-Datei sieht z.B. so aus:
10.2;2014.10.28;17:01:02
11.7;2014.10.28;17:02:02
10.6;2014.10.28;17:03:02
usw..(60 Werte)


Das Script soll den Inhalt von txt-Dateien eines Tages zusammenführen (im obrigen Beispiel Tag 28) und in einer neuen txt-Datei speichern.

Die Datei, die die zusammengeführten Daten eines Tages enthält, sollte heißen:
2014-10-28.txt
Diese Dateien eines Monats sollen in einer Ordnerstruktur abgelegt werden, etwa /2014/10/ (Jahr und Monat).

Die Uhrzeit wird nicht verwendet. Alle Dateien befinden sich in einem Ordner.
Das Script soll im Hintergrund laufen und laufend überprüfen, ob neue Daten von der Wetterstation auf der Orderfreigabe abgelegt wurden und diese dann wie oben beschrieben behandeln.

Ein Script habe ich dazu als Batchdatei zum manuellen Ausführen unter Windows vorliegen (Dank @bastla). Leider reichen meine Kenntnisse in Bash oder Python nicht aus, um ein derartiges Script zu schreiben.

Ich hoffe, dass Sie/Ihr mir weiterhelfen können/könnt! Über jeden Ratschlag würde ich mich freuen!

Ich bedanke mich schon mal!

Content-Key: 254436

Url: https://administrator.de/contentid/254436

Printed on: April 19, 2024 at 05:04 o'clock

Member: colinardo
colinardo Nov 11, 2014 updated at 09:16:36 (UTC)
Goto Top
Hallo Sven289,
das könnte nach deinen Angaben so aussehen:

In Zeile 2 gibst du den Ordner an in dem die LOG-Files liegen; den Ordner in dem die Ordnerstruktur angelegt werden soll gibst du in Zeile 3 und den Ordner in den die "verarbeiteten" *.txt-Dateien verschoben werden sollen nachdem Ihr Inhalt in die Ordnerstruktur übertragen wurde, in Zeile 4.

Das Script kannst du dann als Cronjob z.B. regelmäßig ausführen lassen.
#!/bin/bash
folder_log="/data/log"  
folder_ablage="/data/weather"  
folder_backup="/data/log/backup"  

# Dateien auflisten
files=$(ls $folder_log/weatherdatalog*.txt -1 2>/dev/null)

# Backupordner erstellen falls noch nicht existiert
if [[ ! -d "$folder_backup" ]];then mkdir -p "$folder_backup";fi  

for file in $files ; do 
        # Dateiname zerlegen
        file_date=$(echo "$file" | grep -Eo '[0-9]{4}-[0-9]{1,2}-[0-9]{1,2}')  
        year=$(echo $file_date | cut -d '-' -f 1)  
        month=$(echo $file_date | cut -d '-' -f 2)  
        target_folder="$folder_ablage/$year/$month"  

        # Ziel-Ordner erstellen wenn noch nicht vorhanden 
        if [[ ! -d "$target_folder" ]];then mkdir -p "$target_folder";fi  

        # Inhalt der Datei in Tagesdatei übertragen
        cat $file>>"$target_folder/$file_date.txt"  

        # Ausgelesene Datei ins Backup befördern 
        mv "$file" "$folder_backup/"  
done 
Grüße Uwe
Member: Gersen
Gersen Nov 11, 2014 updated at 09:45:05 (UTC)
Goto Top
Hallo Uwe,

super Skript. Aber zwei Anmerkungen:

1. Sollten in den Zeilen 23/26 nicht statt "$file" "${folder_log}/${file}" stehen?
2. Für einen Ablauf als Cronjob - müsste da nicht eine PATH-Variable definiert werden bzw. absolute Pfade für die Befehle verwendet werden?

Gruß,
Gersen
Member: colinardo
colinardo Nov 11, 2014 updated at 10:08:20 (UTC)
Goto Top
Hi Gersen,
Zitat von @Gersen:
1. Sollten in den Zeilen 23/27 nicht statt "$file" "${folder_log}/${file}" stehen?
nein, in $file steht schon der komplette Pfad face-wink
2. Für einen Ablauf als Cronjob - müsste da nicht eine PATH-Variable definiert werden bzw. absolute Pfade für die
Befehle verwendet werden?
kann man noch ergänzen ... die Pfade auf dem raspi kenne ich jetzt aber gerade nicht. Es werden aber eigentlich keine "seltenen" Befehle verwendet so dass diese aus einem cron auch so laufen sollten ... das tun sie hier zumindest auf einem Ubuntu.

Grüße Uwe
Member: Sven289
Sven289 Nov 11, 2014 at 12:51:53 (UTC)
Goto Top
Hallo Uwe,

vielen Dank für deine schnelle Antwort. Ich hatte leider noch keine Gelgegenheit das Script auf einem Raspberry zu testen. Auf einem Ubuntu-PC läuft es jedoch perfekt.

Falls es nicht zu aufwendig ist, wäre es gut, wenn noch eine zusätzliche Funktion in das bestehende Script implementiert werden könnte.
Die Daten in den txt-Dateien sind ja wie folgt aufgebaut:
Je Zeile folgender Datensatz: 2014.11.11;13:00:02;12.3;15.1;0.652 (Datum;Uhrzeit;Messwert1;Messwert2;Messwert3)(getrennt durch Semikolon)
In jeder txt-Datei befinden sich 60 Werte.

Damit ich die Daten besser verarbeiten kann, wären Mittelwerte eine große Hilfe. Das heißt, das immer von 10 Datensätzen ein Mittelwert (von den drei Messerten) gebildet wird.
Die fertigen Daten könnten dann wie folgt aussehen:
2014.11.11;13:00:02;12.0;15.2;0.657
2014.11.11;13:10:02;12.1;15.4;0.656
2014.11.11;13:20:02;12.0;15.3;0.659

Es soll somit zusätzlich zu der bereits bestehenden eine weitere Ordnerstruktur aufgebaut werden, nur eben mit den Mittelwerten. Diese Strukur ist gleich aufgebaut und eine Datei hat auch z. B. wieder den Namen 2014-10-28.txt.

Wenn man das hingekommen könnte, wäre es echt großartig!

Für eine Antwort schon einmal vielen Dank!!
Member: colinardo
colinardo Nov 11, 2014, updated at Nov 12, 2014 at 08:42:28 (UTC)
Goto Top
Zitat von @Sven289:
Falls es nicht zu aufwendig ist, wäre es gut, wenn noch eine zusätzliche Funktion in das bestehende Script implementiert
werden könnte.
Die Daten in den txt-Dateien sind ja wie folgt aufgebaut:
Je Zeile folgender Datensatz: 2014.11.11;13:00:02;12.3;15.1;0.652 (Datum;Uhrzeit;Messwert1;Messwert2;Messwert3)(getrennt durch
Semikolon)
In jeder txt-Datei befinden sich 60 Werte.
aha, oben sahen die noch ganz anders aus face-wink
Damit ich die Daten besser verarbeiten kann, wären Mittelwerte eine große Hilfe. Das heißt, das immer von 10
Datensätzen ein Mittelwert (von den drei Messerten) gebildet wird.
Die fertigen Daten könnten dann wie folgt aussehen:
2014.11.11;13:00:02;12.0;15.2;0.657
2014.11.11;13:10:02;12.1;15.4;0.656
2014.11.11;13:20:02;12.0;15.3;0.659

Es soll somit zusätzlich zu der bereits bestehenden eine weitere Ordnerstruktur aufgebaut werden, nur eben mit den
Mittelwerten. Diese Strukur ist gleich aufgebaut und eine Datei hat auch z. B. wieder den Namen 2014-10-28.txt.

Wenn man das hingekommen könnte, wäre es echt großartig!
Das ist machbar, habe noch eine weitere Ordner-Variable für die zweite Mittelwert-Struktur hinzugefügt:
(Hinweis: benötigt zusätzlich awk auf dem Raspi)
#!/bin/bash
folder_log="/data/log"  
folder_ablage="/data/weather"  
folder_ablage_mittelwerte="/data/weather_average"  
folder_backup="/data/log/backup"  

# Dateien auflisten
files=$(ls $folder_log/weatherdatalog*.txt -1 2>/dev/null)

# Backupordner erstellen falls noch nicht existiert
if [[ ! -d "$folder_backup" ]];then mkdir -p "$folder_backup";fi  

for file in $files ; do
	# Dateiname zerlegen
	file_date=$(echo "$file" | grep -Eo '[0-9]{4}-[0-9]{1,2}-[0-9]{1,2}')  
	year=$(echo $file_date | cut -d '-' -f 1)  
	month=$(echo $file_date | cut -d '-' -f 2)  
	target_folder="$folder_ablage/$year/$month"  
	target_folder_mittelwerte="$folder_ablage_mittelwerte/$year/$month"  


	# Ordner erstellen wenn noch nicht vorhanden
	if [[ ! -d "$target_folder" ]];then mkdir -p "$target_folder";fi  
	if [[ ! -d "$target_folder_mittelwerte" ]];then mkdir -p "$target_folder_mittelwerte";fi  

	# Inhalt der Datei in Tagesdatei übertragen
	cat $file>>"$target_folder/$file_date.txt"  

	# Mittelwerte auslesen und in zweite Struktur schreiben
	cat "$file" | awk -F ';' '{if(count < 10){sum1 +=$3;sum2 +=$4;sum3 +=$5;if(count == 0){tm=$1";"$2};count++}else{print tm";"sum1/10";"sum2/10";"sum3/10;sum1=$3;sum2=$4;sum3=$5;count=1;tm=$1";"$2}} END {print tm";"sum1/10";"sum2/10";"sum3/10}'>>"$target_folder_mittelwerte/$file_date.txt"  

	# Ausgelesene Datei ins Backup befördern
	mv "$file" "$folder_backup/"  
done
Viel Erfolg.
Grüße Uwe
Member: Sven289
Sven289 Nov 12, 2014 at 06:47:49 (UTC)
Goto Top
Hallo Uwe,

ich habe Dein Script nun nocheinmal auf meinem Ubuntu-System ausprobiert. Leider klappt die Mittelwertbildung nicht richtig.
In einer Ausgangsdatei steht z.B.:
10.11.14;16:00:00;143;0.108;10.1
10.11.14;16:01:00;133;0.097;10.1
10.11.14;16:02:00;151;0.116;10.1
10.11.14;16:03:00;138;0.103;10.1
10.11.14;16:04:00;139;0.104;10.1
10.11.14;16:05:00;139;0.104;10.1
10.11.14;16:06:00;148;0.113;10.1
10.11.14;16:07:00;132;0.096;10.1
10.11.14;16:08:00;143;0.108;10.1
10.11.14;16:09:00;130;0.094;10.1
10.11.14;16:10:00;130;0.094;10.1
10.11.14;16:11:00;152;0.117;10.1
10.11.14;16:12:00;125;0.089;10.1
10.11.14;16:13:00;159;0.125;10.1
10.11.14;16:14:00;115;0.078;10.1
10.11.14;16:15:00;123;0.087;10.0
10.11.14;16:16:00;123;0.087;10.1
10.11.14;16:17:00;140;0.105;10.0
10.11.14;16:18:00;131;0.095;10.0
10.11.14;16:19:00;153;0.118;10.0
(gekürzt)

In der Datei, wo die Mittelwerte stehen sollen, wird folgendes hineingeschrieben:
10.11.14;16:00:00;139.6;0.1143;10.1
10.11.14;16:11:00;149.4;0.1103;11.06

Eigentlich sollte dort für diese Werte stehen:
10.11.14;16:00:00;125.7;0.1043;10.1
10.11.14;16:10:00;135.1;0.0995;10.06
(mit Taschenrechner nachgerechnet)

Die Uhrzeit ist stets eine Minute weiter, als sie sein sollte. Aus dem gleichen Grund stimmen die Durchschnittswerte wohl auch nicht.
Es wäre gut, wenn du noch einmal über das Script schauen könntest. Vielen Dank!
Member: colinardo
colinardo Nov 12, 2014 updated at 08:52:04 (UTC)
Goto Top
Zitat von @Sven289:
Eigentlich sollte dort für diese Werte stehen:
10.11.14;16:00:00;125.7;0.1043;10.1
10.11.14;16:10:00;135.1;0.0995;10.06
(mit Taschenrechner nachgerechnet)
Dann hat dein Taschenrechner aber auch noch nicht seinen Kaffee bekommen face-wink 125.7 stimmt laut deinen Werten nicht hier bekomme ich 139.6 raus.

Die Uhrzeit ist stets eine Minute weiter, als sie sein sollte. Aus dem gleichen Grund stimmen die Durchschnittswerte wohl auch
nicht.
Der Fehler war Absicht, du solltest ja auch was von dem Script lernen und selber probieren face-smile und nicht nur Copy n' pasten.
Ist oben nun korrigiert.
Member: Sven289
Sven289 Nov 12, 2014 at 09:42:10 (UTC)
Goto Top
Ich dachte mir schon, dass das etwas absichtlich manipuliert wurde face-wink Leider habe ich das Problem nicht selbstständig lösen können, meine Versuche habe es nicht gerade besser gemacht face-smile. Deshalb ein großes Dankeschön dafür!
Ich hätte noch eine Frage zu dem neuen Script: In dem Teil, wo die Mittelwerte erstellt werden, stand in der ersten Version noch ein BEGIN ziemlich am Anfang. In deiner neuen Version fehlt dieses. Ist das so in Bash machbar? Denn ein END steht ja weiterhin am Ende.
Member: colinardo
colinardo Nov 12, 2014 updated at 10:05:41 (UTC)
Goto Top
Zitat von @Sven289:
stand in der ersten Version noch ein BEGIN ziemlich am Anfang. In deiner neuen Version fehlt dieses. Ist das so in Bash machbar? Denn ein END steht ja weiterhin am Ende.
Das ist nicht mehr nötig, die AWK-Abschnitte sind optional und kein muss, hatte den zu Beginn zur Initialisierung einer Variablen benutzt, das brauchts jetzt nicht mehr.
http://www.gnu.org/software/gawk/manual/gawk.html#BEGIN_002fEND
Member: Gersen
Gersen Nov 14, 2014 at 11:35:51 (UTC)
Goto Top
Zitat von @colinardo:

nein, in $file steht schon der komplette Pfad face-wink
Ah, merci - wieder was gelernt...