peterha
Goto Top

Linux: Daten aus Datei auslesen

Moin zusammen,

per wget <URL> lade ich eine Website herunter. Die Datei Website.txt beinhaltet u.a. die Zeile:
<p class="spw_current_temp">                                        18&deg;C                                    </p>            </div>            <div class="weather_sp1_cright">  

Meine Frage ist nun: Wie kann ich die Info 18°C (18&deg;C) hier extrahieren in eine neue txt Datei?

Aktuell bekomme ich die Zahl raus mit diesem hier:
grep -om1 '[0-9]\+' /home/pi/autowallpaper/dateien/test.txt > /home/pi/autowallpaper/dateien/test2.txt  
Doch wie bekomme ich sie NUR aus der richtigen Zeile? Also "<p class="spw_current_temp">".

Könnt ihr mir bitte dabei helfen? Danke vorab und einen schönen Sonntag.
Peter

Content-ID: 273437

Url: https://administrator.de/contentid/273437

Ausgedruckt am: 22.11.2024 um 06:11 Uhr

Lochkartenstanzer
Lösung Lochkartenstanzer 31.05.2015 aktualisiert um 21:18:00 Uhr
Goto Top
 grep -i "&deg;C" webseite.txt | gawk -F "&deg;C" ' { print $1 "°C" } ' >neuedatei.txt 

lks
peterha
peterha 31.05.2015 um 21:17:45 Uhr
Goto Top
Deine Befehl gibt mir aus:
                                        18°C
                <span class="weather_sp1_temp">9°C  
                <span class="weather_sp1_temp">13°C  
                <span class="weather_sp1_temp">9°C  

Damit komme ich weiter. Vielen Dank.
Peter
Lochkartenstanzer
Lochkartenstanzer 31.05.2015 um 21:21:37 Uhr
Goto Top
Zitat von @peterha:

Deine Befehl gibt mir aus:
                                        18°C
>                 <span class="weather_sp1_temp">9°C  
>                 <span class="weather_sp1_temp">13°C  
>                 <span class="weather_sp1_temp">9°C  
> 

Dann kannst Du mit grep -v die unerwünschten Zeilen wegfiltern.

Damit komme ich weiter. Vielen Dank.


gern geschehen.

Schönen Sonntag noch,

PS. Da scheint noch ein Sonderzeichen zwischen der Zahl und dem ° zu sein. es soltel aber kein Problem sein, das rauszufiltern.

lks
peterha
peterha 31.05.2015 um 21:26:39 Uhr
Goto Top
Kein Sonderzeichen. { print $1 "°C" }
Habs auch schon mal neu geschrieben. Aber ist ok. Danke!