justman10000
Goto Top

Episodenlisten extrahieren

Hi, nehmen wir mal von Wunschliste.de irgend eine Serie! Nun würde ich dessen Episodenliste über NodeJS in ihre Einzelteile zerlegen wollen (jeder Reiter derer soll über eine eigene Variable abrufbar sein), um diese unter anderem über
console.log()
ausgeben zu können! Ebenfalls existieren Serien, dessen Episoden unterteilt sind (Episode 1a, 1b, 2a, 2b, oder 1a, 1b, 1c, 2a, 2b, 2c usw), welche auch wieder jeweils über seperate Variablen erreichbar sein sollten...

Wie würdet ihr dies anstellen?

Content-ID: 61983206872

Url: https://administrator.de/contentid/61983206872

Ausgedruckt am: 28.09.2024 um 04:09 Uhr

kaiand1
kaiand1 20.06.2024 um 11:07:49 Uhr
Goto Top
Hi
nun den Betreiber neben der Erlaubnis Genehmigung auch einen Zugang zur API wo du direkt die Daten Verarbeiten kannst ;)

Oder halt gleich von der Quelle die IMDB laden und selber die Datenbank aufsetzten.
Justman10000
Justman10000 20.06.2024 um 11:12:47 Uhr
Goto Top
Zitat von @kaiand1:

Hi
nun den Betreiber neben der Erlaubnis Genehmigung auch einen Zugang zur API wo du direkt die Daten Verarbeiten kannst ;)

Wäre machbar, hätten die eine API 😅!

Oder halt gleich von der Quelle die IMDB laden und selber die Datenbank aufsetzten.

Die IMDB von der Quelle laden 😕?
13034433319
13034433319 20.06.2024 aktualisiert um 11:45:44 Uhr
Goto Top
Anfänger Fingerübung ...
Bsp. von https://www.wunschliste.de/serie/king-of-queens/episoden
document.querySelectorAll('div#episodenliste a[href^="/episode/"] strong').forEach((x) => {  
  let staffel = x.parentNode.parentNode.previousSibling.childNodes[0].innerText;
  let episode = x.parentNode.parentNode.previousSibling.childNodes[1].innerText;
  let title = x.innerText;
  console.log("Staffel: " + staffel + ", Episode:" + episode + " | " + title);  
});

screenshot

Funktioniert halt immer nur solange bis die Webseite sich ändert, wenn das eine einmalige Sache ist, OK, kann man machen, ansonsten besser gleich entsprechende DBs nutzen, siehe unten...

Gruß
user217
user217 20.06.2024 um 11:31:27 Uhr
Goto Top
kaiand1
kaiand1 20.06.2024 um 11:33:28 Uhr
Goto Top
Zitat von @Justman10000:

Zitat von @kaiand1:

Hi
nun den Betreiber neben der Erlaubnis Genehmigung auch einen Zugang zur API wo du direkt die Daten Verarbeiten kannst ;)

Wäre machbar, hätten die eine API 😅!

Nun die könnten wenn auch eine Bereitstellen zum Datenteilen aber die Infos bekommst du halt vom Betreiber und des Handhabt jeder anders daher bei denen Nachfragen ;)

Oder halt gleich von der Quelle die IMDB laden und selber die Datenbank aufsetzten.

Die IMDB von der Quelle laden 😕?

Die Datenbank mit den ganzen Film/Serien/Schauspieler ect Infos kannst du Laden und selber Verwerten ohne die Daten von anderen zu "Klauen" und deren Infrastruktur zu Belasten.

IMDb Non-Commercial Datasets
user217
user217 20.06.2024 um 11:39:10 Uhr
Goto Top
welches repo nutzt wohl mediathekenview
UnbekannterNR1
UnbekannterNR1 20.06.2024 um 14:41:18 Uhr
Goto Top
Justman10000
Justman10000 21.06.2024 aktualisiert um 12:52:13 Uhr
Goto Top
Zitat von @user217:

https://www.filebot.net/ ist bekannt?



Ist schon klar, dass es um's extrahieren von Episodenlisten geht? Nicht um's Umbennenen?