justman10000
Goto Top

Episodenlisten extrahieren

Hi, nehmen wir mal von Wunschliste.de irgend eine Serie! Nun würde ich dessen Episodenliste über NodeJS in ihre Einzelteile zerlegen wollen (jeder Reiter derer soll über eine eigene Variable abrufbar sein), um diese unter anderem über
console.log()
ausgeben zu können! Ebenfalls existieren Serien, dessen Episoden unterteilt sind (Episode 1a, 1b, 2a, 2b, oder 1a, 1b, 1c, 2a, 2b, 2c usw), welche auch wieder jeweils über seperate Variablen erreichbar sein sollten...

Wie würdet ihr dies anstellen?

Content-Key: 61983206872

Url: https://administrator.de/contentid/61983206872

Printed on: July 14, 2024 at 17:07 o'clock

Member: kaiand1
kaiand1 Jun 20, 2024 at 09:07:49 (UTC)
Goto Top
Hi
nun den Betreiber neben der Erlaubnis Genehmigung auch einen Zugang zur API wo du direkt die Daten Verarbeiten kannst ;)

Oder halt gleich von der Quelle die IMDB laden und selber die Datenbank aufsetzten.
Member: Justman10000
Justman10000 Jun 20, 2024 at 09:12:47 (UTC)
Goto Top
Zitat von @kaiand1:

Hi
nun den Betreiber neben der Erlaubnis Genehmigung auch einen Zugang zur API wo du direkt die Daten Verarbeiten kannst ;)

Wäre machbar, hätten die eine API 😅!

Oder halt gleich von der Quelle die IMDB laden und selber die Datenbank aufsetzten.

Die IMDB von der Quelle laden 😕?
Mitglied: 13034433319
13034433319 Jun 20, 2024 updated at 09:45:44 (UTC)
Goto Top
Anfänger Fingerübung ...
Bsp. von https://www.wunschliste.de/serie/king-of-queens/episoden
document.querySelectorAll('div#episodenliste a[href^="/episode/"] strong').forEach((x) => {  
  let staffel = x.parentNode.parentNode.previousSibling.childNodes[0].innerText;
  let episode = x.parentNode.parentNode.previousSibling.childNodes[1].innerText;
  let title = x.innerText;
  console.log("Staffel: " + staffel + ", Episode:" + episode + " | " + title);  
});

screenshot

Funktioniert halt immer nur solange bis die Webseite sich ändert, wenn das eine einmalige Sache ist, OK, kann man machen, ansonsten besser gleich entsprechende DBs nutzen, siehe unten...

Gruß
Member: user217
user217 Jun 20, 2024 at 09:31:27 (UTC)
Goto Top
Member: kaiand1
kaiand1 Jun 20, 2024 at 09:33:28 (UTC)
Goto Top
Zitat von @Justman10000:

Zitat von @kaiand1:

Hi
nun den Betreiber neben der Erlaubnis Genehmigung auch einen Zugang zur API wo du direkt die Daten Verarbeiten kannst ;)

Wäre machbar, hätten die eine API 😅!

Nun die könnten wenn auch eine Bereitstellen zum Datenteilen aber die Infos bekommst du halt vom Betreiber und des Handhabt jeder anders daher bei denen Nachfragen ;)

Oder halt gleich von der Quelle die IMDB laden und selber die Datenbank aufsetzten.

Die IMDB von der Quelle laden 😕?

Die Datenbank mit den ganzen Film/Serien/Schauspieler ect Infos kannst du Laden und selber Verwerten ohne die Daten von anderen zu "Klauen" und deren Infrastruktur zu Belasten.

IMDb Non-Commercial Datasets
Member: user217
user217 Jun 20, 2024 at 09:39:10 (UTC)
Goto Top
welches repo nutzt wohl mediathekenview
Member: UnbekannterNR1
UnbekannterNR1 Jun 20, 2024 at 12:41:18 (UTC)
Goto Top
Member: Justman10000
Justman10000 Jun 21, 2024 updated at 10:52:13 (UTC)
Goto Top
Zitat von @user217:

https://www.filebot.net/ ist bekannt?



Ist schon klar, dass es um's extrahieren von Episodenlisten geht? Nicht um's Umbennenen?