Top-Themen

Aktuelle Themen (A bis Z)

Administrator.de FeedbackApache ServerAppleAssemblerAudioAusbildungAuslandBackupBasicBatch & ShellBenchmarksBibliotheken & ToolkitsBlogsCloud-DiensteClusterCMSCPU, RAM, MainboardsCSSC und C++DatenbankenDatenschutzDebianDigitiales FernsehenDNSDrucker und ScannerDSL, VDSLE-BooksE-BusinessE-MailEntwicklungErkennung und -AbwehrExchange ServerFestplatten, SSD, RaidFirewallFlatratesGoogle AndroidGrafikGrafikkarten & MonitoreGroupwareHardwareHosting & HousingHTMLHumor (lol)Hyper-VIconsIDE & EditorenInformationsdiensteInstallationInstant MessagingInternetInternet DomäneniOSISDN & AnaloganschlüsseiTunesJavaJavaScriptKiXtartKVMLAN, WAN, WirelessLinuxLinux DesktopLinux NetzwerkLinux ToolsLinux UserverwaltungLizenzierungMac OS XMicrosoftMicrosoft OfficeMikroTik RouterOSMonitoringMultimediaMultimedia & ZubehörNetzwerkeNetzwerkgrundlagenNetzwerkmanagementNetzwerkprotokolleNotebook & ZubehörNovell NetwareOff TopicOpenOffice, LibreOfficeOutlook & MailPapierkorbPascal und DelphiPeripheriegerätePerlPHPPythonRechtliche FragenRedHat, CentOS, FedoraRouter & RoutingSambaSAN, NAS, DASSchriftartenSchulung & TrainingSEOServerServer-HardwareSicherheitSicherheits-ToolsSicherheitsgrundlagenSolarisSonstige SystemeSoziale NetzwerkeSpeicherkartenStudentenjobs & PraktikumSuche ProjektpartnerSuseSwitche und HubsTipps & TricksTK-Netze & GeräteUbuntuUMTS, EDGE & GPRSUtilitiesVB for ApplicationsVerschlüsselung & ZertifikateVideo & StreamingViren und TrojanerVirtualisierungVisual StudioVmwareVoice over IPWebbrowserWebentwicklungWeiterbildungWindows 7Windows 8Windows 10Windows InstallationWindows MobileWindows NetzwerkWindows ServerWindows SystemdateienWindows ToolsWindows UpdateWindows UserverwaltungWindows VistaWindows XPXenserverXMLZusammenarbeit

gelöst Im Google Webmastertools erscheing beim Test für crawling blockierte URL Meldung Zulässig für Zeile 2Disallow:

Mitglied: 91863

91863 (Level 2)

14.12.2013, aktualisiert 01:53 Uhr, 2733 Aufrufe, 7 Kommentare

Hallo,

meine robots.txt wird gelesen, stoppt aber scheinbar gleich. Ich habe eingetragen alles durchsuchen !

User-agent: *
Disallow:
Im Google Webmastertools erscheint dann

Zulässig für Zeile 2Disallow:
Als Verzeichnis erkannt; bestimmte Dateien weisen eventuell unterschiedliche Einschränkungen auf.

Laut dem hier habe ich gefunden:
http://productforums.google.com/forum/#!topic/webmasters/5AzbdGJbhzA

Ich konnte aber in adneren Dateien keinn Eiintrag wie diesen finden
<meta name='robots' content='noindex,nofollow' />

Hat wer ne Idee ? ich benutze Oscommer 2.2

Gruss
Ralf


ich habe eben noch die Robots.txt angepasst, da ich vermutet habe , es gibt ein Verziechnis wo so Weiterleitungen etc.. sind.
Neu ist nun
User-agent: *
Disallow: /admin/
Disallow: /awstats/
Disallow: /bitpay/
Disallow: /boot/
Disallow: /cache/
Disallow: /cars/
Disallow: /cgi-bin/
Disallow: /etc/
Disallow: /font/
Disallow: /googlesitemap/
Disallow: /images/
Disallow: /includes/
Disallow: /pub/
Disallow: /stats/
Disallow: /tmp/
Allow: /

Sitemap: http://www.rc-thomas.ch/sitemapindex.xml

Es soll alles Spider, von , jeder Suchmaschine ausser die Verzeichniss mit Disallow. Ich hoffe das Allow: / steht hier richtig , für alles Spiderm !
Fehler in Webmastertools ist aber gleich.

Gruss
Ralf

Nun hatte ich aber
Zulässig für Zeile 17Allow: /

Als Verzeichnis erkannt; bestimmte Dateien weisen eventuell unterschiedliche Einschränkungen auf.
Zeile 17 ist die mit Allow: /
brauche ich die ? Nun habe ich die weggelassen. Nun kommt !
Zugelassen

Als Verzeichnis erkannt; bestimmte Dateien weisen eventuell unterschiedliche Einschränkungen auf.


So 10 Minuten später war ich nun auf einem neuen Generator.
Da sieht es so aus:
  1. Generator: http://pixelfolk.net/tools/robots
  2. Erstellt am: 14.12.2013, 01:49
  3. Webseite: http://http://www.RC-Thomas.ch

Sitemap: http://www.rc-thomas.ch/sitemapindex.xml

  1. Folgende Seiten sollen nicht indexiert werden:

User-agent: *
Disallow: /admin/
Disallow: /awstats/
Disallow: /bitpay/
Disallow: /boot/
Disallow: /cache/
Disallow: /cars/
Disallow: /cgi-bin/
Disallow: /etc/
Disallow: /font/
Disallow: /googlesitemap/
Disallow: /images/
Disallow: /includes/
Disallow: /pub/
Disallow: /stats/
Disallow: /tmp/

  1. Schließe folgende Spider komplett aus:

User-agent: WebReaper
User-agent: WebCopier
User-agent: Offline Explorer
User-agent: HTTrack
User-agent: Microsoft.URL.Control
User-agent: EmailCollector
User-agent: penthesilea
Disallow: /

Der Google Test sagt ok. Hier scannt es alle Verzeichnis von google und anderen , ausser die mit Disallow, stimmt das ? Ansonsten alles, oder ?

Gruss
Ralf


Mitglied: colinardo
14.12.2013, aktualisiert um 11:37 Uhr
Hallo Ralf,
die robots.txt wird auch Robots Exclusion Protocol genannt, also werden dort nur die Verzeichnisse eingetragen die ein Robot nicht indizieren soll, alles andere ist für den Robot freigegeben.

Beispiel 1: Allen Robots alles auf dem Server verbieten
User-agent: *
Disallow: /
Beispiel 2: Allen Robots alles freigeben
User-agent: *
Disallow:
Beispiel 3: Allen Robots nur bestimmte Verzeichnisse verbieten, alle anderen Verzeichnisse sind erlaubt.
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /junk/
Dein Allow: / am Ende deiner robots.txt ist also überflüssig. Eine schöne Darstellung und weitere Beispiele dafür findest du hier.

Grüße Uwe
Bitte warten ..
Mitglied: 91863
14.12.2013 um 11:41 Uhr
Hoi,

danke Uwe. DAs bringt mich weiter. Jedoch wird mein Shop trotzdem nicht richtig gelistet. Habe nun die letzten Tage einen neuen OScommerce Shop aufgebaut und werde ihn mit neuem Namen registrieren . Der alte Shop ist auslaufend. Vielleicht wird da ja mal doch gelistet

Gruss
Ralf
Bitte warten ..
Mitglied: colinardo
14.12.2013, aktualisiert um 11:56 Uhr
Das crawling dauert immer etwas, wenn du also etwas an deinen Sitemaps änderst, kann es immer etwas dauern bis die Änderungen bei Google reflektiert werden.
Überprüfe auch mal die generierten XML-Dateien anhand der Sitemap-Referenz: https://support.google.com/webmasters/answer/183668

Du kannst deine Sitemap zusätzlich auch in der robots.txt hinterlegen:
Sitemap: http://www.rc-thomas.ch/sitemapindex.xml
siehe:https://support.google.com/webmasters/answer/183669?hl=en

Grüße Uwe
Bitte warten ..
Mitglied: 91863
14.12.2013 um 12:03 Uhr
Hallo,

ja die Sitemap wurde auch eingetragen und ist seit Tagen gecrawled. Aber bei Google kein Ergebnis.

Gruss
Ralf
Bitte warten ..
Mitglied: Mauspih
14.12.2013 um 20:00 Uhr
Hallo Ralf,

die Funktion testet deine robots.txt nur auf eventuell vorhandene Crawlingeinschränkungen - du siehst initial deine aktuell von Google bekannte robots.txt, kannst dort aber auch Eingaben hinzufügen, um die Auswirkung auf das Crawling zu testen.

Um einen Test durchzuführen, trägst du unten URLs ein, die du auf Crawling-Einschränkungen testen möchtest. In deinem Fall sagt die Meldung oben ja nur, dass die Startseite deines Shops gecrawlt werden darf. Also eigentlich ist alles ok.

Schau dir doch auch mal folgendes, kostenloses E-Book über die Webmaster Tools an: http://www.trustagents.de/unternehmen/publikationen/google-webmaster-to ...
Bitte warten ..
Mitglied: 91863
14.12.2013 um 20:13 Uhr
Ok. Das werde ich mir noch gerne anschauen.

Gruss
Ralf
Bitte warten ..
Mitglied: 91863
15.12.2013 um 11:58 Uhr
ich habe jetut me neue Domäne mit neuer OS Commerce Technik ausfgeschalten, und Shop war 10 Minuten später gelistet.
Eventuell kaufe ich aber trotzdem noch ein Webshop.
Der Oscommerce ist mir zuviel gebastel. Jetzt fehlt noch Amazon.de Anbindung etc..
Nach jedem Plugin laufen die meist nicht gut.

Fazit. Neue Shoptechnik , und Listing kein Problem !!

Gruss
Ralf
Bitte warten ..
Neue Wissensbeiträge
Datenschutz

SiSyPHuS Win10: Analyse der Telemetriekomponenten in Windows 10

Tipp von freesolo vor 3 TagenDatenschutz1 Kommentar

Alle die sich detailliert für die Datensammlung interessieren die unter Windows 10 stattfindet, sollten sich folgende Analyse des BSI ...

Sicherheit
Adminrechte dank Intel-Grafikkarte
Information von DerWoWusste vor 3 TagenSicherheit2 Kommentare

ist das Advisory, welches beschreibt, welche Intel HD Graphics Modelle Sicherheitslücken haben, mit denen sich schwache Nutzer zu Admins ...

Internet

EU Urheberrechtsreform: Eingriff in die Internetkultur

Information von Frank vor 3 TagenInternet1 Kommentar

Liebe Besucherin, lieber Besucher, warum erscheint das obere Banner in allen Beiträgen? Aus Protest gegen Teile der geplanten EU-Urheberrechtsreform ...

Windows Server
Windows Backup - FilterManager Event 3
Tipp von NixVerstehen vor 4 TagenWindows Server

Hallo zusammen, ich bin kein gelernter ITler und auch beruflich nicht in dem Feld tätig. Wir setzen in unserem ...

Heiß diskutierte Inhalte
Hyper-V
Hyper-V Manager startet, jedoch keine VM
Frage von NaleorHyper-V14 Kommentare

Hallo zusammen, auf meinem Windows 10 (Build 1703) Notebook von der Arbeit scheint Hyper-V plötzliche nicht mehr zu funktionieren. ...

DNS
50 EUR für Telekom-, Unitymedia- und Vodafone-Kunden
Frage von Zorro1199DNS14 Kommentare

Hallo zusammen, wie evaluieren gerade das korrekte Einhalten von DNS-TTLs durch verschiedene Provider. Aktuell suchen wir noch Kunden der ...

Windows Server
Sonntagsfrage: Welchen Sinn seht Ihr noch im Server 2019 Essentials
Frage von ashnodWindows Server13 Kommentare

Guten Morgen, ich habe gestern den Windows Server 2019 Essentials als Trial in einer VM installiert um mir das ...

Windows Server
Windows 2012 R2 - Skript um Druckerkonfiguration auszulesen und zu setzen
gelöst Frage von Der-PhilWindows Server11 Kommentare

Hallo! Kennt ihr eine Möglichkeit, per Skript die Konfiguration eines Druckers auszulesen und auf einen anderen anzuwenden? Hintergrund: Ich ...