Hans: Wikipedia Einschränkungen?

Beitrag lesen

Hi,

ich bin allerdings nicht sicher ob es an mir liegt oder doch an Restriktionen von Seiten Wikipedia, wie auch immer: Wikipedia leistet tolle Arbeit mit Ihren nicht mal 30 Leuten und die gerade aktuellen Millionenspenden gönne ich denen somit von Herzen, wenngleich die Argumente wie Traffic und Serverlast natürlich ein wenig, na ja sagen wir, fantasievoll eingebracht wurden, wenn man bedenkt das die das gesponsort bekommen von google, amazon und anderen.

Warum erzähle ich das jetzt eigentlich, Neid? Nein, wirklich nicht, aber... Ich dachte Wikipedia ist ein echtes "Geben und Nehmen Produkt", mit Vorteile für alle Beteiligten, die damit Geld verdienen, die sich durch Artikel profelieren wollen oder auch die Contentgeilen, welcher ich dann wohl bin.

Nun hatte ich vor Wikipediartikel in eine private Anwendung von mir einzubringen, das würde mir Recherchearbeit erleichtern. Das geht auch solange ich den Inhalt von den normalen Seiten abgreife, wie zb:
http://de.wikipedia.org/wiki/Lex_Barker

Da hier das Parsen aber komplexer ist, als zb. die Printversion oder die XML-Version, wollte ich diese natürlich abgreifen, doch dann kommt, zumindest per file_get_contents, usw..., "Warning: file_get_contents(http://de.wikipedia.org/wiki/Spezial:Exportieren/Lex_Barker) [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.0 403 Forbidden in /...."

Na gut, so bleiben mir mehrere Möglichkeiten, das ganze per socket/curl zu lösen, Browserzugriffe zu simulieren, wie es offensichtlich andere auch tun, was mir aber widerstrebt denn ich will ja nicht ungesetzliches warum also tricksen müssen, oder aber das ganze Wikipedia saugen, was aber auch den nachteil hat, das ich viel mehr bekomme als ich will und was nie aktuell ist.

Jetzt frage ich mich aber, liegt das Problem witrklich an Wikipedia oder mache ich etwas falsch, bzw, wenn Wiki das erzwingt, warum machen die das, warum versuchen die einen zu zwingen die Hauptseiten zu nutzen während die immer behaupten, der Content ist für alle da?

Was mir aufgefallen ist, bei der printversion, wird wohl wirklich immer eine aktuelle Version generiert anstatt das ganze CSS-basiert zu lösen, versteh ich auch nicht diesen Sinn/Unsinn.

Im Grunde geht es mir nur darum den Einleitungstext eines Artikels angezeigt zu bekommen um dann in meinem Programm zu entscheiden will ich mehr davon sehen oder nicht, Kommentare zu verfassen, und Querverweise zu erstellen. Gibt es eine Lösung (ohne Browsersimulationen)?

Hans