Piwik — Opensource-Alternative zu Google Analytics

PiwikWir haben hier seit unseren Anfängen das Plugin Semmelstatz eingesetzt, um wenigstens ein paar Zahlen liefern zu können. Letzten Endes wurde die Statistik immer nur genutzt um uns bei gewissen Peaks mit unserem Hoster in Verbindung zu setzen oder zu sehen, wo F!XMBR denn überall verlinkt wird. Google Analytics haben wir uns auch kurz angeschaut, doch ist und war es für uns völlig überkandidelt, zudem ist in Deutschland völlig unsicher, ob es überhaupt eingesetzt werden darf. Selbst bei einer vorhandenen ausführlichen Datenschutzerklärung gibt es rechtliche Einlassungen, die Google Analytics für sehr bedenklich halten. Mit dem Einsatz von WP-Cache funktioniert Semmelstatz nun nicht mehr, da per PHP-Befehl bei Aufruf einer Seite gezählt wird. Das Caching verhindert nun eine korrekte Zählweise. Auf der Suche nach einer Alternative wurde mir per Identi.ca die Opensource-Software Piwik empfohlen. Ich habe es heute installiert — und es ist eine verdammt gute Sache. Nicht nur als Google-Analytics-Alternative sollte man es auf alle Fälle in Betracht ziehen.

Piwik ist schnell installiert, per Webbrowser, wie man es von WordPress oder anderen Content-Management-Systemen kennt. Dann kann man es auch schon starten — wie es bei dieser Art von Software der Fall ist, wird auf der Webseiten, die ausgewertet werden soll, ein kleiner Javascript-Schnipsel eingebunden, und schon zählt das Tool die Besucher und fasst eine Menge weiterer Informationen zusammen.

Der große Vorteil von Piwik: Es werden keine Daten durch die Weltgeschichte geschickt, Google wird diese Daten nicht gebündelt verkaufen und verwerten können — sie bleiben ausschließlich in Eurer Hand, auf Eurem Webserver. Dabei ist ebenso wichtig zu erwähnen, dass keine IPs selbst im Backend angezeigt werden. Diese werden lediglich in der Datenbank gespeichert. Die Macher von Piwik sind aber bereits informiert, dass es in Deutschland diesbezüglich eine unübersichtliche gesetzliche Regelung gibt. Bis dahin kann man per kleinem Eingriff in den Source Piwik das Speichern der IPs in der Datenbank abgewöhnen. Somit hat man nicht nur eine Opensource-Alternative im Einsatz, sondern auch Software, die den deutschen datenschutzrechtlichen (Nicht-) Vorgaben entspricht. Es wird kein Besucher individuell gespeichert, sondern nur ein Gesamtüberblick geliefert. Diesen kann man natürlich in Stunden, Tagen, Wochen und Monaten unterteilen.

Ein weiteres großes Plus ist das API– und Plugin-System. Die Community ist aufgerufen, Plugins zu schreiben, damit weitere interessante Informationen im Dashboard angezeigt werden — oder dass die Daten von Piwik auf anderen Seiten veröffentlich werden können. Das wird bereits genutzt — und sollte Piwik bekannter werden, ist sicherlich noch viel mehr zu erwarten. Der Einsatz einer API-Schnittstelle macht Piwik zu einem noch größeren Highlight. Einzelne Widgets lassen sich so auf anderen Webseiten veröffentlichen — oder gar auf den eigenen Desktop bringen. Es gibt bereits zwei Adobe-Air-Anwendungen: Desktop Web Analytics und Piwik Connector.

In Piwik können mehrere Nutzer angelegt werden, unterteilt in einfacher User — die Statistiken nur sehen können. Zusätzlich gibt es die Rollen Administrator und Superadministrator. Es besteht auch die Möglichkeit, dass jeder Besucher die Statistiken sehen kann, wie es bei Piwik selbst der Fall ist. Jeder Benutzer kann sein Dashboard individuell gestalten. Per Mausklick können Widgets entfernt und hinzugefügt werden. Einfacher geht es nun wirklich nicht — auch wenn mir auf den ersten Blick der Link Widget hinzufügen nicht aufgefallen ist. 😉

Das größte Manko von Piwik ist der Ressourcenverbrauch. Ich hatte es anfänglich gar nicht gesehen, mein Hoster hat mich darauf aufmerksam gemacht — aber es werden 128 MB Arbeitsspeicher empfohlen. Das ist natürlich eine Menge, wenn man bedenkt, dass F!XMBR derzeit mir schnuckeligen 16 MB ruhig läuft. Wir haben Piwik einfach mal dazu gepackt — schau m’er mal, was passiert. Sollte der Fall eintreten, dass wieder die CPU-Last und die Speicherauslastung extrem ansteigen, werde ich Piwik wieder deinstallieren. Bequemlichkeit scheint ihren Preis zu haben — von den Ressourcen her.

Für WordPress gibt es im Übrigen ein Plugin — WP-Piwik. Es greift per API auf die Daten zu und stellt eine kleine Auswahl von mehr oder wenigen Statistiken im WP-Backend da. Programmiert hat das Plugin André — eine sehr feine Sache.

Bis jetzt kann ich bis auf den vermuteten Ressourcenverbrauch wenig Negatives über Piwik sagen. Im Gegenteil. Wer noch ein paar MB Speicher frei hat, und derzeit Google Analytics einsetzt, sollte überlegen, ob er nicht Piwik aufsetzen sollte. Google sammelt diese Daten nicht zum Spaß — das Unternehmen sitzt auf einem riesigen Schatz, teils privatester personenbezogener Daten. Sollte irgendwann der Werbemarkt noch weiter einbrechen, und es auch an die Dividenden der Google-Aktionäre geht, werden auch diese Daten vergoldet, sprich verkauft. Wenn das nicht schon heute geschieht. Gerüchte gibt es darüber immer wieder. Probiert es aus — mich hat es bis jetzt überzeugt.

Piwik Home
Piwik Blog
Piwik Forum
Piwik FAQ

Piwik IP-Speicherung in der DB auf 0.0.0.0

Piwik kurz vorgestellt (Video)

, , , , , , , , ,

26 Antworten zu “Piwik — Opensource-Alternative zu Google Analytics”

  1. Chris sagt:

    Ich habe da im Moment noch ein Problem. Vielleicht weiß ja jemand Rat. Weder im Backend hier von WordPress, noch im Desktop Web Analytics werden zur Zeit die Daten angezeigt. Wenn ich auf die Daten von der Piwik-Demo selbst zugreife, funktioniert alles. Es muss also entweder eine Einstellung bei Piwik selbst sein, oder, und die Vermutung liegt vielleicht näher, eine Servereinstellung. Hat jemand eine Idee?

  2. dieter sagt:

    Wenn, dann aber PiWik über php und nicht javascript. Bei mir wird der Piwik javascript tracker geblockt und ich bin da sicher nicht der einzigste Blocker, siehe Ghostery.

  3. nicname sagt:

    ich benutz weder das wp plugin noch desktop web analytics …

    aber meiner erfahrung nach resultieren die meisten fehelr bei der benutzung der api durch einen falsch eingegebenen auth key

  4. Chris sagt:

    Der Kommentar ist das leuchtende Beispiel, dass manche Leute nicht vom Sofa bis zur Wohnungstür denken können.

    Mit dem Einsatz von WP-Cache funktioniert Semmelstatz nun nicht mehr, da per PHP-Befehl bei Aufruf einer Seite gezählt wird. Das Caching verhindert nun eine korrekte Zählweise.

    Man sollte nun doch wenigstens so weit denken können, dass auch Piwik mit PHP nicht funktioniert, oder? Mal völlig davon abgesehen, dass es so nicht angeboten wird.

    Zudem sollte man selbst Tools wie Ghostery oder NoScript auch immer hinterfragen und seinen Bedürfnissen anpassen. Nennt sich auch Quellenkritik oder schlicht und ergreifend Nachdenken.

    Demnächst stelle ich solch Nachhilfestunden in Rechung…

  5. bernd sagt:

    OT:
    Zu WP-Cache: Habt ihr mal da eine Leistungssteigerung gemessen? Würde mich mal interessieren zu wieviel % die Seiten schneller ausgeliefert werden. BTW ich nutze seit neuestem eAccelerator und eigene Messungen über eine 6MBit-Leitung ergaben, dass WordPress-Seiten tatsächlich 25–40 % zügiger ausgegeben werden. Nur habe ich bei Caches immer ein wenig Sorgen… 😡

  6. Chris sagt:

    Du merkst es doch selber, dass hier wieder alles flüssig läuft. Ich schrieb es bereits: Allein die CPU-Last ist von 1.2 auf 0.25 runtergegangen. Genau gemessen haben wir nicht, aber von gar nicht erreichbar, bis fast sofort, das ist schon ein Fortschritt… 😀

  7. Chris sagt:

    @Bogus: Ohne Link kein Trackback. Das nennt sich dann Spam…

  8. Gerriet sagt:

    Piwik läuft auch unter Drupal. Und da läuft es ganz gut, die Oberfläche von Piwik ist ein bisschen unübersichtlich nach meiner Meinung nach, aber benutze eh nur das im Drupal und selten das Dashboard. Das Google Dings hab ich bisher nie genutzt, weil ich nicht wusste, ob das wirklich kostenlos ist, bin bei sowas vorsichtiger als früher.

  9. Gerriet sagt:

    @Chris: Hmmm .. ich dachte der würde dann zurückgeführt zu euch .. na hier jedenfalls der Link .. warum auch immer *g*

    Drupalmodul: Piwik als StatistikModul in Drupal einbinden

  10. Gerriet sagt:

    @Chris: ahh nun weiss ich, worauf du das bezogen hast … naja man wird alt ;D Sorry

  11. Michael sagt:

    Danke für den super Tip zu Piwik, sowas hab ich schon lange gesucht! Klasse!

  12. Peter sagt:

    Meine Erfahrungen bisher:
    Ich verwende piwik auch schon länger. Großes Manko ist der enorme Speicherbrauch in der Datenbank. Mich würde brennend interessieren, wie hoch der jetzt schon hier bei euch ist, bei einem Blog mit x-tausend Hits/Tag. udn wie der Ansteigt nach einem Monat, halben Jahr usw.

    Das Piwik Javascript wird von diversen ad-Blockern verhindert. So z.B. vom ABP im Firefox.

    Die Dekstopanwendung «Piwik Connector» auf Basis von Adobe-Air bekam ich hier unter Ubuntu nicht ans laufen.

    Ein WP-Plugin für den WP-Adminbereich halte ich für überflüssig. Die Übersichten in Piwik sind sehr gut anzupassen und ausführlich. Und eben auch nur einen Kllick entfernt.

    Plugins zum Anzeigen in der Sidebar sind einfach herzustellen. Piwki bietet eine einfach zu benutzende API. Ich zeige bei mir damit die Browserstats in der Sidebar an. Zeitaufwand das Plugin zu programmieren waren ca. 10 Minuten.

    Piwik kann nicht auf jedem Webspace betrieben werden. Oft sind nötige PHP-Funktionen gesperrt. Manches kann aber durch Patches korrigiert werden. PHP5 ist in jedem Fall ein Muss.

    Piwik ist die bessere Alternative zu Google Analytics. Nicht nur wegen der o.g. rechtlichen Bedenken. Man transportiert nicht mehr jeden Aufruf an irgendwen, sondern alle Daten bleiben «zu hause». Will man irgendwann eine individuelle Auswertung die es so nicht gibt, kann ein fähiger PHP Programmierer schnell ein Plugin erstellen. Piwik ist OpenSource, wird also ständig weiter entwickelt und Bugs und Sicherheitslücken werden zeitnah beseitigt.

    Sehr gute Entscheidung, das einzusetzen, anstatt sich auch einen Dritten zu verlassen.

  13. Paul sagt:

    Ich würde es sehr gerne verwenden. Allerdings liegen meine Dateien bei einem kostenlose Hoster der die Verbindungen nach außen deaktiviert hat. Aber 50% der Funktion konnte ich mal testen und war sofort vom Ergebnis angetan. Bemerkenswert gut werden die erfassten Daten aufbereitet.

    Finde ich gut das du darüber berichtest, es ist eine sinnvolle und sehr effektive Möglichkeit seine Statistiken zu erfassen.

  14. […] wegen des ständig wachsenden Datenhungers von Guhgell hat, der sollte sich vielleicht einmal Piwik anschauen, wenn er nicht direkt die Logdateien des Webservers auswerten kann. […]

  15. Elias sagt:

    Nachdem ich etliche Stat-Lösungen durch habe (auch Google Analytics war mal dabei, bis mir endlich auffiel, dass Google im Moment die Letzten sein sollten, denen man das Usertracken ermöglicht), bin ich dazu übergegangen, direkt die Logdateien des Webservers auszuwerten. Hierzu verwende ich — etwas altbacken — den Webalizer. (Es gibt auch modernere Software für diesen Zweck.) Nachteil ist, dass die Statistiken nicht in Echtzeit vorliegen, sondern dass ich den Auswertungslauf jede Nacht über die crontab anstoße, natürlich zu einer Zeit, in der nicht viel auf dem Server los ist.

    Wer Software auf dem Server installieren kann, eine crontab anlegen kann und keine Probleme damit hat, dass die Stats immer mit einer Verzögerung vorliegen, der könnte in dieser altmodischen Vorgehensweise eine echte Alternative haben — und zwar, ohne dass große Datenbanken mit jenen Daten gefüllt werden, die der Webserver bereits in die Logdatei ablegt. Stattdessen legt der Webalizer ein paar Daten in Form einer Datei im Dateisystem ab, um eine inkrementielle Auswertung der Apache-Logs zu ermöglichen, so dass man veraltete Logdateien auch problemlos löschen kann.

    Die Stats werden als statische HTML-Seiten generiert und stellen meine Bedürfnisse zufrieden; ich interessiere mich auch in erster Linie dafür, wer mich so verlinkt, an welchen Tagen und zu welchen Zeiten die Lastspitzen auftreten und mit welchen Suchbegriffen ich von Suchmaschinen gefunden werde. Ein Nachteil des Webalizers ist allerdings, dass keine spezielleren Auswertungen vorgenommen werden können.

  16. Peter sagt:

    @Paul: Du musst nicht auf einen externen Server zu greifen. Du installierst Piwik ja auf deinem Space. In deine Seite baust du nur einen Javascript Code ein.
    Sagst du mir, bei welchem freehoster du bist?

  17. dakira sagt:

    Hey, danke fuer den Tip. Ich werde mir das auf jeden Fall auch mal anschauen. Aber mal ne andere Frage. Habt ihr eine Idee, wie man vernuenftige Downloadstatistiken bekommt? Dabei waere es wichtig abgeschlossene und angefangene Downloads zu messen, aber auch zu zaehlen, wenn mehrere Downloads zeitgleich von einer IP stattfinden.

    Ich suche nach einer fertigen Loesung.. ansonsten muesste ich es wohl selbst implementieren, was glaube ich nicht soo trivial ist.

  18. Phil sagt:

    Mit dem Einsatz von WP-Cache funktioniert Semmelstatz nun nicht mehr, da per PHP-Befehl bei Aufruf einer Seite gezählt wird. Das Caching verhindert nun eine korrekte Zählweise.

    Ich mag mich zwar irren, aber bietet WP-Cache nicht an, einzelne Sachen vom Cachen auszuschließen? Möglicherweise ließe sich so das Zählen doch noch durchführen, wobei ich Piwik, Semmelsatz etc. nicht kenne und nicht weiß, wie diese Programme arbeiten.

    @bernd:
    Statische Seiten sind immer in der Auslieferung schneller, da weniger Ressourcen verbraucht werden. Warum allerdings WP noch nicht standardmäßig ein Cache eingebaut hat, ist mir schleierhaft, zumal es sich bei WP doch anbietet.

  19. Mark S sagt:

    Ich habe Piwik auch mal für eine WordPress-Webseite getestet, die rund 1000 Besucher am Tag hat. Leider ist die Piwik-Datenbank innerhalb weniger Wochen so stark angewachsen, dass die Statistiken sich nur noch schleppend aufgebaut haben bzw. der Vorgang des Erstellens abgebrochen wurde. Ich nahm Piwik schließlich wieder vom Netz; es scheint mir nicht ausgereift zu sein.

    Oder muss man vielleicht an den Standard-Einstellungen Änderungen vornehmen, die ich übersehen hatte? Naja, viel Spaß beim testen 😉

  20. Falk sagt:

    @Mark S: Schau mal hier: How can I purge Piwik logs? und hier How to setup auto archiving of your reports every nighttime — gegen das Anschwellen der DB hilft auch hier Datensparsamkeit und das Löschen von veralteten Einträgen.

  21. […] Meint zumindest Piwik. Wie in den Kommentaren von unseren Lesern schon angekündigt, hat Piwik das typische Problem mit dem Aufblähen der Datenbank. […]

  22. Für die, die sich Sorgen machen, dass Piwik ohne JavaScript nicht mehr mitzählt: Ein Blick ins HTML verrät, dass dann ein Zählbild aufgerufen wird.

    Nur das Speichern der IPs muss dem Teil noch abgewöhnt werden.

  23. Chris sagt:

    Nur das Speichern der IPs muss dem Teil noch abgewöhnt werden.

    Siehe Artikel. :)

  24. Hallo,

    ich habe sowohl Piwik als auch Google Analytics auf meinem Blog laufen und mal einen Vergleich der Zahlen aus beiden Web Analyse Tools aufgestellt.

    Den Link habe ich oben eingestellt.

    Gruß,

    Peter

  25. Adrian sagt:

    Danke für die zahlreichen Informationen. Bislang nutzte ich GA; werde dies aber jetzt noch einmal überdenken und wohl Piwik nutzen. Erste Tests laufen nun an.

    Vielen Dank!

RSS-Feed abonnieren