22.12.06

Look who's blogging

Ωραία. Πολύς λόγος για τα μπλογκς τον τελευταίο καιρό. Το περιοδικό TΙΜΕ ανακήρυξε τους μπλογκερς ως People of the Year 2006. Καθώς δεν είμαι ενεργός μπλογκερ (και άρα είμαι απ’ έξω) αποφάσισα να επιδοθώ στο αγαπημένο μου άθλημα, το meta-blogging, με την ελπίδα ότι του χρόνου θα βγω εγώ Person of the Year (αν όχι στο TΙΜΕ, έστω στο ένθετο της Κυριακάτικης Ελευθεροτυπίας - αυτό με τις συνταγές ντε).

Τί γίνεται λοιπόν με την Ελληνική μπλογκόσφαιρα; Υπάρχει πράγματι τέτοιο πράγμα ή είναι αποκύημα της φαντασίας μας; Είναι αλήθεια ότι οι Έλληνες μπλόγκερς μετριούνται στα πόδια μιας σαρανταποδαρούσας;
Σε αυτά και άλλα βασανιστικά ερωτήματα θα επιχειρήσω να δώσω απάντηση στη συνέχεια... υπομονή.

Πιο συγκεκριμένα (και βασανιστικά):

  • Πόσα Ελληνικά μπλογκς υπάρχουν; (πάνω-κάτω, δε θέλουμε ακρίβεια δεκαδικού ψηφίου - εξάλλου δεν υπάρχει μισό μπλογκ ή 1/3 μπλογκ, ή μήπως υπάρχει;)
  • Ποια είναι τα πιο δημοφιλή/αξιόλογα Ελληνικά μπλογκς; (θέλουμε να σιγουρέψουμε ότι κυκλοφορούμε στα πιο hip στέκια)
  • Ποιοι είναι οι γείτονες κάθε μπλογκ; (να ξέρουμε να τα έχουμε καλά μαζί τους)
Ωραία. Πάμε παρακάτω.

Περιορισμοί (μην τα θέλουμε όλα δικά μας)

Όπως θα καταλάβατε, η μελέτη αφορά στην διασυνδέσιμότητα μεταξύ των μπλογκς και όχι σε άλλες (πικάντικες) λεπτομέρειες, όπως πόσα ποστς/σχόλια έχουν γίνει, ποιοι μπλογκερς συχνάζουν πού, ποια μπλογκερού έχει πάει με όλη τη μπλογκόσφαιρα κλπ. (ελπίζω να μη χάσατε κάθε ενδιαφέρον).

Επιπλέον, η μελέτη αφορά στα μπλογκς που:
  • Ανήκουν στα domains blogspot.com και wordpress.com. ΟΚ, υπάρχουν και άλλοι hosts αλλά αυτοί οι δύο είναι οι πιο δημοφιλείς και συγκεντρώνουν το μεγαλύτερο ποσοστό των Ελληνικών μπλογκς (είπαμε, πάνω-κάτω ακρίβεια).
  • Είναι γραμμένα στα Ελληνικά (πιο συγκεκριμένα η κεντρική τους σελίδα).
  • Έχουν τουλάχιστον ένα εισερχόμενο σύνδεσμο από την κεντρική σελίδα κάποιου άλλου Ελληνικού μπλογκ. Τα νέα μπλογκς που δεν έχουν προσελκύσει ακόμη συνδέσμους παρακαλούνται να περιμένουν στην ουρά (ή να γράψουν κανένα ποστ της προκοπής).
Το μέτρο της δημοτικότητας ενός μπλογκ δεν είναι άλλο από το γνωστό Pagerank (αυτό που χρησιμοποιεί η google, για να μη λέτε ότι τα αποτελέσματα δεν είναι αξιόπιστα).

Ωραία. Ας προχωρήσουμε στο ψητό...

Ψητό

Συνολικά εντοπίστηκαν 2.572 Ελληνικά μπλογκς (64,3 σαρανταποδαρούσες), 2.381 από τα οποία ανήκουν στο blogspot και 191 στο wordpress (με το blogger beta η αναλογία αναμένεται να αντιστραφέι).

Τα πιο δημοφιλή μπλογκς της Ελληνικής μπλογκόσφαιρας είναι… (drum roll) τα δύο μπλογκς του Νίκου Δήμου doncat.blogspot.com, nikosdimou.blogspot.com (surprise, surprise). Βρίσκονται μπροστά με τεράστια διαφορά το αμέσως επόμενο (old-boy.blogspot.com), κυρίως επειδή αλληλοσυνδέονται και δεν περιέχουν συνδέσμους προς άλλα μπλογκς (οπότε όλο το Pagerank του ενός διοχετέυεται στο δεύτερο).

Πιο αναλυτικά:

* νέο λινκ *

Λίστα Ελληνικών μπλογκς (κατάταξη βάσει Pagerank)



Κάνοντας κλικ στο URL ενός μπλογκ, ανοίγει καινούρια σελίδα όπου μπορεί κανείς να δεί τους (έσω και έξω) γείτονες του και να πλοηγηθεί στο blog-graph (big deal, η διαφορά είναι ότι μπορεί κανείς να ακολουθεί συνδέσμους και προς τα πίσω). Επίσης είναι δυνατή η αναζήτηση για κάποιο συγκεκριμένο μπλογκ, βάσει του URL του (απ' όλα έχει το μαγαζί).
(sorry, μας τελείωσε ο server)

Λογαριασμός

Ωραία. Τελικά υπάρχει Ελληνική μπλογκόσφαιρα και είναι της τάξης μεγέθους των τριών χιλιάδων μπλογκς, νούμερο όχι αμελητέο αν σκεφτούμε τη χαμηλή διείσδυση του internet στην Ελλάδα (και ότι η λέξη "μπλογκ" μόλις πρόσφατα άρχισε να ακούγεται στα δελτία ειδήσεων). Το μπλογκ του ΝΔ βρίσκεται στην κορυφή των κορυφών, ελάτε κι εσείς να θαυμάσετε τη θέα (paid ad).
Όσοι θέλουν να δούν τα μπλογκς τους σε ανώτερη θέση στη κατάταξη, ας μου στείλουν ένα mail με τον αριθμό της πιστωτικής τους κάρτας (τι, μόνο η google θα τα παίρνει;)

Keep blogging (and I'll keep meta-blogging).
Ευχαριστώ.


Τεχνικές λεπτομέρειες/ψιλά γράμματα
(for computer geeks)

Η συλλογή έγινε αμολώντας έναν crawler στη σελίδα e-roosters.blogspot.com. O crawler εξάγει συνδέσμους από την κεντρική σελίδα κάθε blog μόνο και ακολουθεί αυτούς που δείχνουν σε άλλα blogs στα domains blogspot.com και wordpress.com. Σύνδεσμοι που παράγονται με χρήση Javascript δεν εξάγονται.

Το blog el.wordpress.com αφαιρέθηκε απο το δείγμα καθώς αποτελεί αυτόματο blog aggregator και όχι προσωπικό blog.

Η αναγνώριση της Ελληνικής γλώσσας έγινε μετρώντας τους ελληνικούς χαρακτήρες στην κεντρική σελίδα, ο αριθμός των οποίων πρέπει να είναι > 250 αλλιώς το blog απορρίπτεται ως μη Ελληνικό. Τα πιθανόν διαφορετικά character encodings λαμβάνονται υπ’ όψιν κατά την καταμέτρηση.

Κατά τον υπολογισμό του PageRank χρησιμοποιήθηκε dumping factor = 0.85 και 20 επαναλήψεις. Τα dangling links αφαιρέθηκαν και προστέθηκαν μόνο στην τελευταία επανάληψη του υπολογισμού.