Letzte Woche wurde ein Patent von Microsoft unter dem Namen Identifying a web page as belonging to a blog veröffentlicht. Das Patent wurde im Juli 2006 beantragt. Aus diesem geht hervor, dass wie Microsoft Blogs erkennen will, und dass die Zahl der Blogs in den Suchergebnissen limitiert werden soll. So beschreibt Microsoft die Hintergründe dieses Patents:
Blogging has grown rapidly on the internet over the last few years. Weblogs, referred to as blogs, span a wide range, from personal journals read by a few people, to niche sites for small communities, to widely popular blogs frequented by millions of visitors, for example. Collectively, these blogs form a distinct subset of the internet known as blogspace, which is increasingly valuable as a source of information for everyday users.
Search engines are increasingly implementing features that restrict the results for queries to be from blog pages. The website www.blogcensus.net gives information on an effort to index blogs, though this was apparently discontinued in late 2003. At that time, the site stated that it had indexed 2.8 million blogs. Currently, Technorati claims to be tracking 43.2 million blog sites. It is currently difficult for search engines to identify blog pages, regardless of the source of the content in a blog page.
Interessant ist vor allem die hervorgehobene Aussage, dass Suchmaschinen versuchen würden, die Anzahl der Resultate von Blogs zu limitieren. Ganz verstehe ich das aber nicht, denn spontan fällt mir kein wirklicher Grund ein, Blogs künstlich aus den Suchergebnissen zu streichen. Viel nützlicher wäre es doch, diese Technik dafür zu nutzen, endlich eine gute Blogsuche auf die Beine zu stellen?!
Dass dies in einem Patentantrag steht muss allerdings noch lange nicht heißen, dass Microsoft Live Search tatsächlich derartige Funktionen implementiert hat. Bekanntlicherweise wird heutzutage jede Menge patentiert, was dann nie verwendet wird.
Im Folgenden gehe ich die wichtigsten beschriebenen Erkennungsmerkmale (bzw. Heuristiken) durch, in der Patentbeschreibung unter Absatz 16 bis 20 zu finden. Je mehr dieser Merkmale vorliegen, desto eher liegt ein Weblog vor.
Blogrolloder
Metaphilterenthält, gehört sie wahrscheinlich zu einem Weblog. Außerdem gibt es weitere Wörter, die auf einen Blog hinweisen. Je mehr dieser Wörter gezählt werden, desto eher handelt es sich hierbei tatsächlich um einen Blog. Als Beispiele werde
Blog,
Permalink,
Trackback,
Comment(s),
Blogadund
post atgenannt. Natürlich sollen auch gleichbedeutende Wörter in anderen Sprachen berücksichtigt werden.
blogin der URL bzw. an einer ganz bestimmten Stelle einer URL steht, verbirgt sich dahinter meisten wohl auch ein Blog. Vor allem unmittelbar nach der Domain, also in
pixelfolk.net/blog und nicht pixelfolk.net/artikel/123/blog-bekannt-machen, lässt dies relativ eindeutige Schlüsse zu.Die große Frage ist, ob es bei Live oder anderen Suchmaschinen tatsächlich schadet, als Blog erkannt zu werden? Ich glaube es ehrlich gesagt nicht, aber dennoch könnte man die einen oder anderen Erkennungsmerkmale etwas retuschieren (so mancher SEO prophezeit ja schon, dass Google bald Wordpress-Seiten abwerten könnte, weil diese häufig als Grundlage für Artikelverzeichnisse verwendet werden). Oder man legt es eines Tages darauf an, eben schon in einer Blogsuche aufzuscheinen, und baut sie bewusst ein ...
Artikel kommentieren |
Tweet versenden |
Bookmark setzen |
manueller Trackback
RSS-Feed abonnieren
Sämtliche Artikel im Full-Feed.
Kurznachrichten bei Twitter
Für Kurznachrichten, die im Blog keinen Platz finden.
Algorithmus Blog Blogging Live Microsoft SEO Suchmaschinenoptimierung