はてなの一文字サービス群に見るレガシー度数

今さら私が指摘することでも無いが、はてなのサービスはアルファベット一文字のホスト名が多い。たとえばa.hatena.ne.jpははてなアンテナだし、bはもちろん、はてな村の中毒者が集まるはてブである。

が、それぞれのcharsetやHTMLの書き方が結構違うなーと思って、ちょっと調べてみた。

FQDN サービス名 charset DOCTYPE 備考
a.hatena.ne.jp はてなアンテナ EUC-JP HTML 4.01 Transitional
b.hatena.ne.jp はてなブックマーク utf-8 HTML 5 中毒
c.hatena.ne.jp はてなココ utf-8 XHTML 1.0 Strict 廃墟
d.hatena.ne.jp はてなダイアリー euc-jp HTML 4.01 Transitional
e.hatena.ne.jp N/A
f.hatena.ne.jp はてなフォトライフ utf-8 XHTML 1.0 Strict ライフ?
g.hatena.ne.jp はてなグループ utf-8 HTML 4.01 Transitional 微妙
h.hatena.ne.jp はてなハイク utf-8 HTML 5 混沌
i.hatena.ne.jp はてなアイデア utf-8 HTML 4.01 Transitional
j.hatena.ne.jp N/A
k.hatena.ne.jp はてなキーワード euc-jp HTML 5 便利
l.hatena.ne.jp はてなランド utf-8 HTML 5 黒歴史
m.hatena.ne.jp はてなメッセージ utf-8 XHTML 1.0 Strict spam
n.hatena.ne.jp はてなココ(の新着) utf-8 XHTML 1.0 Strict 忘却
o.hatena.ne.jp N/A
p.hatena.ne.jp N/A
q.hatena.ne.jp 人力検索はてな utf-8 HTML 5 人気
r.hatena.ne.jp はてなRSS utf-8 HTML 4.01 Transitional 終了
s.hatena.ne.jp はてなスター utf-8 XHTML 1.0 Strict 挨拶星
t.hatena.ne.jp N/A
u.hatena.ne.jp N/A
v.hatena.ne.jp N/A
w.hatena.ne.jp はてなワールド utf-8 XHTML 1.0 Strict 非わんわん
x.hatena.ne.jp N/A
y.hatena.ne.jp N/A
z.hatena.ne.jp N/A

実は3年ほど前にも同じようなことを調べてみたのだけど(はてなの1文字サブドメインを調べてみた: 電気林檎出張所)、当時からあまり状態は変わっていない。他とちょっと違うのは、k,n,tの3つ。

  • k は、http://d.hatena.ne.jp/keyword/ へのリダイレクトのみ。
  • n は、はてなココの新着通知用。1サービスで2文字使うという意欲的な(?)試みだったが、最近はほとんど使われていないような……。
  • tは、これだけ "503 Service Temporarily Unavailable" が返る。何かの準備中なのか?

そして、charsetとDOCTYPEに結構ハッキリした傾向が見て取れる。古い順に、「EUC-JP で HTML 4.01 Transitional」→「utf-8XHTML 1.0 Strict」→「utf-8でHTML 5」と移っているようだ。はてなの中での何かの決めか、あるいは開発環境依存なのかな。

ただ、例えばはてなRSSは「utf-8でHTML 4.01 Transitional」と異色の組み合わせになっている。終了サービスということで、何か後から手動でいじった、と推察。

また、古いはずのはてなブックマークはHTML 5になっているけど、これはリニューアルされたからだろう。そういう意味では、古いサービスだけどHTML 5になっているものはちゃんとメンテナンスされていて、一方HTML 4.01 Transitionalのまま放置されているものは今後終了の可能性がある、と予想できるんじゃないかな。