ガイドグループ世話人の日記

はてなダイアリーガイド

はてなダイアリーガイドの草稿置き場です。この日記へリンクはどこでもご自由にどうぞ。ガイドを作るガイドグループ参加もお気軽に*。グループに入らなくても、ガイドははてなダイアリー市民なら誰でも作成・編集できるものですのでよろしくどうぞ。

※MacOS9でInternetExplorerをお使いの方は、この日記にコメントを書き込もうとすると文字化けすることがあります。対処方法はこちらをご覧ください。

 | 

2005-02-01

外部アクセス解析ツール使用テスト

はてなでのアクセス解析

http://guide.g.hatena.ne.jp/sugio/19000124

に関連して、外部無料アクセス解析ツールの性能を試しています。はてなカウンターも同時に設置。アクセス解析の利用経験は、はてな以外でありません。よくわかってないかも。ここで言う「外部無料アクセス解析ツール」とは、忍者ツールズxreaです。

  • わかった点
    • アクセス解析をする日記のヘッダやフッタに、解析サービスから配布されたタグをコピー&ペーストするが、script、noscriptタグははてなの機能によって無効化されるので、無意味に表示される文字列は取り除かないと見栄えが悪い。またこの無効化によって機能が大きく制限される。
      • 外部無料アクセス解析サービス側の「設置タグ改変禁止」の規約があるので、それを守ろうとするなら無意味な文字列もそのままにしなければならない。しかしはてなの仕様によってすでに改変されていると言えるだろう。
    • 忍者ツールズは自サイトへのリンク文がくっついている。広告に当たりはてな利用規約に抵触するか微妙。アクセス解析自体のバナーとそのサービスへのリンクははてなに容認されていると思いましたが(はてなダイアリー日記 - 宣伝行為の範囲についてのアマゾンのアソシエイトリンクについての見解と同様として)、その主な理由は、閲覧者がそのリンクを辿って有益な情報が得られることです。*に当てはまるかどうか。
    • 外部無料アクセス解析サービスは、(タグの無効化により)リンク元がわからない。
    • 外部無料アクセス解析サービスは、(タグの無効化により)検索語がわからない。
    • 外部無料アクセス解析サービスは、(タグの無効化により)はてなカウンターよりカウントが少ない(検知できていないアクセスが多い)。
      • と思ったら忍者ツールズは一工夫されてました。xreaもユニークビジター数がわかるという効用が。
    • (除外設定がわからない)忍者ツールズの本人除外設定って、無効化されてるのかな?xreaはCookie指定でできるようですが、これでいいのかな。いや、両方できない。指定が間違ってるのか、できないのかわからない。
      • できないのかな。(タグの無効化により)Cookie個人を特定できないのなら「前頁(サイト内移動)」「リピーター調査」などの機能も使えないということで納得です。
      • ブラウザでそれらしきのCookie(Shinobi〜やhoge〜)を削除するとカウントされ始めるので、本人除外はできているようです。ただ来歴を取るほうは毎回「初めての訪問者」あつかいになっていて、個人の来訪やサイト内での移動を時系列で追いかけることができないかんじです。
      • xreaは除外IDの指定方法がよくわかりませんでした。情けないですけども、そもそも最初から出る数字がほとんどユニークビジター数なのであまり影響なし。
    • 外部無料アクセス解析サービスは、利用者のUAOS・閲覧しているソフト)、言語、リモートホストドメインISP)がわかる。
      • はてなカウンターではUAがわからないので、利用ブラウザの割合が分かるこの機能は嬉しい。
      • 取れてないアクセスもあるだろうけれど、グラフ化などはされるので、アクセスの波のようなものは十分わかる。
    • 外部無料アクセス解析サービスは、ページ毎に解析できる(ただし、タグをとりつけていく必要があるのが難しい。ページ数は無制限)。
    • あと、ここは携帯で読めない「はてなグループ」なのですが、外部無料アクセス解析サービスは、ダイアリーでも携帯による利用者は検知できないはずですよね。これで差がつくのかひきつづき調査します。

集計結果

設置以降、午後3時からのその日の集計です。

xreaと忍者ツールズは、はてなのscriptタグ無効化により本来の機能が制限され、画像ファイルによるアクセス解析のみの集計結果です。

時間(調査日の)

xrea

()内はユニークビジターとされる数字

忍者ツールズ

()内はユニークビジターとされる数字

はてなカウンター

ユニークビジター集計機能なし

15時台 13(8) 21(21) 45
16時台 15(13) 24(21) 41
17時台 7(7) 10(10) 23
18時台 3(3) 13(13) 15
19時台 4(4) 12(12) 12
20時台 10(8) 11(11) 10
21時台 17(10) 23(23) 25
22時台 9(9) 19(19) 19
23時台 7(7) 14(14) 14

だいぶ数字が違うことがわかります。はてなカウンターのログを見ながらデータをつきあわせてみました。

ただし、はてなカウンターでもJavaScriptと画像ファイルによるアクセス解析なので、ウェブブラウザで「JavaScriptオフ」「画像ファイルを読み込まない(または"original domainからの画像のみ読み込む"など。IEでできるかどうかわかりません)」といった設定をしていれば検知できません。また検索ロボットによる巡回なども検知しません。意図的にアクセス解析を拒否するような設定にしていない閲覧者のほとんどならば検知できるという程度です。

画像ファイルを利用したアクセス解析とは、閲覧者(ウェブブラウザ)がページ中にある画像ファイル(アクセス解析のバナー画像)を読み込む時に、閲覧者が画像ファイルを置いているサーバ側に渡すデータを利用しています。

xreaの数字がとても少ないのは、「画像ファイルが読み込まれた回数」だからです。ウェブブラウザは一度画像を読み込んでしまえば、そのサイト内でページ移動してもキャッシュ(一時保存)した画像を使い回します。だから訪問者がサイトのあちこちを見ても、xreaは最初の1回のアクセスしか記録しません。xreaがユニークビジター(個別訪問者数)として表示する数字は、たしかにユニークビジターとして考えることができる数字です。はてなカウンターにはユニークビジターの集計機能がないので、その点では使えるでしょう。

一方、忍者ツールズは数が多いです。どうやら忍者ツールズは訪問者がページ移動をするごとに画像を読み込ませる機能があるようです(読み込まれる度に見た目はそっくりの別の画像に置き換えたりするんでしょうか?)。はてなカウンターに実に近い数字が出ます。数字が大きく違う時間帯(15〜17時)は、設置した私がサイト内に何度もアクセスした時間帯です。

忍者ツールズは、私による訪問をキャッシュの情報で識別し、集計から除外してくれます。他の訪問者はページ移動する度にカウントされますが、私が編集画面と日記画面を行ったり来たりしても無視されます。どういうときかわかりませんが、1回記録されるときはありますので完全な除外はできていないようです。しかしはてなカウンターには本人のアクセスを除外する機能が全然ないので、忍者ツールズによる集計結果も役に立つでしょう。ただしこの条件で「ユニークビジター」として表示されている数字は、ページビュー数と同じになってしまうので間違いになります。

外部無料アクセス解析ツールとはてなカウンターで得られるデータ

ということで、それぞれのサービスで取れるデータは以下の通り。

  • xreascriptタグ無効状態)
    • ユニークビジター数(の近似値)
    • ホスト名とIPアドレス
    • ブラウザと、その割合の集計
    • ドメイン(プロバイダ)と、その割合の集計
    • ドメイン種(ne.jpなど)の割合の集計
    • プロキシと、その集計
    • OSと、その割合の集計(不明多し)
    • 都道府県と、その割合の集計(ほとんど取れていない)
  • 忍者ツールズscriptタグ無効状態)
    • ページビュー数(の近似値)
    • 本人のアクセス除外
    • ホスト名とIPアドレス
    • OSと、その割合の集計
    • ブラウザと、その割合の集計
    • ドメイン(プロバイダ)と、その割合の集計
    • 言語圏と、その割合の集計
    • プロキシ情報
  • はてなカウンター
    • ページビュー数(の近似値)
    • ホスト名
    • リンク元と、その集計
    • 検索語と、その集計
    • ドメイン(プロバイダ)と、その割合の集計
    • 携帯からのアクセス(2005年3月17日より開始
  • xrea、忍者ツールズ、日記のリンク元を合わせてもはてなカウンターがないとわからない情報は
    • リンク元・検索語の集計
    • リンク元・検索語とホスト名の結びつき
    • 携帯からのアクセス
    • 画像を読み込まない訪問者のアクセス

追記:blogpetモジュールの公開により、blogpetモジュールを設置してBlogpet側のアクセス解析機能をONにした場合もアクセス解析可能です。

用語補足

  • ページビュー……そのサイトでページが読み込まれた数。同じ人がサイト内を移動したり、再読み込みしてもカウントされる。
  • ユニークビジター……ひとりひとりの訪問者。ただし、一度ネットの接続を切って再び訪れた訪問者は別のホスト名になっていることが多いため、別人として数えられる。
  • 生ログ……サーバーが得たそのまま加工していないアクセスログのこと。いつ、どんなIPアドレスからアクセスがあったかという記録を羅列した表示形式が一般的。
  • IPアドレス……インターネット上の所在地を表すアドレス。「110.23.9.100」のようなピリオドで区切られた数字で表現されることが多い。ここではサイトのページを要求して来た(訪問者側の)IPアドレスのこと。
  • ホスト名……IPアドレスを、「YahooBB123〜〜.bbtec.net」のようなアルファベットと数字で表したもの。訪問者(閲覧者)が利用しているサービスプロバイダが、訪問者に一時的に割り当てたIPアドレスであることが普通で、「リモートホスト」と言う。どのプロバイダのどこの地域のアクセスポイントを使っていたかという以上の個人情報は、アクセス解析ではわからない。訪問した個人を特定できる情報はサービスプロバイダが一定期間保存しているが、刑事事件に関する照会などでない限り、通常公開されない。
  • ドメイン……インターネット上の領域で、この場合は訪問者が利用しているサービス事業者などのドメイン。企業や大学などの場合もある。ホスト名の中の「.infoweb.ne.jp」のような部分。
    • いわゆる「アク禁(アクセス禁止)」機能は、一般のサイト所有者にとっては主にこのドメイン(とアクセスポイントなど他の要素をからめたもの)を指定して特定の訪問者をアクセスできなくすることだが、禁止された人物と同じ条件の利用者もアクセス禁止になる弊害がある。はてなダイアリーではアク禁の機能はなく、日記のコメント設定を「ユーザー(はてなユーザーのみ)」にし、コメント拒否ユーザーを指定する機能を利用する。
  • プロキシ……Proxyサーバ。個人のパソコンとインターネットを中継するプロバイダや企業のコンピュータ。訪問者が本来のIPアドレスを隠し、個人の特定を難しくするための中継地点として使われることがあり、この場合はそのような(そういう意図でないこともあります)訪問者が中継に使ったプロキシ。
  • リンク元……その訪問者がどこのページのリンクからやって来たか、そのURL。アドレスバーに直接URLを打ち込んだり、ブックマークなどで来た場合は記録されない。

(以上、外部アクセス解析ツール使用テストでした)

ガイドを携帯で見ます?

ここははてなグループなので携帯で閲覧できないそうですが、ガイドを携帯から見たい方って、それなりにいらっしゃるんでしょうか。需要がけっこうあるようでしたら、携帯用の目次を作って草稿をグループでなく、ダイアリーのほうにも置きますけども。

ガイド原稿自体は特に携帯対応しません。今のところかなりパソコン向けの内容なんですよね。携帯対応ガイドを作るなら、はてなダイアリー共有フォルダ内に携帯サイトを作って……のようになるでしょうか。私は作りませんけども。

nobodynobody2005/02/01 15:44いつもおつかれさまです。えっと、ささいな点ですいません。この文脈では「改編」よりも「改変」のほうが、より妥当かなぁとか思いました。ちなみにこの書き込みにともなうアクセスの記録が各サービスにて記録できているかどうかといったあたりも、もしかすると調査の参考になるかもしれないので、その意味でもほんの少しだけ協力できていたら、うれしいなと思いました。ではでは。

sugiosugio2005/02/01 15:55ご指摘ご協力ありがとうございます。どのサービスでも記録できなかったようです。

sugiosugio2005/02/01 16:05nobodyさんの環境はJavaScriptオフでイメージ読み込み不可にしていたということかな。

sugiosugio2005/02/01 16:13↑ブラウザ(Mozilla)の環境設定で画像を非表示、JavaScriptオフにしてコメントしてみました。はてなカウンターでもカウントされません。

nobodynobody2005/02/01 17:42[JavaScriptオフでイメージ読み込み不可] そのとおりです。説明不足ですいません。(まだ言葉足らずですが)。
画像に関してはoriginal domainからの画像のみ読み出すようにしています。また、一部のドメイン(adclickさん等)については広告除去のプラグインをつかっていたりしますけれど、これは今回のアクセス解析にはあまり関係がないかもしれません。ではでは。〜

sugiosugio2005/02/01 17:47補足ありがとうございます。どもども。

nobodynobody2005/02/02 17:17文中からリンクされている「いわし」での近藤さん発言に関連して。g:hatenaでの記載をご紹介しておきます。
「バナー広告が掲載される形式のアクセスカウンターの利用を禁止する」
→ http://hatena.g.hatena.ne.jp/keyword/%e3%81%af%e3%81%a6%e3%81%aa%e6%83%85%e5%a0%b1%e5%89%8a%e9%99%a4%e3%82%ac%e3%82%a4%e3%83%89%e3%83%a9%e3%82%a4%e3%83%b3?kid=25#p8
(キーワード「はてな情報削除ガイドライン」より)
また何か気がついたらお知らせしたいと思います。ではでは。

sugiosugio2005/02/02 17:26「バナー広告」表現があるんですね。こちらのほうが参照資料には良さそうです。どうもありがとうございます。

 | 

ホームページ制作