« スポーツ観戦 (今日のテーマ) | トップページ | 特別企画・先週の検索ワードができるまで。2 »

2008年11月 2日 (日)

特別企画・先週の検索ワードができるまで。1

 今週は毎週やってるこの企画がどのような段取りでできてるか、順を追って説明していこうと思います。

 ココログのアクセス解析機能で「過去7日間」を選び、対象を「検索ワード・フレーズ」とすると、検索ワードやフレーズが順位つきグラフ表示つきで表示されます。1ページ100件、今週は1,526件ありましたから、16ページありました。各ページからテキストエディタにコピペでその内容を抜き出します。この段階で扱う気がある話題をより抜くと手間なので、一度全て出してしまいます。問題ある検索語が載っていて掲載できない場合も多いのですが、今週はあえて対象期間とサンプル数を含めた上で、順位まできっちり載っているベタテキストを公開してみます。

 テキストファイルなのでブラウザでも読めますが、右クリックで保存してエディタで読んだ方がいいかもです。
 ファイルはこちら。 0810_5_log.txt 文字化けする人は文字コードセットを変更して下さい。

 各ワード右の「G Y M」という部分は、解析機能のページでは対象語をそのままサーチエンジンで検索するためのリンクになっています。GはGoogle、YはYahoo、MはMSN(Windows Live Serch)です。その次の数字が同じワード・フレーズで検索された回数、そして最後がそのワードの全体におけるパーセンテージです。実際の表示だとグラフがさらに右に出ます。
 この部分は必要ないので、上位の「同率順位」が発生しないあたりは手作業で、下位の発生するあたりはテキストエディタの置換機能でまとめて空白に置き換えます(=消去)。

 また、順位の数字も最終的に反映しないので、ここでテキストエディタで「○」に置き換えます。本来ならここで上位の手作業で置き換えるあたりに削除対象があると削ってしまうのですが、今週はわかりやすくそのまま残してみました。この時点でのファイルは以下になります。

 ファイルはこちら。 cleanup.txt 先程と同じようにどうぞ。

 さて、こうして出来上がったテキストから、扱わない話題を省いていきます。被っている言葉は削除したりしなかったりです。(あえて残して複数パターン…例えば大文字小文字はきっちり区別しているので、同じ検索語でも複数の検索語として認識される場合があるのです…を全て出すことで、アクセスの多さを強調して見せることもありますが、多くの場合は削っています)今週の場合はDDのマーヤ様関連の検索が被り気味なので、的確と思われる表記を残して他は消してしまいます。

 この作業が意外と時間がかかるので、一度切ります。(これからするので・笑)
 さて、貴方が気になった検索ワードは残っているでしょうか?

|

« スポーツ観戦 (今日のテーマ) | トップページ | 特別企画・先週の検索ワードができるまで。2 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« スポーツ観戦 (今日のテーマ) | トップページ | 特別企画・先週の検索ワードができるまで。2 »