hiromasa.zone : o)

2006/10/15 Sunday 投稿時の月齢:23.4  月名:真夜中の月  潮汐:小潮 Moon:23.4[真夜中の月]今日の心技体 : 好調期低調期低調期

あなたのブログは何ブログ? このエントリをはてなブックマークに追加このエントリをdel.icio.usに追加

日記 - 晴時々曇 ひろまさ @ 22:25

Masayan さんのところで、

自分でダメ出し < MMRT daily life

このブログを第三者的見方で見ると・・・何のブログ?

という興味深い記事が・・・。

うちもなんだろーと思い調べてみることに。 WordPress やってたり、夜ネタがあったり、ごはんうつしているときもあるし。。 いったいなんなんだろうか!

hiromasa.zone らしく”第三者”はコンピュータ。 自分の全エントリを形態素解析して、その品詞分類と頻出単語から探ってみることにしました。

ChaSen’s Wiki – FrontPage

形態素解析システム茶筌

利用させていただいたのは、形態素解析システム茶筌。 詳しくはリンク先を・・・。 茶筅に全エントリをたべさせて、単語でサマって、それででもって、名詞と未知語(多くは茶筅の辞書にない名詞)でランキングしてみました。

やっぱ WordPress が多いのか?!  結果は以下に!(全エントリから 20 以上出現した単語)

🙂 未知語 424
イン 名詞-一般 352
WordPress 未知語 335
ファイル 名詞-一般 332
プラグ 名詞-一般 325
サーバ 名詞-一般 240
サイト 名詞-一般 214
名詞-一般 181
PHP 未知語 178
画面 名詞-一般 177
WP 未知語 176
コード 名詞-一般 163
エントリ 名詞-一般 162
Linux 未知語 148
関数 名詞-一般 144
PC 未知語 143
! 未知語 140
自分 名詞-一般 133
Windows 未知語 132
インストール 名詞-一般 132
ソース 名詞-一般 127
ゲーム 名詞-一般 123
ソフト 名詞-一般 123
感じ 名詞-一般 122
ページ 名詞-一般 119
ブログ 未知語 117
Google 未知語 114
トラック 名詞-一般 109
環境 名詞-一般 104
😛 未知語 96
コンピュータ 名詞-一般 92
部分 名詞-一般 92
(?) 未知語 91
Web 未知語 89
システム 名詞-一般 86
ユーザ 名詞-一般 86
情報 名詞-一般 85
ロード 名詞-一般 84
データ 名詞-一般 83
HTML 未知語 83
文字 名詞-一般 82
ディレクトリ 名詞-一般 82
名詞-一般 81
言語 名詞-一般 79
バージョン 名詞-一般 77
うち 名詞-一般 74
名詞-一般 73
タグ 名詞-一般 72
2.0 未知語 72
名前 名詞-一般 68
名詞-一般 65
hiromasa.zone 未知語 64
MySQL 未知語 64
日本語 名詞-一般 64
ブラウザ 未知語 64
キャッシュ 名詞-一般 63
URL 未知語 62
インターネット 名詞-一般 61
トップ 名詞-一般 61
画像 名詞-一般 60
テーマ 名詞-一般 59
Eclipse 未知語 58
あと 名詞-一般 57
ソフトウェア 名詞-一般 56
OS 未知語 56
名詞-一般 56
内容 名詞-一般 55
ディスク 名詞-一般 54
テレビ 名詞-一般 54
Masayan 未知語 53
最後 名詞-一般 53
クライアント 未知語 51
the 未知語 51
名詞-一般 50
名詞-一般 50
最初 名詞-一般 50
方法 名詞-一般 49
名詞-一般 47
!! 未知語 47
スクリプト 名詞-一般 46
CD 未知語 46
Plugin 未知語 46
Shift_JIS 未知語 45
hook 未知語 44
メモリ 名詞-一般 44
名詞-一般 44
データベース 名詞-一般 44
記事 名詞-一般 44
ME 未知語 44
Blog 未知語 43
エンジン 名詞-一般 42
言葉 名詞-一般 42
kohaku 未知語 41
先生 名詞-一般 41
技術 名詞-一般 41
インターフェース 名詞-一般 41
名詞-一般 41
Xbox 未知語 41
Fedora 未知語 41
otsukare 未知語 40
アプリケーション 名詞-一般 40
RSS 未知語 40
デスク 名詞-一般 38
UNIX 未知語 38
名詞-一般 38
標準 名詞-一般 38
掲示板 名詞-一般 38
function 未知語 38
ブック 名詞-一般 37
Hello 未知語 37
名詞-一般 37
orz 未知語 37
10 未知語 37
とり 名詞-一般 37
音楽 名詞-一般 37
コンテンツ 名詞-一般 37
変数 名詞-一般 36
状態 名詞-一般 36
ネタ 名詞-一般 35
ポジ 名詞-一般 35
名詞-一般 35
Apache 未知語 34
パソコン 名詞-一般 34
単語 名詞-一般 34
自体 名詞-一般 33
TortoiseSVN 未知語 33
CSS 未知語 33
ドキュメント 名詞-一般 33
プロジェクト 名詞-一般 33
OK 未知語 33
会社 名詞-一般 33
名詞-一般 33
GPL 未知語 32
to 未知語 32
ネットワーク 名詞-一般 32
フォルダ 未知語 32
履歴 名詞-一般 32
セッション 名詞-一般 31
SQL 未知語 31
wp-hatena 未知語 31
人間 名詞-一般 31
class 未知語 31
未知語 30
使い方 名詞-一般 30
WP-Cache 未知語 30
ボール 名詞-一般 30
4 未知語 30
ハイライト 名詞-一般 30
メッセージ 名詞-一般 30
初期 名詞-一般 30
最新 名詞-一般 30
Java 未知語 29
World 未知語 29
CORE 未知語 29
基本 名詞-一般 28
名詞-一般 28
原因 名詞-一般 28
ffmpeg 未知語 28
trunk 未知語 28
一つ 名詞-一般 28
ID 未知語 28
番号 名詞-一般 28
名詞-一般 27
名詞-一般 27
マルチ 名詞-一般 27
JavaScript 未知語 27
360 未知語 27
Sitemap 未知語 27
ツール 名詞-一般 26
クリック 名詞-一般 26
感覚 名詞-一般 26
理由 名詞-一般 26
モード 名詞-一般 26
echo 未知語 26
様子 名詞-一般 26
動画 名詞-一般 26
場所 名詞-一般 26
USB 未知語 25
一般 名詞-一般 25
by 未知語 25
模様 名詞-一般 25
写真 名詞-一般 25
時代 名詞-一般 24
ポート 名詞-一般 24
ライセンス 名詞-一般 24
興味 名詞-一般 24
imap 未知語 24
Subversion 未知語 24
ライブラリ 名詞-一般 24
容量 名詞-一般 23
tags 未知語 23
部屋 名詞-一般 23
アップデート 名詞-一般 23
XML 未知語 23
学校 名詞-一般 23
名詞-一般 23
ファン 名詞-一般 23
POST 未知語 23
プリンタ 名詞-一般 23
サンプル 名詞-一般 23
楽しみ 名詞-一般 22
yutaka 未知語 22
コマンド 名詞-一般 22
Japan 未知語 22
本体 名詞-一般 22
機械 名詞-一般 22
電源 名詞-一般 22
テンプレート 名詞-一般 22
フォーム 名詞-一般 22
名詞-一般 22
UTF-8 未知語 22
自動 名詞-一般 22
名詞-一般 22
この辺 名詞-一般 22
スクリーン 名詞-一般 22
上記 名詞-一般 22
トラブル 名詞-一般 22
リング 名詞-一般 22
BIOS 未知語 22
API 未知語 21
世代 名詞-一般 21
名詞-一般 21
ping 未知語 21
オブジェクト 名詞-一般 21
サーチ 名詞-一般 21
del.icio.us 未知語 21
hiromasa 未知語 21
ボタン 名詞-一般 21
形式 名詞-一般 21
名詞-一般 21
いっしょ 名詞-一般 21
is 未知語 21
仕様 名詞-一般 21
音源 名詞-一般 21
名詞-一般 21
名詞-一般 21
いくつか 名詞-一般 21
フォント 名詞-一般 21
世界 名詞-一般 21
通常 名詞-一般 20
from 未知語 20
Microsoft 未知語 20
MP3 未知語 20
気分 名詞-一般 20
方式 名詞-一般 20
RD-H1 未知語 20
バージョンアップ 名詞-一般 20
アプリ 未知語 20
FTP 未知語 20
名詞-一般 20
目的 名詞-一般 20
& 未知語 20
英語 名詞-一般 20
友達 名詞-一般 20

どうどうの一位は・・・。「 :-)」。 orz

ということで、hiromasa.zone は笑いっぱなしの愉快なブログ(勝手に一人で愉快になっているという説もある)ということが分かりました。 😛

やはり WordPress 関連が多いらしく、WordPress および プラグ – イン が上位に顔をだしています。 他もコンピュータ単語が多いですね。 「このサイトについて」はあながちうそでは無かった模様です。(笑)

人名に目を向けると、Masayan さんがトップで 53。 kohaku さん 41。 Otsukare さん 40。 yutaka さん 22。 と昔からお世話になっている方々が顔をのぞかせます。 今後ともよろしくお願いいたします。

くちぐせ的には「あと」とか「自分」、「うち」「いくつか」が多いのかな~。 まぁこの辺は名詞以外をみるとまた違った結果になるでしょう。

これらのやり方ですが、割と簡単で、wp_posts テーブルから post_content フィールドだけ CSVエクスポート。 落としてきたファイルを、html のタグ除いたりダブルコートとったりして、クレンジング。 でもって、茶筅の Windows 版にかけて結果を Access とかでサマればできます。 月別にサマったりしてみるのもブームが分かって面白そうですね。

エントリ数が多いブログをお持ちの方はやってみると面白いかもしれません。 🙂

11 Comments

Trackback

  1. From: TSJ付゛録゛II - 2006/10/18 Wednesday Nighttime (Trackback)

    Re: あなたのブログは何ブログ?…

     先日、「hiromasa.zone : o)」さんにおいて、下記の記事が投稿されました。
    ●あなたのブログは何ブログ? @ hiromasa.zone : o)
     こ (more…)

  2. From: hiromasa.zone :o) - 2007/6/21 Thursday Nighttime (Trackback)

    Yahoo!Japan の日本語形態素解析Webサービスで遊んでみる…

    日本語対応のサーチエンジンをつくるとなったときに、肝となるであろう形態素解析。 この Web API をなんと Yahoo!Japan が解放してきました! こりゃーおもしろそう、ってことで早速 WordPr…

Comment

  1. From: kohaku - 2006/10/15 Sunday Nighttime (Comment)

    お邪魔します。 🙂

  2. From: おで(Odyssey) - 2006/10/16 Monday Nighttime (Comment)

    おおー、あとでやってみまーす:smile:

  3. From: ひろまさ - 2006/10/16 Monday Nighttime (Comment)

    おお、楽しみです。 😮

    茶筅の Windows / GUI 版、どうも Shift_JIS しかとーさないようなのでかけるまえに、UTF-8 -> Shift_JIS 変換するといいかもしれないです!。

  4. From: Masayan - 2006/10/16 Monday Nighttime (Comment)

    WP界隈で1番とは光栄です。:cool:

    コメントされるのもうれしいですが、引用されるのもうれしいっすね。
    まぁ、少々恥ずかしいですが・・・。:wink:

  5. From: Mie - 2006/10/17 Tuesday Nighttime (Comment)

    内容はたまにががーん!とはずしてくれるとMieが登場したりします。ヘンなところに興味を持つのできっと予想GUYだとは思いますが。

  6. From: Sa・Ga - 2006/10/17 Tuesday Nighttime (Comment)

     あたしは抽出したキーワードが多すぎてAccessが受け入れてくれませんでした。:cry:

     あ、カギ括弧とか句読点も取らないとダメですかね(当たり前か)。

  7. From: ひろまさ - 2006/10/17 Tuesday Nighttime (Comment)

    > Masayan さん

    もう、1年半以上のおつきあいになるんですね。
    今後ともばしばし引用させていただきます。 😀 (すいません、今回こちらのトラックバック不調でとびませんでした。。)

    > Mie ちゃん

    予想GUYの展開で、コメント欄で、ちゃんずけしてみました。 😉

    > Sa・Ga さん

    うわ、なんと Access ごえしちゃいました? インポート使ってます? 昔200万レコードくらいは全然平気だったのですが…。 🙁

  8. From: Sa・Ga - 2006/10/18 Wednesday Nighttime (Comment)

     先ほどトラック・バックを送らせていただきました。
     自分のところ、どうやら自分が思っていた以上にごったになところであるようです(爆)。

    うわ、なんと Access ごえしちゃいました? インポート使ってます?

     あ、テキストから直接コピー&ペースとしようとしておりました。
     60万行を超えるデータだったのですが、31万強で強制的に貼り付けが終了となります。分割してもダメ。
     しかしインポートしたらあっさり60万行超のデータを取り込めました。

     ご教示ありがとうございました。

  9. From: ひろまさ - 2006/10/18 Wednesday Nighttime (Comment)

    良かったです。 🙂 Access 案外いけますよね~。


このサイトはコンテンツをフリーズしました。トラックバック・コメントは閉じられています。

新しいサイトは、

hiromasa.another :o)

です。 :-)

このサイトについて

このブログは引っ越しを行いコンテンツはフリーズしています。hiromasa.anotherへどうぞ。

Powerd By WordPress

We (Heart) WordPress

WordPressME Logo
WordPress Plugins

ブログ内検索

Todays Popular

WordPress Ring

はてなリング - WordPress -

情報

31 queries. 0.340 seconds.

このページの先頭へ