#146 「もしかして」が賢くなったことについての考察

-------------------------------------------------------------------

2011.02.01 #146 【石田塾メールマガジン】

「もしかして」が賢くなったことについての考察  毎週 火曜日配信

-------------------------------------------------------------------

前田です。

僕はワールドカップすらろくに見ない非国民ですが、先日のアジアカップ
決勝は、なんとなく観てしまいました。

いやー、起きててよかった!!

サッカーって点がなかなか入らないと退屈だなーとか思ってたんですが、
結構観てて面白いものですね。

これから大きな試合は観るようにしよ。

---------------------------------------------------------------------

■ 「もしかして」が賢くなったことについての考察

---------------------------------------------------------------------

Googleで検索すると、特に入力や変換を間違えたときに「もしかして」って、
出るじゃないですか。

どうもあれが最近、大幅なアルゴリズムの変更によって、賢くなったようです。

Googleスタッフブログによると

(例 1) jal 必要な参る → jal 必要マイル
(例 2)なべじき → 鍋敷き
(例 3)ホットオエオオアー → ホットペッパー

このように、キーワードを類推する能力が上がっているということでした。

これらの例は次の3通りの事例に対応できることを意味しています。


例1は、典型的な変換ミス事例。
例2は、変換し忘れ
例3は、起こりやすいタイプミス


改めて考えると凄いことですよ。これは。

動きとしては「お前、それ間違ってない?」って指摘する、
人間と同じことをやってるわけですから。


蓄積した過去の情報から、その言葉が正しいかどうかを判断して
間違っている場合には、正解の候補を挙げる。


こういうプログラムを組むのに大変なのは、「情報の蓄積」。
要は人間で言う記憶や経験に値する、大量のデータを用意し、それを
運用することです。


しかし、Googleの場合には既に独自の負荷分散技術を確立していて、
大量のデータを扱うことに関しては問題はありませんし、データ収集
は、日々、僕たちが検索しているキーワードを蓄積していくだけで、
生きた情報がバンバン入ってきます。


これまで、日本ではYSTを使う人が圧倒的に多かったのが、先日の
統合によって、YSTユーザーの検索データもGoogleに渡るように
なりました。

本当にGoogleがYSTの検索データを把握しているかどうかは、定かでは
ありませんが、Googleの検索エンジンを利用するということは、恐らく
そういうことで間違いないと思っています。

ってことは、単純に検索数だけ考えれば、これまでの倍以上。

データ収集には重複もあるので、限界はありますが、これまでより多くの
サンプルを得ることで、開発スピードが上がることは想像に難くありません。

日本語は難解な言語なので、完璧な解析はそうそうできないとは
思いますが、Googleが人間と同じレベルで日本語を解析できるように
なるまで、もう何年も無いのかなという気がします。


検索エンジンの究極の目的は、検索されたキーワードに対して最適な
内容のページを表示することです。

その精度を上げるために、Googleは進歩していっています。


これからは、各ページごとのタイトルと内容のマッチングを意識した
コンテンツ作りがひとつのポイントになりそうです。

特に、Googleになって個別ページからの検索が入るようになったという
方が多くいらっしゃいますので、全てのページにおいて対策して
おきたいですね。


(前田)

-------------------------------------------------------------------

■ さらにパワーアップ!!
無料お試し7日間付、ASP自動集計ツール「ASC」&「集め太郎」

-------------------------------------------------------------------

当メルマガで何度かご紹介している「ASC」&「集め太郎」ですが
この度、さらにパワーアップしました!

今まで、ASPのデータを1個1個集計していましたが
今回、なんとASPの並列処理に対応いたしました!

つまり、複数のASPを一度の処理で調べる事に対応したのです!

これにより、今までの処理時間を数分の1に短縮する事に成功しました!


もちろん、無料試用期間が7日間ついてますので、まだ使った事がない人は
ぜひこの機会に使ってみてください!


■「ASC」&「集め太郎」
↓↓↓
http://www.infotop.jp/click.php?aid=4153&iid=39691

-------------------------------------------------------------------

■ 編集後記

-------------------------------------------------------------------

Googleって毎日恐ろしい量のデータを、
数十万台のPCでMapReduceという技術を用いて
並列計算させ、解析しています。

ちなみに、このGoogleのデータ解析の基盤となる
MapReduceは、ごく安価にレンタルできます。

Amazon Elastic MapReduceがそれです。

好きなときに好きなだけ使って、
使った分だけのお金を払えば大丈夫です。

たとえばニューヨーク・タイムズ紙が
過去の記事全部のファイル4TB形式を変換するのに、
たったの24時間しかかからず、
しかもコストはたったの数万円だったとか。

この技術を使って、
Googleに匹敵するようなベンチャーがでてくると面白いですね。


(藤井)

石田のFacebook個人アカウントははこちら!
http://www.facebook.com/academiaj
-------------------------------------------------------------------

■ 弊社スタッフのツイッターアカウント

-------------------------------------------------------------------

ツイッターでも質問・相談を受け付けます!DMも受け付けます。
ただし、複数アカウントに同じ質問を投げるのは機能麻痺につながるので
ご遠慮くださいますようお願いいたします。

テープ起こしのご用命、翻訳のご用命もどうぞ!


http://twitter.com/academiajapan/staff/members


フォローはこちらからが便利です。

スタッフ一同、塾生さんからのフォローをお待ちしております。


**********************************************************************

★【IJK 塾生必読メルマガ】
石田レポート 年収1億!稼ぎの構造
⇒ http://www.mag2.com/m/0000138888.html


★今まで配信したメールマガジンのバックナンバーサイトを用意
いたしましたので、過去のメールマガジンは、こちらよりご覧下さい。

石田塾メールマガジン バックナンバーページ
http://ijk777.net/mmbn/

※アクセス時に認証を求められます。お手数ですが以下のIDと
パスワードをご入力をお願いいたします。

ID:【 ijkmm 】
パスワード:【 mmbn08 】


★本メルマガの著作権は石田塾にあります。文章の引用、メディア(ブログ、
 ウエブサイト、メルマガなど)への掲載を禁じます。


★配信解除につきましては、以下のURLをクリックして下さい。
http://ijk777.net/del.html
メールアドレスを入力して「配信を停止する」ボタンをクリックして下さい。


**********************************************************************


2011年02月01日 第146号発行

アカデミアジャパン株式会社
発行責任者:藤井 俊緒

お問い合わせはこちら→ ask@ijk777.com


ネット広告・マーケティングランキング

前へ

#145 リッチスニペット

次へ

#147 キーワードのトレンドを調べる方法