検索エンジンはユーザーの疑問にどう回答を導き出しているのか?Googleを例に解説します
GoogleやYahoo!、Bing、DuckDuckGoのような検索エンジンの存在意義は、ユーザーの疑問に適切な回答を出すことです。ユーザーの疑問は、時には一言で回答できるような単純なものだったりしますし、別の時には長い説明が必要な複雑な質問だったりします。
このような様々なユーザーの質問に対して、検索エンジン側はどのようにして適切な回答を検索結果画面に表示させるのでしょうか?僕と同じようにそんな疑問をあなたも持っていたら、このまま記事をお読みください…
このトピックにガチで回答しようとするならば、おそらく僕の手に負えない壮大な話になるでしょう。でも、この話をブログ1記事にまとめられるくらいにしたいので、Googleを例にとって、ところどころで話を単純化して進めていきますね。
まず前提として、Googleのアルゴリズムでも重要な位置をしめるRankBrainをないものとして考えます。
目次
Googleはどのようにユーザーの求めているものを把握するのか?
さて、ユーザーが検索ボックスに情報を入力し、検索をかけました。検索エンジン側が最初にやらなければいけないことは、ユーザーがどんな情報を求めているのかを正確に判断することです。このためのステップとして、ユーザーの検索意図を5W1H、つまりwho、what、where、when、why、そしてhowの6つに分類することから始めます。
この5W1Hへの分類は、検索語にこれらの単語が含まれない場合でも行われます。例えば、Googleに2つの検索ワード「日本 総理大臣 誰」と「日本 総理大臣」を入力して検索をかけると…
どちらの場合も一発回答で「安倍晋三」が出てきました。でも、なぜGoogleは5W1Hの情報がない中で僕が「安倍晋三」を求めていることがわかったのでしょう?さらに言えば、日本の歴代の総理大臣が何人もいる中で、なぜGoogleは「安倍晋三」を選んだのでしょう?これには、いくつかの仕組みがあるのです。
複数の検索結果を作成して比較(Cannonical Queries)
ユーザーが入力した検索語の中に明らかな検索意図を見出せなかった場合、あるいはいくつもの解釈ができる場合には、GoogleはCannonical Queriesと呼ばれるものを作成します。
例えば、上の例そのままで「日本 総理大臣」が検索された時、Googleはどんな回答を出せばいいのでしょう?もしかしたら、ユーザーは「安倍晋三」ではなくて、総理大臣の仕事内容を求めているのかもしれませんし、総理大臣の任期、あるいは総理大臣になる方法を求めているのかもしれません。人間であれば文脈でユーザーの意図をある程度推測できますが、機械であるGoogleにはそんな芸当はできません。
ではどうするか?というと、ユーザーの疑問として可能性のあるすべてのクエリに対して回答を出します。つまり…
- 日本の総理大臣は誰? → 回答1
- 日本の総理大臣の仕事内容は何? → 回答2
- 日本の総理大臣の任期は何年? → 回答3
- 日本の総理大臣にはどうすればなれるの? → 回答4
こうして導き出した全種類の回答を比較して、その中から最もユーザーの疑問に近いと思われる回答を選んで表示するのです。もしGoogleの出した一発回答にユーザーが満足すれば、そこで検索を終えてブラウザを閉じたり、別のページに移ったりするでしょう。回答に満足しなければ、さらに検索ボックスに情報を追加して再検索するはずです。こうしたユーザーの反応を見て、Googleの下した判断が正しかったかどうかが判定され、次の検索に生かされるというわけです。
Neural Matching
Neural MatchingとはGoogleの人工知能(AI)を使ったプロセスで、これが導入されてから検索エンジンにも同義語が理解できるようになりました。日本人なら「バイク」と「単車」は同じ意味だと理解できますが、機械にとっては本来まったく別の独立した単語です。この2つが同じ意味を持つことをGoogleが理解できるようになってから、ユーザーの検索に対してGoogleが一発回答を出す確率がぐっと上がりました。
例えば、Googleの検索ボックスに「マック」と入力して検索にかけます。出てきた結果はこんな感じです…
これって、Googleが「マック=マクドナルド」であることを認識していないと出せない結果ですよね。GoogleのAIシステムは、特に検索キーワードにヒントが含まれていなくても、非常に高度なレベルで同義語を探し出して最適の回答を出せるまでに進化しているのです。
ちなみにこの「マック」が意味するものは「マクドナルド」だけではありませんよね。Apple社のパソコン「Mac」かもしれませんし、コスメ店のMACかもしれません。これは今まで「マック」で検索した人の多くが「マクドナルド」に行き着いたためそうなっているだけで、今後「マック→Apple」の流れが多くなれば「マック」で検索した時にApple社のホームページが検索トップに来ることになるかもしれません。
検索結果のテンプレートを作成
Googleは過去のユーザーの検索に対して、返した検索結果のテンプレートを作成しています。こうすることで、次に別のユーザーが似たような検索をかけたときに、同じテンプレートを使って作業スピードを上げつつ、よりユーザーの検索意図に近い回答を出せるようにしています。
GoogleのアルゴリズムやAIが発達していく中で、いつの日からか「日本 総理大臣」で検索されたときの回答と、その回答に対するユーザーの反応をGoogleは把握できるようになりました。それ以降のデータを収集していく中で、このタイプの検索には最新の総理大臣の名前を返すのが一番いいと、Googleの中で判断しているのでしょう。
これらの仕組みの組み合わせで、Googleはユーザーが必要としている回答を正確に導き出そうとしています。ユーザーの要求しているものが理解できれば、あとはそれに対する回答を出すだけです。
関連記事:BERTとは何か?Googleの新アルゴリズムアップデートへのSEO対策は…
大堀 僚介(Ohori Ryosuke)
AWAI認定コピーライター
SEO contents institute認定コピーライター
何事も“超一流の専門家から学ぶ”をポリシーとしており、コピーライティング業界で世界最高の権威である全米コピーライター協会(AWAI)でライティングの基礎を習得後、SEOコピーライティングのパイオニアHeather-Lloyd Martin、コンテンツマーケティングの世界的第一人者Brian ClarkにWebコピーライティングを学ぶ。
さらにAWAIでビジネス用Webサイト作成スキルを習得、知識ゼロの状態から自社サイトSuper Clear Contentsを立ち上げる。その経験とインターネット業界の動向をふまえて、個人事業主や副業サラリーマンに向けて最新のビジネス用Webサイト構築方法を提供している。
コメントを残す