無縫地帯

Googleが特定単語にまつわる検索を検閲しているのではという疑惑の件

6月10日ごろ、googleの検索結果に性的に相応しくないワードの検索結果が大幅に削られ、検閲されているのではないかという話が日本のネット界で駆け巡りました。結果的にはただの揺らぎだったようですが…。

山本一郎です。妙な人ではありません。

先日来、何やらGoogleの検索に関して妙な騒ぎが起きておりました。

Google検索で「ロリ」がブロック?「特定ワードの検閲はしない」とGoogle(ITmedia 2014/6/10)
グーグル検索「ロリ・エロ八分」発動か漫画同人サイトも排除、ネットで騒ぎに(J-CASTニュース 2014/6/9)

Google検索で、「ロリ」に性的なワードを加えて検索した際、性的なサイトや画像がほとんど表示されなくなったとネットユーザーの間で話題になっている。ITmedia
当初「『ロリ』に性的なワードを加えて検索」というのがどういう行為なのかピンとこないため何事が起きているのかすぐには分からなかったのですが、ネット民の反応を調べてみると「ロリ巨乳で検索したらたったの9件」という発言があったので、ああなるほどということで実際に検索してみました。

ああ、これも原稿を書いて皆様に私の感じたフィーリングを伝えるためのものですから仕方がありません。辛いです。

で、「ロリ巨乳」の検索結果は、この騒ぎが勃発した時点で「約7件(0.09秒)」のヒット。実際の検索結果リストには合計10件が計上され、うち2件は関連ヒット(「ロリ巨乳」そのものの単語はないが、「ロリ」と「巨乳」という独立した言葉が含まれたページ)という案配です。ついでなのでGoogle.comでも同じ条件で検索したところ同じ結果が帰ってきました。

続いてBingを使って同じ「ロリ巨乳」で検索してみたところ「24,500,000 件の検索結果」となりました。検索結果リストもロリ巨乳がずらっと並び壮観であります。いや、これはあくまで原稿を書くために検索したのであって、日常的にこういう方面を見て愉しんでいるわけではないことは、読者の皆さまであれば分かっていただけることでしょう。辛いなあ。実に辛い。

というわけで、これは明らかにGoogleの検索結果に現時点では何らかの影響が出ていたと考えていいのではないでしょうか。

ITmediaではGoogle日本法人に問い合わせをしているようですが、微妙に含みのある回答があったようです。

Google日本法人の広報担当者は、「特定のキーワードについてはコメントできない。あくまで一般論」と前置きした上で、「基本的に、何らかのアダルトのコンテンツを検閲することはない。この規模のサービスでは、特定ワードの検閲などはそもそも不可能だ」と話す。

その上で、「いろいろな解釈ができるあいまいなキーワードについては、露骨な性的コンテンツは優先的には表示せず、露骨でないものを優先する」仕組みになっているという。あいまいなワードではなく、個別具体的なワードで検索すれば、求める結果が得やすいとしている。ITmedia
いやはやなんとも優秀な官僚や政治家のような物言いですね。さすがです。

J-CASTの記事では以下のような憶測が記されています。

13年11月、エリック・シュミット会長は英デイリーメール紙に、アルゴリズム変更による「児童ポルノ」対策強化について寄稿をしており、英語以外の150カ国語にも反映させていくと述べていた。真偽は不明だがこれが5月下旬に実施した検索アルゴリズムの更新「パンダアップデート 4.0」と関係あるのでは、という意見も出ている。J-CASTニュース
しかし、こうした見方に対してもITmediaの問い合わせでは否定されています。

「パンダアップデート 4.0」で、児童ポルノ関連のキーワードの規制が強くなったのではと見る向きもあるが、「児童ポルノは即削除され、検索結果に表示されないようしており、もっと厳しく対処している」ため、それも当たらないとしている。ITmedia
まあ、Googleの検索アルゴリズムも完璧ではありませんで、過去にもちょっと似たような風味の事件がありました。

「初音ミク」画像がネットから“消えた”?(ITmedia 2007/10/18)
「意図的削除はしていない」が……謎深まる“消えた初音ミク”問題(ITmedia 2007/10/22)
「初音ミク」画像、Googleに復帰(ITmedia 2007/10/23)

残念ながらGoogleは上記事件の原因を正式には公表していないようですが、明らかに検索アルゴリズムにおいて何らかの不具合が発生していたのだろうと考えるしかありません。もしかしたら、今回の「ロリ」にまつわる検索結果についても同じようなトラブルが生じている可能性はあります。

その後、約10日に渡って問題になりそうなワードのヒット件数を調べておったわけなんですけれども、問題となっていた「ロリ巨乳」などのワードについては6月14日日本時間午前3時ごろを境に急回復。いまでは約1,160万件が出てくる状態になっております。実にけしからん画像もたくさん出てきますので、google様に迂闊な検索ワードを食わせて汚染されたくない方は絶対にしないでくださいね。

悔しいので、ネット界の検索アイドル百度(baidu)ちゃんでも検索してみたのですが、いま現在570万件がヒットする状態です。他の有益な検索ワードではgoogle様の一桁二桁下の精度しか出ない百度ちゃんにもかかわらず、こういう切ないキーワードではしっかり半分ぐらいまでキャッチアップしているあたりがさすが中華ですね。良く分かりませんが。

はたして検閲なのか単なる不具合なのか、その理由はGoogleの中の人のみが知ることであり今後もこうした事態がなぜ起きてしまったのか、その詳細は藪の中ということになりそうです。翻って、ネット検索は決して万能でも完璧でもないということが体験できる貴重な機会と考えると面白いのかもしれません。

しかし、なぜこんなことを調べているんだ私は。妙な人ではないのに。