無縫地帯

スマートスピーカーに搭載される人工知能の音声アシスタントの利用にまつわる不都合な現実

スマートスピーカーに搭載される人工知能の音声アシスタントは結局裏側でAmazon側の担当者が聴いていたとされる問題で、その後詳報が出始めましたが、さすがにどうなのかなと思うところはあります。

米BloombergがAmazonの音声アシスタント機能「Alexa」の実態についてかなりセンセーショナルな記事を公開しました。

Amazon Workers Are Listening to What You Tell Alexa(Bloomberg 19/4/11)

当該記事の日本語翻訳も日本向けサイトにて公開されてはいるのですが、抜粋という体裁で残念ながらほぼ冒頭部分しか日本語で読むことはできません。それでもこの抜粋を読むだけでもかなりいろいろとAlexaの運用には気になる点のあることが理解できると思います。

「Alexa」の録音内容、数千人のアマゾン従業員が聞いている(Bloomberg 19/4/15)

アマゾンがブカレストに置くオフィスで働く2人によると、1日9時間の勤務の間に1人当たり最大1000本の録音を解析するという。
(中略)
時には気にかかる、あるいは犯罪の恐れがあるような音声を聞くこともある。 性的暴行であると思われる状況の音声を聞いたと話す2人の従業員もいる。Bloomberg
あまりにも話題性の高い内容の記事であることから、国内メディア等でも海外報道の紹介記事という形でこの話題が取り上げられていました。

Amazon、「Alexa」の音声記録の一部を従業員が聞いていると認める――Bloomberg報道(ITmedia 19/4/12)

みなさんがアレクサに喋ると、裏方で人力解析されています。(すまほん!! 19/4/11)

裏方の生身の人間が不適切な音声を聞いてしまう場合もありえるのだということに思いを馳せる必要はあるのかもしれません。すまほん!!
アマゾン『Alexa』に盗聴問題。録音した会話を顧客情報と紐付け&面白い内容は従業員で共有とヤバい(ヤフーニュース個人 篠原修司 19/4/14)

アップルやグーグルとアマゾンの録音には大きな違いがありました。アップルとグーグルは匿名化してユーザーの情報がわからないようプライバシーに配慮していますが、アマゾンはアカウント情報と紐付けています。
(中略)
筆者が大きな問題だと感じるのは、「面白い会話は共有している」という従業員の証言です。ヤフーニュース個人 篠原修司
篠原修司さんが指摘されていることは大きな問題だと思われますし、こうした報道が出たことでAmazonにおける運用の改善が望まれるところですが、Bloombergの元記事を読んでさらに気になったのはAlexa音声解析チームの仕事が非常にストレスフルなものであるらしい点です。以下やや長くなりますが原文から引用します。

Sometimes they hear recordings they find upsetting, or possibly criminal. Two of the workers said they picked up what they believe was a sexual assault. When something like that happens, they may share the experience in the internal chat room as a way of relieving stress. Amazon says it has procedures in place for workers to follow when they hear something distressing, but two Romania-based employees said that, after requesting guidance for such cases, they were told it wasn't Amazon's job to interfere.Bloomberg
かいつまんで抄訳・要約すると、時としてAlexaが拾う音声は犯罪行為などそれを聞く者にとって精神的に耐えがたいものがあり、そうした音声に出あった際はチーム員間で慰め合うために情報を共有することがあるということのようです。しかもこうした明らかに犯罪にかかわると想起される音声に出あってもAmazonとしてはユーザーのプライバシーに干渉することを嫌い治安当局などには知らせないままで済ますようでして、これが本当ならこの仕事をすると心が相当病みそうですね…。

で、同様な仕事に従事する作業員は日本でも募集されているという報道がありました。

Alexaの音声を聞いてテキスト化するスタッフ、日本のAmazonも募集中在宅勤務、時給1300円(ITmedia 19/4/15)

アマゾンジャパンに求人について取材したところ、「Amazonの求人内容については、本募集に限らず、記載されている内容以外の詳細は開示していない」とコメントした。ITmedia
Amazonとしてはあまりこのあたりに突っ込んでほしくないという思いは強いのでしょう。しかし、Alexa音声解析の仕事は結果的にどう考えてもエンドユーザーのプライバシーに思い切り踏み込むような形になるわけでして、音声を聞き取る作業員側の精神的な負担を考えるとわずか1300円の時給で実働8時間というのは相当に消耗しそうです。クレーム処理の窓口業務同様、なかなか長続きしないんじゃないでしょうか。

また、音声アシスタントは動作を開始させるきっかけとなる音声コマンドが無ければ音声を拾わないはずなんですが、そういう音声コマンドがなくても誤動作してしまうことがあり、Amazonではそうした誤動作の原因究明をするために誤動作分の音声ファイルはすべて作業員によって聞き取りが行われるルールになっているそうです。ところがBloombergの記事によれば、そういう誤動作案件は多いときで作業員1人あたり1日100件にものぼるそうで、これが他の音声アシスタントに比べて多いのかどうかはよく分かりませんが、かなりの頻度で誤動作が起きているらしいことはうかがえます。

One of the people said the auditors each transcribe as many as 100 recordings a day when Alexa receives no wake command or is triggered by accident.Bloomberg
こうした話を知ってしまうと、やはりスマートスピーカーに搭載された人工知能を謳う音声アシスタントという代物はちょっと使うのを躊躇させられる代物だなと改めて感じるわけですが、世界的なトレンドとしては今後さらに市場拡大が予想されています。

普及が加速するスマートスピーカーは2年以内にタブレットを追い越す勢い(TechCrunch Japan 19/4/16)

こうした予測が必ずしも当たるという保証はありませんが、とくに英語圏や中国では市場で音声アシスタントに人気が集まっているのは確かなようです。で、こうした状況の中でFacebookも遅ればせながら事業参入を考えているという観測もあるようです。

Facebook、アマゾンの「Alexa」に対抗する音声アシスタントを開発中(CNET Japan 19/4/18)

このところユーザーの個人情報ダダ漏れな事件が相次ぐFacebookの提供する音声アシスタントということであれば、Amazonなど太刀打ちできないほどに色々と個人情報をガッツリ収集してくれそうな期待が高まるところですが、さてどうなることでしょうか。

フェイスブック、新規ユーザー150万人のメール情報アップロードか(ロイター 19/4/18)
Facebookがパスワードが漏れたInstagramユーザー数を「数百万人」に訂正(TechCrunch Japan 19/4/19)

思い返せば、消費者金融がかつてサラ金と呼ばれていたころ、おカネを借りに行く人たちが窓口で人間と応対したくないということで、駅前の店舗を中心に「無人貸出機」なるものを設置する業者が増えました。ところが、その「無人貸出機」の向こうでは担当社員が与信業務をしており、応対しているのは機械でも判断するのはあくまで人、という事例がありました。

突き詰めると、インターネットの技術が華やかであったとしても定型的な業務以外は結局しばらくは人間が担当しなければならず、そういうスマートスピーカーが普及して参照される教師データが充分に蓄積されるまではある程度以上人力に依存しなければならないというのも事実なのかもしれません。

同様に、先日東京でも人工知能EXPOが開催されていましたが、そこで出ていた技術はたいして高度でもなく、チャットボットの延長線上でしかないものばかりであったことが思い起こされます。人工知能は意味を理解しない前提でビジネスに組み込むには、いまのところはまだAmazonのように人間が聞いて判断しなければならない、というつまらないオチになるのでしょうか。