2014年1月18日土曜日

日本語変換IMEデータ問題、なぜ“衝撃的”事件に?影落とす黒い過去、被害回避法を整理

 2013年末、衝撃的なコンピューター関連事件として報じられたのが「Baidu IME」のデータ送信問題だ。日本語変換をしてくれるソフトウェアが、その変換結果を企業に勝手に送信していた、と報じられた。

 PC向けの「Baidu IME」と、Android向けの「Simeji」が問題のあるツールとして取り上げられたが、これらを提供しているのは中国の検索大手企業Baiduで、「百度(バイドゥ)」という検索エンジンを運営していることで知られ、日本でもインターネットツールを各種提供している。

 今回、「Baidu IME」と「Simeji」が一体何を行っていたのか、何が問題視されたのか、そして被害に遭わないために気をつけるべきことを確認したい。

●入力文字列をサーバに送信

 まず、問題となったのは、当該ツールを使用していたPCおよびスマートフォン(スマホ)で、入力された文字列がすべてサーバに送信されていた、という部分だ。今回話題となった「Baidu IME」と「Simeji」は、文字変換に「クラウド変換」という手法を採用している。これは文字変換に利用する辞書をクラウド上に置くことで、最新の流行語等を迅速に変換できるようにするなど、より「賢い」変換をするためのシステムだ。

 この機能を利用するためには、変換のたびに変換用のサーバに接続する必要がある。当然、その時に入力した文字列は送信される。問題は、その機能を使うつもりがなかった人までもがデータを送信していたという状態と、送信していたデータの内容だ。

●「クラウド変換」は、ほかの入力変換システムでも使われている

 日本語変換にクラウドを利用しようという取り組み自体は、Googleの提供する「Google日本語入力」も、ジャストシステムの「ATOK Passport」も行っている。

「Google日本語入力」の場合、ユーザーの許可が得られれば利用状態の統計データは送信するが、変換するたびにクラウドに接続するわけではない。「ATOK Passport」の場合は、変換するたびにクラウドに接続する方式だが、ユーザーが許可して意図的に有効にしなければならない。また、文字列の変換を行っているだけで入力文字の収集は行っていないとしている。

 各社方式は違うものの、クラウドを活用して文字変換すること自体は、あやしげなものではないということをおわかりいただけるだろう。

0 comments:

コメントを投稿