NHKスペシャル「コンピューター革命」を見て考えた、思い出したこと雑記（7日未明に再放送あり）

この番組を見ました。思ったことを、あまり推敲せず書き散らします。
再放送が6月7日（木）午前0時50分〜1時39分（6日深夜）に予定されています。
https://twitter.com/#!/toshihiro36　で文字起こしがされています（2012年6月4日付）。後にtogetterになると思われます。

最強×最速の頭脳誕生
http://www.nhk.or.jp/special/detail/2012/0603/index.html
地球上の全７０億人が一斉に取りかかっても数十日間かかる計算をたった１秒で行うという“世界最速”の頭脳・理化学研究所と富士通が開発したスーパーコンピューター「京」と、人間の言葉を聞いて理解し、人気クイズ番組で全米チャンピオンを破った“世界最強”の人工知能・ＩＢＭの「ワトソン」。激烈な競争の末に生まれたこの２つの頭脳は、人間社会を劇的に変貌させる可能性がある。地球温暖化や津波の被害予測、遺伝子創薬など最先端分野での技術開発のスピードを一挙に短縮する「京」。過去の出来事をすべて知識として蓄え、経済危機脱出のシナリオを描いたり、症例から、医師に代わって診断を下すなど、人間を記憶から解放する「ワトソン」。両者が目指すところはひとつ、人間を実験や計算、知識の暗記といった単純作業から解放し、より高度な知的活動に専念させることだが、“知性”と呼ばれてきたものをコンピューターが肩代わりするようになった結果、私たちの社会はどう変わるのだろうか。バラ色の未来か、仕事を奪われる悪夢か。世界各地で進むコンピューター革命の最前線ルポに加え、コンピューターが高度に発達した近未来の東京を舞台にしたアニメも挿入し、変貌の行方を描き出す。

「文系の分野だと思ったら理系の分野だったよシリーズ」

この番組は、自分が長年、折に触れてこのブログで収集してきた興味をピンポイントで衝くものだった。

その自分の興味、というのを、自分で一言で表現することができなかったが･･･
最近、「文系の分野だと思ったら理系の分野だったよシリーズ」という言い方を考えたって話はしたね（笑）。
http://d.hatena.ne.jp/gryphon/20120505/p7

余計なものも混じるが、ここのブログのカテゴリで「IT」もしくは「科学」で検索すると、自分の興味の範囲だった過去記事が読めると思います。

つまりはそういうことであって･･･皮肉の名文句「文系は作者の気持ちでも考えてろよ」（※対になるのが「理系は質量を無視した滑車で遊んでろよ」）だが、やっぱり文系的というべき「クイズ番組」でコンピューターのワトソン君があれだけ人間のクイズ王に圧勝しているのを見ると、このシリーズ名は正しかったと思う。ワトソン君でアレなら、それより上の性能を持つ「ホームズ」が登場したらどうするんだ？？･･･ってネタも以前書いた（笑）。

まったく余計なことに、番組を見ていたらワトソン君には「この答え、自信ないけど･･･」と前置きして、言いよどむ機能までついてたぜ（笑）。プログラマー出て来いや（笑）

文章の出題に対してコンピューターが答える、という仕組みがどういうふうに難しくて、それをどういうふうに解決していったらいったか･･･という話も、一般視聴者にわかるレベルで解説してくれていたこともうれしかった。

そして･･･仮にそういう、文章や話し言葉で質問されたことに、コンピューターが圧倒的に豊富な百科事典のごとき知識を駆使して対応できると。
･･･そして、その機械が量産化され、いろんなところで一般的に使われるようになりました！はい、どんなところに使われるでしょうか？？考えてみよう！！（読者への質問）

自分は
「駅に設置して道案内マシーン」
とか
「書店に設置して『あの侍の･･･かぶけかぶけとか言ってて…馬がでっかい･･･』『花の慶次』ですか？』と探してくれる機械」
なんかを考えていましたが、現実はそれを上回りますね。
患者の言葉、そしてカルテにかかれた症状の文章･･･それをもとに、病名を診断するということを、ワトソンは期待されているそうなのだ。
うーん･･･これは、エビデンスが数年で、はっきり分かりすぎる！！
同じ症例や患者の言葉を聴いて、「ワトソン」が出した症例判断と、一流ドクターの判断と、どっちがより正確だったか？？この勝負は極めて興味深い。
そして一流医師にはかなわなくても、二流医師レベルの判断力だっただけでも御の字だ。それにおそらく一病院に一台！ではなく、オンラインにつないで全国から･･･例えば離島、山奥の診療所からでも･･･ワトソンに相談できるかもしれない。
そういえばホームズ物語でも、ワトソン君は、もともと医者でありました。アフガンの悲惨な野戦病院で鍛えた叩き上げ。
　
番組では、近未来の風景を描いたいかにも今風な絵柄のアニメが挿入されていた（よくあの、カテエ NHKがOK出したな）が、ここではファストフード店の注文とりに、おそらくワトソンが進化したとおぼしきコンピューターが出張っている。そりゃメニューも限定されているし、お店の注文を理解するぐらい朝飯前だろう。メニューに無いカレーラーメンを注文するとか、大阪人が「冷コー（あっちの方言でいうアイスコーヒーのこと）」を注文しても･･･多少のバージョンアップで対応できるはず。

コンピューターは言う『「複雑な問題」も「奥深い謎」も無い。「データが大きい」だけだ』。

いや、こんなことをコンピュータが本当に言うかはしらないぜ（笑）？たぶんこう言うのかなあ、ってだけです。
おれが微分とか積分を喩えに出すと、それがあっているのかどうかそもそもわからないけど（笑）、丸でも曲線の不定形なものでも、それを細かく分割して、四角なり三角なりで埋めていくと、限りなくその面積に、形に近づいていくよね？
それと同じように、文学的な言い回しや形容詞を駆使した人間の文章、あるいは文系の文章も、ばらばらにしていけば、計算可能になっていく。
（番組内のアニメでは、女の子がそういう文学的な文章を、コンピューターが理解しやすい文章に変換するバイトをしていた）。
ならば、あらゆる種類の問題も、結局方向性は決まっていて、あとは膨大なパターンの蓄積を、どんどん解いていけばいい、ということになりそうだなあ･･･と。
このブログを始めたころは
「コンピューターが将棋で人間の名人に勝つ？ははは、あと50年のうちに出来ればいいねえ」だったような。さすがに目処はついていたかな？
囲碁の牙城だって、もう方向性は決まっているような気がします。このままあとは、時間の経過を待つだけかと･･･（コンピューター開発者の苦労はまったく無視）。

だからそれが、いわゆる「ビッグデータ」ってやつなのかなと。

〜NHK「クローズアップ現代」、ビッグデータの回から。

■クローズアップ現代「社会を変える“ビッグデータ”革命」書き起こし・ほぼ完全版　#nhk
http://togetter.com/li/311794
人類はまさに情報爆発「ビッグデータ」の時代に突入したといわれています。加えてそうしたデータを高速に分析できるシステムを、安く誰もが手に入れられるようになったことで、これまで十分に活用してこなかったビッグデータを企業や自治体がいま積極的に利用しようとしています。

ここで山田正紀のコンゲーム小説を思い出す（題名忘れた）。
ラスベガスで、主人公のコンゲーム集団は「一度イカサマをやったように見せかけ、しかもそれがバレないといけない」という事情があった。そこで選んだのが、ベルトに組み込んだ記憶装置だった。ギャンブルの種目はブラックジャックだったかな。
そこでこういう解説がつく。
「ブラックジャック（だったと思う）は必勝法が存在するギャンブルである。ゲームで使われたカードをすべて覚えていれば勝てるのだ」と。
もちろんこれは、「人間、そんなに記憶力がいいわけじゃないから（機械など無い限り）不可能です」という意味ですね。またこれも以前書いた。歴史的なことわざ「都市の空気は自由にする」というのは、制度的な意味もいろいろあるけど、それと同時に「都市には人が膨大に集まりすぎ、そこでは個々人の動きを誰も把握できない」という物理的な意味もあったはず。
　
しかし「ビッグデータ」が存在し、ビッグデータを瞬時に処理できる計算装置があるなら、そりゃ社会の仕組みが変わらないわけがない。変わらないほうがおかしい。

･･･と書いたところで、ほぼ同じことを以前書いたことを思い出した。

■「都市の人ごみ、雑踏や店の来客の中から、一人を簡単に発見できる社会」とは
http://d.hatena.ne.jp/gryphon/20090611/p5

こういうミスだって、ビッグデータがあれば避けられるのに。ブログで同じ内容を書こうとすると、イルカのアイコンあたりが出てきて「同じこと３年前に書いてます！」とか教えてくれるの（笑）。

防犯カメラ、2012年現在はこう進化？している

そして、上の記事のような話、現状では当然ながらさらに進んだ。
昨日、2012年6月3日付の朝日新聞。

http://www.asahi.com/national/intro_m2/TKY201206020520.html#
■防犯カメラ止まらぬ進化　１人／３６００万人、特定１秒
　
　目に見えて増えている駅の防犯カメラ。東京メトロ副都心線の渋谷駅で起きた男性刺傷事件でも、複数の駅での映像が逮捕への有力な手がかりになった。開発の最前線では、足跡を瞬時にたどる研究が進む一方で、知らぬ間に「監視」が広がる現状を懸念する声もある。
　日立製作所の子会社「日立国際電気」（東京都）では、防犯カメラに映った人の顔を解析し、サーバーに蓄積された他の映像と照合、合致する人物を選ぶシステムを開発している。
　表情がはっきりしない映像でも、目や鼻の位置、輪郭から識別し、異なる場所、時刻に記録された数万の映像から、瞬時に十数枚に絞り込めるという。１秒間で最大３６００万人分のデータが検索可能だ。カメラを網の目に設置してサーバーと回線でつなげば、対象者がいつ、どこで何をしていたかがわかる。
　横顔や、暗がりなどの場合は精度が落ちるが、実用化に向けた最終段階だという。同社映像・通信事業部の新保直之・副技師長は「利用目的で必要な精度は違うが、犯罪捜査ではより高い精度が求められる」と･･･（後略）

防犯カメラの人物を検索すると、瞬時に似た人物が映った画像が画面上に並んだ＝２５日午前１０時５９分、東京都小平市の日立国際電気、北林晃治撮影

これは当然、個人的には警戒心も嫌悪感もあるが、犯罪捜査の一方で「冤罪」を「減らす」効果もあるんじゃないか、とは思う。その兼ね合い、バランスはどうするか。

「疫学の時代」きたる？

もういちど、togetterのほうに戻ろう。
http://togetter.com/li/311794

<ナレーション>　東京都内の“リアルタイム人口マップ”です。地域ごとの人口が刻々と変わる様子がくわしくわかります。マップの元になったのが、携帯電話やスマートホンが発信する利用者の居場所の情報です。.
　<ナレーション>　ＮＴＴドコモではおよそ６０００万回線の携帯電話などが生み出すビッグデータを、別の用途に活用しようと考えました。例えば大規模な地震が東京で起きた場合、帰宅困難になる人は午後３時頃が最も多く４２５万人にもなることがわかりました。

うむ、そらそうだ。携帯電話所有し、持ち歩いている者は基本的にNTTやソフトバンクが、居場所を把握できる（個別の個々人を、という意味ではないが）。その膨大なデータ量を瞬時に分析できる計算能力があれば、東京のかなりの「リアルタイムな人口の移動」を把握できる！。それを災害人の救援や帰宅難民対策に利用できる！！
凄くいいことだと思うが、感じるこの不気味さはなんだろう。

そして。

<ナレーション>　･･･多くの車に搭載されたカーナビ、走行データを細かく記録しています。全国の１００万台の車の走行データをまとめた地図です。合わせると１日で地球７００周分にもなります。.<ナレーション>　このデータに注目したのが埼玉県の道路政策課です。県では年間３万７千件にのぼる人身事故を、防ぐことができないかと考えていました。カーナビのデータを細かく分析していくと、車のスピードが急に落ちている場所･･･（略）ドライバーが危険を感じて急ブレーキを踏んだのではないか。速度が急に落ちた車をすべて抽出し、矢印にして県道マップと重ねます。１年間で急ブレーキは５０万回も起きていました。.
（略）･･･ひと月に５回以上急ブレーキがあった特に危険な場所を特定、合わせて１６０か所の交通事故予測マップが（略）･･･安全対策を進めた結果、人身事故を前の年度より２割減らすことができました。.
埼玉県道路政策課・小沢：「データがなければ、どこに対策をしたらいいかわからないわけで。データがあるからこそ、どこに危険性があるということがわかってきますので」･･･

膨大なデータをコンピューターで集め、分析し、５回以上の急ブレーキがあったところを重点的に対策する。事故が減る。
これを「不気味だ」「ビッグブラザーだ」と言って否定する勇気は自分にはない。いや…「ビッグブラザーではない」と言っているのではない、もっと絶望的なことに「良きビッグブラザーもいる」と認めざるを得ないのではないか？ということなのだ。

これを「疫学の時代」というのはやや語弊があるが、この際そのへんは無視してしまう。
つまり「理由？理論？そんなの後から貨車でついてくるよ！麦飯食わせてれば脚気にならないんだから、麦飯食わせろ！」的な理論、政策のことね。
http://d.hatena.ne.jp/gryphon/20100224/p5
で詳しく紹介しているけど、
id:shinichiroinabaこと稲葉振一郎氏の著書の通り、

社会学入門〈多元化する時代〉をどう捉えるか (NHKブックス)

作者: 稲葉振一郎
出版社/メーカー: NHK出版
発売日: 2009/06/26
メディア: 単行本（ソフトカバー）
購入: 18人クリック: 224回
この商品を含むブログ (121件) を見る

『数字が連動しているだけでは、そのうちのどれが原因でどれが結果に当たるのかは分からない…どちらが原因で、どちらが結果なのか？あるいは…第三の要因があって･･･（略）･･･特別何の関係もないのかもしれない（略）。因果関係を統計数字だけから直接発見する方法はありません。因果関係はわれわれが考えて、推測するしかない』

のだと思う、本来は。
しかし、ビッグデータ時代、この「因果関係」の証明までいたらなくても、擬似相関のあるところを手当たり次第見つけて、対策を施していくと、因果の有無を追及するより早く、安く物事が解決するんとちゃうか？と。
そんな時代になったんじゃないか？というのが、ビッグデータの感想のひとつです。

脳波の話は、別のエントリにします

ここは省略。

個人の日々の膨大なデータ、言動や選択をすべて詳細に記録する。何十年ぶんか溜まったものを分析すれば、死後もその「人格」はアバターとして残る

いや番組でそう言ってたんだよ、ほんとに。
うーん、たしかに「人格」とは外に出た言動、行動によってわかるものであるから･･･よくテレビ番組を見るたびに「ナンシー関が生きていればどう評しただろう？」と思うのだが、仮に彼女の「ビッグデータ」（見た目のことじゃないぞ）が残り、それを分析できていたら、ナンシー関のアバターが今のテレビ評を書き継いでいたのだろうか。
てか、あらゆる行動データを完全に記録するって怖いわ。もしだれかが慢性の下痢もちで、その下痢が人格形成や言動に大きな意味を持つとしたら、１日トイレに12回行ったという記録をビッグデータは保持しないといけないのか？？

そんなときに思い出した星新一の「ビッグデータ」を描いた？ショートショート。

（※オチばらし注意。自己責任でおねがいします）

なぜかこの世に、死んだ人たちがよみがえってくる。それも１日１日と、新しい日付で亡くなった人から順々に。人々は思わぬ再開に喜んだり驚いたり。食料も１日ごとになぜか元に戻るので、人口増も問題なさそうだ。
そして･･･しばらくすると、人々は退屈さにまぎれて「あの時の事件の真相はどうだったんだ？」ということを家庭内の小さな事件でも、国を揺るがす大事件でも検証し始める。なにしろ時間はたっぷりとあり、証人は一人残らず次々と生き返る（笑）。謎とされた事件でも、そんな討論と証言を経て徐々に輪郭がわかってくる。

ある男女が会話する。
「こんな大騒ぎがあと何年続くんだろう？」
「約2000年ね」
「なんでわかるの？」
「全人類のこれまでの善悪と罪状がわかった時点で、あの人が戻ってくるのよ。イエス＝キリスト･･･」

ビッグデータで、これまでわからなかったことがわかる、膨大な記録が生まれてそれを検証して正確な結論が出る･･･ということで、これを思い出しました（笑）。

ただ、星新一のどの短編集に収録されているかはわからない。

山形浩生（ id:wlj-Friday ）の翻訳書によると、すでに「ワインの品質（価格）」は専門家の舌で評価するのと、とある一定の数式にデータの数字を挿入した評価では後者がすぐれている、とか。

その数学が戦略を決める (文春文庫)

作者: イアンエアーズ,Ian Ayres,山形浩生
出版社/メーカー: 文藝春秋
発売日: 2010/06/10
メディア: 文庫
購入: 34人クリック: 303回
この商品を含むブログ (76件) を見る

http://dain.cocolog-nifty.com/myblog/2008/01/post_9513.html

これまではその品質を決めるのに樽に詰めてから何年も待たなければいけなかったボルドーのワインについて、ある経済学者が数十年におよぶ膨大な気象データと実際のワインの値段とを分析することにより、今年とれたぶどうが10年後に熟成されたワインになったときの値段がいくらになるのかを、ぶどうを収穫した時点で予測する数式を編みだした。
実際それはその後何年にもおよぶ検証の結果、それまで専門家が数ヵ月後に試飲することにより予測していた値段とくらべて、はるかに正確･･･

http://okanejuku.blog92.fc2.com/blog-entry-281.html

ワインの質＝（12.145＋0.00117×冬の降雨＋0.0614×育成期平均気温−0.00386×収穫期降雨）
経済学者オーリー・アッシェンフェルターは、どの年でも気象情報をこの方程式に入れれば、ワインのヴィンテージのおおまかな品質を予測できると発表
（略）…ワイン商人やワインライターたちは、オーリーが提供する情報を一般人に知ってほしくない。ワイン商人も評論家たちも、ワインの品質に関する独占情報を維持する方が自分の得になる。商人たちは、当初のランキングを常につり上げておくことで、価格の安定･･･

著者本人の補足説明がここにある。
http://cruel.org/books/supercruncherrata.html

通常、この手のモデルを作るときは、もっともらしい変数をいろいろ選んでみて、いちばん統計的にうまくあてはまっているものを選ぶ、というプロセスを経ます。で、なぜその変数がうまくあてはまるのか、というのは、後付であれこれ理屈はこねますが、通常は「とにかく統計的にうまく出たんだもーん」という以上のものはありません