INVISIBLE Dojo. ーQUIET & COLORFUL PLACE-

John 8:32 Then you will know the truth, and the truth will set you free."  複数ブログの過去記事を移管し、管理の委託を受けています/※場合により、語る対象の「ネタバレ」も在ります。ご了承ください 

「ビッグデータ」に、できること。夢想と空想と、現状。

まず、現状から。

YAHOOが自己総括する「選挙と検索結果の相関」

http://mainichi.jp/opinion/news/20130904ddm003070153000c.html
日本における検索エンジン最大手のヤフージャパン。同社がネット解析で行った7月参院選議席予測が大当たりした、という話の真偽を見極めん、と取材に訪れた。

 応対してくれたのは、安宅和人(あたかかずと)執行役員・事業戦略統括本部長(45)。ネットで消費者動向を読み込むマーケティング調査…手法が選挙にも通用するか。ひょんな社内議論から……やってみようということになった。「一般にネット上の話題と、リアル(現実)とは、あまり重なりがない。投票動向も同じかなと思ったが、想定を超えた結果、つまり、完全に近い相関関係があったのです」
(略)
ヤフーだけで利用データは月に500億件。その膨大なデータを処理した結果、得票結果の高い党(候補)ほど、ネット上で検索されたり、バズ(騒音、転じて書き込み)されているデータ量が多い……ほぼ比例関係の直線グラフ。「嫌になるくらいきれいなデータでした」
(略)
安宅チームは、この相関モデルと、もう一つ、公示日前後のその党(候補)に対する検索量の増加率に着目した投影モデル……参院選に臨んだ。その結果、投開票日2日前に発表した予測は、121議席中、相関モデルで105(87%)、投影モデルで111(92%)を的中……

初挑戦としてはまずまず…新聞各社が…世論調査を基に手間ひまかけて予測…「2、3人のチームの余力による1週間仕事。費用? タダです」…ネット世論とリアル世論は接近しつつあるのか…「ネットとリアルが近いのは意外だったか?」との問いには、「そうであってほしいと願っていた。ほっとしています」

ニコニコ動画がやっていたのは知っていたけど、ヤフーは個人的にあまりなじみがないんだよな。だから知らなかった。結局、つぶやかれた回数が多い候補者が当選する、投開票直前につぶやかれる率が上昇した候補が当選すると。
簡単すぎておもしろくないけど、それで正の相関があったら仕方ないな(笑)。
山本太郎の当選をはずしたのは

党名検索でモデル化したため東京、岩手、沖縄の無所属、諸派候補(いずれも当選)をはずすなど、初歩的なミスもあった

という事情がある、としている。


さらにふと思ったんだが、
もういまさらに技術的にもデファクトスタンダード的にも追いつけない、だろうけど、検索サイトを運営するとこんなに素敵なおまけが多数つく。
会社に余裕がある大企業は、球団を持つような感覚で、採算を度外視してでも、ネット黎明期に検索サイトを運営すべきだったね。そのデータをマーケティングに使うことを、単独収益とは別の価値として考えればよかった。
ただ、もしそれにいち早く旧来の大企業が気づき、検索サイトがすべて旧体制の資本系列であったら、世の中つまらなかったろうな。世の中の歴史はやっぱり、偶然と必然が入り組んでいる。
 
【追記】世論調査の専門家、菅原琢氏(東京大学先端科学技術研究センター准教授)が論評した。
この記事への感想を直接ねだるという、ちょっとあつかましいことをして得た知見なので、広くお伝えしたい。

https://twitter.com/sugawarataku

https://twitter.com/sugawarataku/status/375382577965584384
SUGAWARA, Taku ‏@sugawarataku
@gryphonjapan よく使う喩えですが、有名な日本のマラソン選手と無名の市民ランナーのタイムと知名度(検索数)は大変良く相関すると思います。ついでに言うとヤフーの「予想」は、特に選挙区に関してあまり当たっていないです。

板村健 「医療とビッグデータ

http://mainichi.jp/feature/news/20130822ddm013070024000c.html
NICUは、最近話題の「ビッグデータ」処理技術をすぐにも生かしたい現場でもある。心電図、呼吸、神経機能、血中酸素濃度などの生理データから、各医用機器のデータまで、NICUの新生児は毎秒1200以上の極めて多量なデータの発生源となっている
(略)
特に期待されているのが、感染症の兆候を素早くつかむこと。感染症は1時間でも早く発見できれば、病状は軽くて済み、NICUの滞在日数も減り、社会全体の医療コストも減る
(略)
オンタリオ工科大のキャロライン・マクグレーガー教授は、ビジネス用解析ソフトで名を成した後、未熟児の女の子を出産し亡くした経験から、医療情報処理の研究に転身したという経歴の持ち主だ。NICUで発生する大量データのパターンの中から、さまざまな疾病の早期発見と予防の研究を「ビッグデータ」という言葉が知られていない時代から進めて……09年からはトロント小児病院のNICUと協力して臨床試験までこぎつけて…


少し前、「クイズ」で人間のチャンピオンに圧倒したIBMのソフト、その名も「ワトソン」、という話があったでしょ。あのワトソンの機能を応用すれば、病名診断にいいんじゃないか、という話があったよね。
http://d.hatena.ne.jp/gryphon/20130423/p2

そりゃそうだ。テレビの人気番組「ドクターZ」にあるように
・「おなかのこのへんが痛い」
・「押すと特に・・・な感じの痛み」
・「発熱も伴う」

などの手がかりを、これまでも「前例と経験」という”ビッグデータ”で処理していたわけであり、それは同番組のように「クイズ」と限りなく近似している。ワトソンが、病名診断に活躍するというのは決して絵空事ではない。
NICUのデータをどこかに集積し、とくに蔓延すると大問題になる「感染症」拡大の予兆をつかむ…ってのはありそうではないか。

防犯カメラをつかった事件捜査、黎明期と現在。16年の歴史があるという。

「カメラ捜査 最前線」 という記事が毎日新聞の大型企画(1面まるごと使う)「Sストーリー」の2013年8月25日に掲載された。

毎日スポニチTAP-i ‏@mainichi_tap_i 8月25日
【8月25日号】日曜連載「ストーリー」は「ホシは見上げて追え カメラ捜査 最前線」です。毎日jp非公開の記事をPCでお読みいただけます(中央下の右△で進む http://goo.gl/QIvI8V )。次に担当記者が紹介します。 pic.twitter.com/Js4UWOvYxU

毎日スポニチTAP-i ‏@mainichi_tap_i 8月25日
犯罪捜査の新たな主役になろうとしている防犯カメラ。その先端のノウハウを有する警視庁捜査支援分析センターに密着しました。16年前に民間から転職した一人の警察官が、試行錯誤しながら技術を確立していく姿を軸に、捜査の実相を描きながら、その問題点も指摘しました(社会部 喜浦遊、松本惇)
 
毎日スポニチTAP-i ‏@mainichi_tap_i 8月26日
【8月26日号】月曜連載「ブロガーリレー」は小林啓倫さん。人のさまざまな行動が数値化される時代が近づいていることを書いています http://goo.gl/FThX1e (PCでクリック、中央下の右△でページを進めてください) pic.twitter.com/AuY0omdHxE

刑務所の受刑者、拘置所の容疑者…その「急死」(自殺)を防ぐ、電子的な腕輪ってできないか?

米3女性監禁のカストロ受刑者、独房で死亡 自殺か 
http://www.afpbb.com/article/disaster-accidents-crime/crime/2966172/11287914
@afpbbcomさんから


女性3人を誘拐・監禁し、約10年間にわたり強姦(ごうかん)などを繰り返したとして先月に終身刑が言い渡されたアリエル・カストロ(Ariel Castro)受刑者(53)が3日夜、刑務所内で死亡しているのが発見された。オハイオ州更生当局は自殺とみている。

 複数のメディアがオハイオ州更生当局の声明を引用して伝えたところによると、カストロ受刑者は首を吊っている状態で発見され…

日本では、兵庫県尼崎市の連続変死事件の最重要容疑者が拘置所で自殺した。
http://www.j-cast.com/tv/2012/12/13157977.html?p=all


どこまでできるかわからないけど…脈拍とか血圧とか呼吸とかを24時間チェックする腕輪とか足輪とかを重要な受刑者・拘置者にははめさせる、ってのはだめだろうか。もちろんはずしたら分かる。そういうところでの自殺は人目を盗んで、やや無理のあるやり方でするのだから、苦しんで呼吸や血圧が乱れる場面は長いと思うんですよ。
輪ゴムで自殺する、なんて例もある。

http://sankei.jp.msn.com/affairs/news/130510/crm13051023340015-n1.htm
東京拘置所葛飾区)は10日、40代の男性受刑者が輪ゴムを首にきつく巻いて死亡していた、と発表した。拘置所は自殺とみている。

 拘置所によると、9日午後8時20分ごろ、独房で横になっていた男性受刑者が呼吸をしていない様子… 輪ゴムは刑務作業で作った紙袋をまとめるためのもの。同じ職員が約10分前に巡回した際は、布団の上で横になり、いびきをかいていた

そこで24時間機械が監視して、異常があればすぐ駆けつける…とやれば、多くの事例は防げたような気がするのですが。もちろん、人権の問題があるから一般社会ではそうもいかないが、刑務所という事情ならね。これはふつうの急病などにも対処が早くなるわけで…すると福祉施設とかでもあり得るかな?

プールや海で「人がおぼれてるんとちゃう?」を見張る、防犯カメラと連動したソフトとか作れないかな?

おぼれる、というのはこんなにおそろしいのだって。

■本当におぼれている人はおぼれているようには見えない、静かに沈んでいく人に気付くためのポイント
http://gigazine.net/news/20100910_what_drowning_looks_like/

■ほとんどの場合、おぼれている人にとって声を上げて助けを求めることは生理学的に不可能です。呼吸器系の第一の目的は呼吸することであって、声を出すことはあくまで副次的な機能。呼吸することができて初めて声を出す余裕ができます。

■おぼれている人の口は水面の下へ沈み上へ出ることを繰り返します。口が水面の上へ出ている時間は息を吸って吐いて助けを呼ぶことができるほど長くなく、水面より上に口が出た時には、また水面下に沈む前に急いで息を吸い込むのが精いっぱいです。

■おぼれている人は手を振って助けを求めることはできません。本能的に腕を横に伸ばし、水面を下に押すことによって頭を水面上に押し上げようとします。

プロの監視員なら見分けて救出できるか?
しかし…

http://pool.her.jp/hou-koutai.html
監視業務と集中力
 人が物事に集中出来る持続時間については諸説あります。
 一つの例としては、
 ・完全に集中できる時間は、10分〜15分程度。
 ・集中できる時間は、30分程度。
 ・ある程度集中できる時間は、50分程度。
 監視という単一業務に対して、その業務を何の変化もなしに継続することは、監視員の集中力の低下により事故等の異常発見の見落としに繋がります。

・交代勤務の必要性
 集中力を求める業務では心身ともの変化を与えることで、気持ちを切り替えることができます。
 心身を休めるためには、休憩をとることが最も望ましい方法です。
 しかし、頻繁に休憩を取ることは監視業務に当る人員を割くこととなり、どこのプールでも実施が難しいのが実情です。

その人がまじめかスーダラか、プロかアマちゃんかはさておき、これがもし機械化できるるなら「人間より機械がむいている」という範疇のものではないか。
人の歩き方などを分析して、個人を識別することもできる現在のカメラの進化。それがプライバシーに与える問題は別に考えるとして、それを応用して、専門家の実例を参考にして、「プールでこんな状態、こんな動きの人は、おぼれかけを疑うに足る」というのをカメラの画像からソフトが自動的にチェックする、ってのは無理でしょうか。最終的な警戒は、人間の監視員に任せてもいいわけで、その「下請け」的な役目と言うか。

よく主催者発表の人数が正確か、と話題になるデモや集会の参加者を、携帯電話の数から正確に割り出せないか?

これは数年前にすでに書いています。

デモ等の人数…「携帯電話データ」使えば既に確定可能では?(推論)
http://d.hatena.ne.jp/gryphon/20120704/p3

これが可能なんじゃないかな?と推論するゆえんは、数年前の「クローズアップ現代」から。
そのまとめ


http://togetter.com/li/311794
<ナレーション> 東京都内の“リアルタイム人口マップ”です。地域ごとの人口が刻々と変わる様子がくわしくわかります。マップの元になったのが、携帯電話やスマートホンが発信する利用者の居場所の情報です。
toshihiro36 2012-05-29 09:38:02<ナレーション> NTTドコモではおよそ6000万回線の携帯電話などが生み出すビッグデータを、別の用途に活用しようと考えました。例えば大規模な地震が東京で起きた場合、帰宅困難になる人は午後3時頃が最も多く425万人にもなることがわかりました。
返信 RT お気に入り toshihiro36 2012-05-29 09:42:40

NTTドコモ・岡島:通信サービスのためではなくて、人口統計という今までとは違う用途の情報を作ると……