2014年3月29日土曜日

第22章:オープンデータとアルゴリズム規制 - ティム・オーライリー

ティム・オライリー Founder and CEO of O’Reilly Media.

規制は今日の政治の悩みの種だ。ほとんどの分野において多すぎるほどの規制があり、逆に規制が少なすぎる分野もある。しかし、ほとんどの場合、それらは間違ったものであり、紙に書いたルールの山や非効率なプロセスなのだ。そして避けえない予期しなかった結果を導くとわかってもほとんどそのルールやプロセスは調整できないのだ。

しばらくの間、規制(制御)をもっと大きな観点から見てみよう。自動車の電子制御部品は排ガスを減少し最適な燃費効率を追及するためにエンジン内の空燃比を規制している。航空機のオートパイロットは数え切れないほどの要素を制御しながら、飛行を維持し正しい目的地に誘導する。クレジットカード会社は詐欺を防いだり、利用者の使用限度を守らせるため利用記録を監視し規制している。医師は患者に出した薬品の用法を時にはある程度の範囲で、時にはかなり正確に規制している。

例えば通常の細胞には影響を与えることなくガン細胞だけを殺す抗がん剤治療だったり、生体機能を維持しながらも手術中には意識を回復しないようにする麻酔の適応などである。プロバイダーや企業のメールシステムは最大限の能力をもってスパムメールやウィルスを含んだメールがユーザーには届かないように規制をしている。検索エンジンは検索結果と広告を規制し、ユーザーがもっとも見たかった結果を出すようにベストをつくしている。 これらの規制のかたちは何を共通点に持つだろうか?

1.望ましい結果に対する深い理解
2.その結果が実現されているかを決めるためのリアルタイムでの測定
3.新しいデータに基づいて調整を行うアルゴリズム(つまり、ルールの集まり)
4.アルゴリズム自体が正しく予期したとおりの結果を出すことが出来ているかの定期的かつ深い検討

上で見たような共通点にそって規制を行っている自治体および特殊法人はほとんど、本当に少ししかありません。たぶんもっとも良い例としては中央銀行が利率、インフレなど経済全般の状態を制御するために行う通貨供給量規制があげられます。アメリカ連邦準備委員会が通貨供給量をいろいろなタイミングと率でひきしめたりゆるめたりすることについて個々のグループの意見はあるにせよ、驚くべきことにほとんどの人たちはこの種の規制の必要性を受け入れています。

それはなぜなのでしょうか?
1.望ましい結果がはっきりしている。
2.全ての人にとって公開されたデータに基づいて、その結果が達成されたかどうか判断するための特殊でない測定手段とレポートが存在する。
3.望ましい結果が出なかったときに調整が行われる。

これを通常の規制モデルと比較してみると、それは結果よりもルール自体に目が行っているのです。すでに意味がなくなったルールにこれまでどれほど直面したことがあるでしょう。ルールに望ましい結果を実際にもたらす証拠があることがどれくらいあるでしょうか? その”ルール”とやらが実際はルールですらない場合もあるのです。ホノルル市の前CIOであるゴードン・ブルースが民間から行政に入り、やり方を変えていこうとしたときに直面したことを語ってくれました。

まず、こう言われたそうです。「それは法律に反しています」そこで彼はこう返しました。「OK。ではその法律を見せてくれますか。」「あ~、正確に言うとそれは法ではないのです。規制なんです。」「OK。ではその規制を見せてくれますか。」「あ~、正確に言うとそれは規制でもないんです。20年前にある人が決めた方針なんです。」「なるほど、じゃぁそれは変更できますね。」 しかし、しばしば実際には長い間生きのびてしまう法律や規制があり、その人工的なシステムは長期間たちすぎた結果、変更することができなくなります。

この問題に対処するためオバマ政権では不必要な規制を抹消する”規制確認”制度と規制の効果をはかる方向に注力してきています。(ホワイトハウス 2012) しかし、この種の規制改革がじゅうぶんに行われることはありません。アメリカ合衆国の法律は驚くほど複雑になってしまいました。直近の保健改革法案はほとんど2000ページにもおよびます。

対して合衆国憲法は200年にわたるぶんの修正を含んでもわずか21ページです。全米の都市間を結ぶ高速道路建設、歴史上もっとも大きな公共事業ですが、これを計画した1956年の高速道路法案は29ページしかありませんでした。 法律は目的、権利、成果、権限および制限を定めるべきです。それがあいまいだったとき、それらの法律は時の試練に耐えるのです。

規制は法律をどのように実行するかをより細かく規定するものですが、それはプログラマーがコードとアルゴリズムを扱うのとまったく同じように扱われるべきで、つまり法で定められた成果を達成するために常に更新されなければいけません。 ますます今日の世界では、この種のアルゴリズム規制はたんなるたとえ話ではなくなってきました。金融市場を考えてみましょう。電子のスピードで行われる決済を行うアルゴリズムが実装され、新しい金融機関が毎日考案されています。これらの金融機関を彼らと同じやり方で監視し管理するアルゴリズムやプログラムなしでどうやって規制していくのでしょうか。あたかもGoogleの検索品質を保つ、Googleの”規制”アルゴリズムがスパマーや悪徳検索エンジン最適化エキスパートとのゲームに勝利しているようにです。 大銀行による悪行の暴露に告ぐ暴露は定期的な法的な検査だけではじゅうぶんではないことを示しています。システム的悪事にはシステム的規制が必要なのです。行政はビッグデータの時代に入る時です。アルゴリズム規制の時は来たのです。

### オープンデータとプラットフォームとしての政府

政府は多くの分野で規制をすることをやめ、それを”市場”に任せるべきだという人が居ます。しかし、積極的な管理がなければそのすきに悪事を働く輩が多数出るでしょう。GoogleやMicrosoft、AppleやAmazonのような会社が彼らのプラットフォームを管理するメカニズムを構築したように、政府もわれわれ社会の成功を確かにするプラットフォームとして存在し、そのプラットフォームでは適切な規制が必要なのです。

現時点で、SEC(証券監視委員会)のような機関が時代に適応できていないことは明らかです。バーニー・マドフとアレン・スタンフォードの大型投資詐欺事件を受けて、現在SECは同種の投資手法を使っている業者の中でずば抜けた成績を残す、つまり詐欺の可能性が高いヘッジファンドを見出すアルゴリズムモデルを構築しました。しかし検出しても検査では長い時間の調査と交渉に入り、それぞれ個別の対応が必要になります。いっぽうGoogleが検索結果に問題を引き起こす新しいスパムをアルゴリズム的手法で見出した場合は、すぐにルールを変更してその悪要素の影響に制限を加えるようにします。我々は無計画な検査を前提としたものより、システム的に悪事に対応する他のより良い方法を見出さなければなりません。 そのためには法律や規制が、そのプロセスよりも望ましい結果自体に注目するようにならないと可能になりません。 SECの規制について他にもやるべき点があります。金融規制は規制当局から指示された内容を簡単に分析できるフォーマットで金融機関が発表する情報開示によっています。このデータは規制当局に利用されるだけでなく、民間でも独自にその金融機関の健全性評価や発展性、他の意思決定に使われます。規制当局者が情報を、実際にはオープンデータを要求することがいかに市場に透明性を与え自己浄化作用をひきおこすかということを見ることができるでしょう。 またここで政府と市場にデータが公開される方法の近代化が規制結果を改善するのに重要な役割を果たしていることを見ることもできます。データは適切なタイミングで、機械可読かつ完全なものとして提供されなければなりません。(オープンガヴァメントワーキンググループ2007を参照)報告が紙で行われたり、PDFのような扱いにくいデジタル情報として提供されたり、四半期に一度のみの発表であったりすると、それはほとんど役に立ちません。 データが再利用可能なデジタルフォーマットで提供された場合、民間側で消費者や市民に価値を提供する新しいサービスを創出したり同様に問題を見つけだすのに役立ったりします。これはアメリカ財務省の”スマート情報開示”イニシアチブの目的です。 ( http://www.data.gov/consumer/page/consumer-about を参照) また新しい金融商品特化消費者庁の主目的でもあります。 行政の規制担当者が情報開示に注力したとき、民間企業はそれに基づいた消費者向けサービスを構築し、真に重要な犯罪者を取り締まる時間を増やすことができます。 ### 規制と評価が出会うとき "ほとんど統治しない政府がもっとも良い政府である”は真実である。しかし、”ほとんど統治しない”ことの秘訣は社会としてわれわれが気にかける不可欠な部分をはっきりさせること、つまり安全な社会、健康な生活、公平性、機会の提供、これらを法律内に体現し、その実現に向かってわれわれを導く規制システムを常に改善し続けることである。 新技術により規制の量を減らすことを可能にしながら、いっぽうで実際には望む結果の生成と監視の量を増やすことができるという面白い時代にわれわれは直面している。 タクシーの規制を考えてみよう。表面上タクシー規制はその時間帯に必要な適切台数のタクシーが走るように行われていて、同時に利用者の安全と品質を保つためとされている。ただ実際には、われわれも知ってのとおりこの規制は品質や利用可能性についてよくない働きしかしない。UberとHailoのような新サービスは既存の免許ドライバーで運用されているが、ドライバーと利用者をひきあわせるためスマートフォンの地理情報を利用し、ほとんど利用されないような場所でも利用可能性を向上させている。しかし、規制に関する話の中で同様に重要なのは、サービス側で利用者がドライバーを(そして、ドライバーが利用者を)格付けするよう求めることである。品質の良くないサービスを提供するドライバーは消えていく。これらのサービス利用者が保証することで、素晴らしい利用者体験を生むことについては評価システムのほうが政府の規制がどれほどあろうとも、それよりも良い働きをしているのだ。 RelayRidesやLyft、Sidecarなどの相互自家用車利用サービスは、レンタカー規制にかかることなく、利用者が互いに車をシェアできるようにしています。このサービス上では相互評価が規制の代わりに利用され、そのことによる悪影響もみられません。行政はこのようなモデルを排除するのではなく学び、明白な悪影響がない場合は採用するべきです。 AirBnBのようなサービスは似たような相互評価システムを提供しており、許認可行政のもとではほとんど格付けを得られないような近隣の宿泊サービスを利用可能にしながらも、顧客保護を実現しています。 相互評価システムはオープンデータにより規制担当者および当局者が無理することなしに市民にとっての結果をいかに改善するかのとても良い例です。 Yelpのようなサイトはレストランについて多数の口コミ評価を提供します。美味しくない食事やダメなサービスを受けた不幸なユーザーは非難し、一方、素晴らしい点は評価されます。 ユーザーの相互評価システムの持つ使いやすさと広がりを政府のデータとあわせようとする興味深く新しいプロジェクトがいくつもあります。最近の試みの一つにサンフランシスコ市とCode for America、Yelpが共同して策定したLIVES標準があり、保険局の検査データをYelpや他のユーザー向けレストランアプリケーションで利用できるようにしました。オープンデータを使い、より豊富な情報を消費者に届けるようにしたものです。House Facts標準は同じように家屋調査データを用いて、Truliaのようなネットサービスと統合しました。 他に興味深いプロジェクトと言えば、もともとカリフォルニア消防当局のサン・ラモンによって始められたパルスポイント プロジェクトがあります。これは行政データを市民向けアプリケーションと結びつけることで、(たんなる市民の声ではなく)市民の助けを実際に得るものです。あるレストランで消防隊のリーダーが救急スタッフと共に昼食を取っている際、隣のレストランから救急出動依頼が出ているのを聞き狼狽したという経験から作られたアプリケーションで、救命救急トレーニングを受けた市民なら誰でも公式に出動依頼を受けることができます。 ### アルゴリズム規制でのセンサーの役割 ビジネスや行政との関わり、形成される環境自体がますますデジタル化しており、そのため独創的な形で測定可能となり、究極的にはアルゴリズム規制を受け入れるようになります。 例として、(オービスのような自動撮影システムではなく)GPSの利用により速度超過をしたドライバーがたまたまそこにいた警察官に切符を切られる代わりに、自動的に取り締まられるような未来を考えるのは容易です。 今日ほとんどの人はそれを押しつけがましく、異様なものだと考えるかもしれません。しかし、未来には今日定められているような固定された速度制限ではなく、交通量や天候、その他客観的条件により速くしたり遅くしたり適切な速度制限が自動的に調整されるようになることが想像できます。最終段階では自律した自動車が今日の固定した速度制限よりも安全に保つ規制システムによる見えないWebに接続されてより速く移動することが可能になります。結局のところ目標は自動車をもともとの速度よりも遅くすることではなく、道路を安全にすることなのです。 このような未来はおそらく多数の問題を提起し、プライバシーや他の基本的自由に対する攻撃であると多くの人がみなすかもしれないとは言え、シンガポールのような国ではすでに初期的なものが導入されており、さらに広がっていくことが予期されます。 市中心部への交通量を抑制するために設けられた渋滞税の価格設定はもうひとつの例です。ロンドンで行われているようにナンバープレートを読みとって料金を後ほど支払うシステムは自動課金に代わります。これにより価格に時間帯別だけではなく実際の交通量を反映させることができます。 スマート駐車メーターは似たような機能を持っています。ピークの時間帯に駐車すると料金は高く、そうでなければ安くなります。しかし、たぶんより重要なのは、スマート駐車メーターが駐車されているかどうかをレポートする機能を持つことで、結果的にドライバーやカーナビシステムに情報を与え、空いている駐車場を見つけるために目標無しにぐるぐると回る無駄な時間を減らすことにあります。 将来的に電気自動車が増加することが想定されるため、すでにガソリン税ではなく代わりに移動距離税を課すべきだという要請があります。もちろん、GPSによって記録されたデータをもとにします。 さらに未来においては、公共交通機関が再発明され、ますますUberのようになっていくのを想像できるでしょう。1人の利用者と1人のドライバーを結びつけることと、同じルートもしくは同じ目的地に向かう4,5人の同乗者を探すことの差はほとんどありません。スマートフォンのGPSと賢い経路探索アルゴリズムがあれば、より多くの利用者を結びつけるコストがかからず柔軟な公共交通機関として、タクシーとバスを統合したようなサービスが実現するでしょう。 ### 最初のステップは測定 データによる規制システムはGoogleやクレジットカード会社で行われている、もしくはそれ以上に複雑なものである必要はありません。時として、すでに収集されたデータから計算される単純なものであり、新しいビジネスプロセスがそこで実行できるものです。 一例として、退役軍人用の小自治体向け求職検索エンジンの費用(年間5億円)を聞いたあとで、サイトには何人の利用者が居るのかを尋ねたのです。「数百人です」と言われました。はっきりとわかるほどの衝撃を受け、なぜこのようなプロジェクトが契約更新されるのかと思いました。しかし、総務のお偉いさんに政府のウェブサイトで利用者1人あたりの費用を定期的に計算するプロセスがあるのかを確認したところ、「それは良い考えですね」って言われたんです。これは単なる良い考えであってはいけないです。常識とされるべきなんです。 民間のウェブサイトではトラフィックを測定するだけではなく、常に利用されなくなった機能をなくしたり、新機能のテストを行うなどの調整を続けています。起業したばかりの会社が目的とする顧客を獲得するのに失敗したとき、その企業を支援するベンチャー投資家は投資資金を引き上げるか、もしくは新しいやり方に"変更"させて成功するまでいろいろな方法を試させます。現在シリコンバレーで広く普及する"リーンスタートアップ"という考え方では起業したばかりの企業を"学習機械"であるとみなして、市場に対する対応をデータに基づき継続的に改良、改善していきます。一方、行政ではあたかも失敗することが大罪であるかのように、やむを得ず下手なやり方に倍賭けしているように見えます。 政府のウェブサイト契約更新時に、ページ評価データを利用することはアルゴリズム規制の簡単な利用のひとつですが、膨大なウェブサイト自体の簡素化とITコストの削減につなげることができます。民間のホームページで他に利用されている評価データとしては、滞在時間や離脱率[フォーム書込や製品購入中に完了せず訪問者が立ち去ってしまう率]、必要な情報にどの経路でたどりついているかの分析があります。 他のデータも同様に利用可能です。多くの民間サイトでは検索キーワードを分析することにより顧客が何を求めているのかを浮かびあがらせます。英国政府デジタルサービスではこの手法を、あまたある省庁や内閣官房が自分たちの成果を自慢させるためではなく、ユーザーのニーズにそってGov.UKのサイトを設計しなおすときに利用しました。人々が何を探しているかを確認し、もっとも検索される答えに対し新しく短い経路でたどりつけるようにサイトを設計しなおしたのです。(Code for Americaはホノルル市のサイト、Honolulu Answersをほとんど同じやり方で構築しました。さらにもっとも問い合わせの多い質問に対しては市民によ、りより親しみ深い内容の答えを”ライトソン”を開催することで作成しています。) これはGoogleがアルゴリズムを使って検索問合せデータを検討しどの結果を表示すべきか評価する際に自動的に行っているやり方を真似る、より単純な手動での改善方法になります。例えば、Google は彼らが"長時間クリック"および"短時間クリック"と呼ぶものを測定しています。ユーザーが検索結果リンクをクリックして検索結果のページに戻らない、もしくはそうとう後になって戻れば、それは目的のページが役に立ったことを意味します。これが長時間クリックです。これに対して短時間クリックは、すぐに検索結果のページに戻り、代わりに他のリンクをクリックします。短時間クリックが多いリンクは、検索結果のページで順位が下げられます。 データ収集、評価、分析、意思決定が政府内で確立しつつあるという多数の良い事例があります。ニューヨーク市では集合住宅の違法改築と火災の危険性増加の関係をデータマイニングから特定し、建築局と消防検査部門とのユニークな協力関係につなげています。ケンタッキー州のルイビルでは実績評価に注力している部署が行政の文化を継続的プロセス改善へと変えています。 このような手動での改善はあくまでも本質的な最初の一歩であることを理解することが重要です。システムで役に立つデータが収集できて、そのデータに基づいた改善が効果を発揮することがわかれば、次はそれを自動的に実行することを検討することになります。

まだ長い道のりがあります。評価、結果、そして規制がいかに両立していくかを考え始めたばかりなのです。 ### アルゴリズム規制のリスク アルゴリズム規制の利用は規制側の権力を増大し、時にはそれが濫用につながったり、我々の自由な社会に対する呪いともよべる状態になってしまう可能性があります。"目的の自己拡大"は本当に危険です。ひとたびある目的にそってデータが集められると、データが別の目的に利用されてしまうことは簡単に想像できます。本来、海外でのテロ活動防止のためにNSAが集めていたアメリカ人の情報が、著作権侵害を含む国内犯罪のために他政府機関により利用されていたということを我々は既に経験しました。 このような危険性を避ける答えはデータを収集しないことではありません。本来の目的以外に使われることのないようにしっかりとした安全策を講じていくことなのです。これまで見てきたように、監視と透明性を執行するのは、国家安全保障が問題だったり、不正使用を隠すためにセキュリティを隠れ蓑にされたときは特に難しくなります。しかし、NSAだけがその手法を秘密にしている組織というわけではありません。Googleの持つ検索アルゴリズムの詳細点の多くはシステムで悪用されないため、どのように動作するかがビジネス上の秘密とされています。同じことがクレジットカード詐欺検出にも言えます。

ひとつの大切な違いはGoogleのような検索エンジンがオープンデータ(Web上にあるコンテンツ)に基づいていて、競争にさらされているということです。もし、Googleの検索結果が悪いもの(例えば広告収入を増すために恣意的な結果を表示する)であれば、市場シェアをBingに奪われるというリスクが高まります。ユーザーはまた自分自身でGoogleの検索結果を評価できるのです。 それだけではなく、Google の検索品質チームはユーザー自身に依存しているのです。数万の検索を実行した人達に必要としていた結果が見つかったかどうかを尋ねるのです。"いいえ"がある程度多い場合、Google はアルゴリズムを変更します。 可能であるときは、アルゴリズム規制を採用している行政は同様にその規制の品質評価手段を持たなくてはなりません。それは定められた法に準拠していることを示すだけだけでなく、規制が意図していたもともとの明確な目標に合致している事を強調するためです。意思決定に使われるデータは監査可能で、可能であればいつでも公共的に検査できるようオープンであるべきです。 真のアルゴリズム規制システムを構築する際に必要とされるデータ収集には巨大なプライバシー侵害のリスクもあります。運転中の速度記録は移動場所の特定につながります。しかし、速度超過をしない限り場所データを保存する必要はなく、また交通制御システムで利用する際にはデータの匿名化が可能です。 民間側でかなりの量のデータ収集が行われれば、現在のプライバシーが持つ意味が変わっていくことははっきりしています。必要なことはデータ収集とその利用により受ける利益との間のトレードオフを熱心に議論することです。 このことは政府という文脈でも変わらないのです。 ### 結びに われわれは社会全ての要素に影響するビッグデータによるアルゴリズム規制のまだ始まりに立ち会っているにすぎません。政府はこの革命に参加する必要があるのです。 導入部分でもふれたように、成功するアルゴリズム規制のシステムは以下のような特徴を持っています。

1.望ましい結果に対する深い理解
2.その結果が実現されているかを決めるためのリアルタイムでの測定
3.新しいデータに基づいて調整を行うアルゴリズム(つまり、ルールの集まり)
4.アルゴリズム自体が正しく予期したとおりの結果を出すことが出来ているかの定期的かつ深い検討

オープンデータはステップ2とステップ4で重要な役割を果たします。オープンデータ、それが政府自体から提供されたものでも、また民間に政府から要求されたもののいずれでも、評価の革命に重要な役割を持つのです。オープンデータはまたわれわれが望んだ結果にいたっているのかどうかを理解することを助け、より良い方法で目的にたどりつくために競争を潜在的に促進するのです。

### 著者について ティム・オライリーは世界中で多くの人が最も素晴らしいコンピュータ関連書籍出版社であると考えるオライリーメディアの創業者でありCEOです。オライリーメディアはまた技術系のカンファレンスを開催しており、オライリーオープンソースコンベンションやStrata:データビジネスなどを含む多数の会議を行っています。ティムのブログ、オライリーレーダーは、”業界最先端の技術者に注目”して今後やってくる技術トレンドを見たり、技術者コミュニティにとって重要な問題のプラットフォームとして提供されています。ティムはまたオライリーの初期ステージベンチャー養成会社であるオライリーアルファテックベンチャーズの共同経営者であり、サファリブックスオンライン、PeerJ、Code for Americaそして最近オライリーメディアから分社したメイカーメディアの取締役でもあります。メイカーメディアの主催するメイカーフェアはパーソナルコンピューター革命を引き起こした西海岸コンピュータフェアになぞらえられています。

### 参考資料 * [Lichtblau, E., & Schmidt, M.S. (2013, August 3). Other Agencies Clamor for Data N.S.A. Compiles. The New York Times. Retrieved from http://www.nytimes.com/2013/08/04/us/other-agencies-clamor-for-data-nsa-compiles.html](http://www.nytimes.com/2013/08/04/us/other-agencies-clamor-for-data-nsa-compiles.html) * [Open Government Working Group. (2007, December 8). 8 Principles of Open Government Data. Retrieved from http://www.opengovdata.org/home/8principles](http://www.opengovdata.org/home/8principles) * [ホワイトハウス (2012). 演説原稿: 規制 : 過去を振り返り未来へ目を向ける - Cass R. Sunstein. 以下参照 http://www.whitehouse.gov/sites/default/files/omb/inforeg/speeches/regulation-looking-backward-looking-forward-05102012.pdf ](http://www.whitehouse.gov/sites/default/files/omb/inforeg/speeches/regulation-looking-backward-looking-forward-05102012.pdf )


(翻訳: 柴田重臣 (e-mail))

0 件のコメント:

コメントを投稿