Archive

Archive for the ‘proposal’ Category

グラフだけじゃない、Data Visualizationフレームワーク集

1月 19th, 2010

(8 free Data Visualization frameworks not only for charts [en])

相変わらずData Visualization関係で調査・開発を行っているのですが、その中でJavascriptのライブラリ・フレームワークを探す時間も多いです。

» 20 Fresh JavaScript Data Visualization Libraries

上記記事のようにまとめ記事が結構あって助かるのですが、ほとんどがCharts(グラフ)のライブラリなんですよね。Chartsも線グラフか、棒グラフか、円グラフか、、、みたいにライブラリ化される主要なグラフは8種類くらいしかなく、面白くない。
適切なデータに対して適切なVisualを関連付けるわけですから、もっと多くのVisualが考えられてもいいはず!

そこでChartsに限らない、もっと根本的にData Visualizationを扱っている有名どころのフレームワークをリストアップしてみました。

SIMILE Widgets Exhibit

dv-js-library-simile

MITのメディアラボがリリースしているFaceted Search用フレームワークです。HTMLを拡張したテンプレート言語を用いて、簡単にFaceted Searchと、検索結果のリッチなVisualizeを可能にしています。現在、リスト、テーブル、地図、Timeline、TimeplotといったVisualに対応しています。タブなどでVisualを切り替えられるので、ユーザーの目的にマッチした検索機能を提供することができます。

SIMILE Widgetsでは、他にもTimelineや、TimeplotRunway(Coverflow)などのVisualもAPIとして個別に提供しています。

» SIMILE Widgets Exhibit – US President Search DEMO

ProtoVis

dv-js-library-protovis

ProtoVisはStanfordのVisualizationフレームワークです。これは巷のライブラリと違い、グラフや地図、といった単位を1つの単位として扱わず、線や面、点といったもっと細かい部品単位でVisualを作成しています。どちらかというとProcessing.jsに近いかも。たくさんのDEMOが載っているので、それらを参考にかなり自由度の高いVisualを作成することができます。

» ProtoVis DEMO

Prefuse Flare (Flash)

dv-js-library-prefuse

Prefuse FlareもData Visualizationのフレームワークとして有名です。Prefuseは、Javaのフレームワークでしたが、今回Flashに対応しました。こちらも豊富なVisualを用意しており、SIMILE同様データ構造をしっかり設計しているので柔軟性が高く、Visualの切り替えや様々なVisualを拡張することができるようになっています。

また、Flashならでわの気持ちのいいインタラクションも高評価です。

» Flare DEMO

Style Chart

dv-js-library-style-charts

こちらは、javascriptでVisualのリクエストを投げるとサーバー側で画像を生成し、それを表示するというフレームワークです。Galleryを見る限りかなり豊富なVisualを扱えるようです。画像だからってアニメーションやアクションが行えないわけではなく、そこにもちゃんと対応しています。扱っているライブラリが少ない、レーダーチャート(スパイダーチャート)も用意している点がいいです。

» Style Chart Editor(DEMO)
» Style Chart Gallery

CanViz

dv-js-library-canviz

有名なVisualizationフレームワークであるGraphvizのJavascript版です。主にグラフ構造のデータを描画するのに適しています。ただ、DEMOを見る限り、アニメーションやイベントの設定ができないようで、本当にVisualizeのためだけのフレームワークのようです。

» CanViz DEMO

Axiis (Flex)

dv-js-library-axiis

こちらはAdobe FlexのVisualizationフレームワークです。インタラクティブなアクションがかなりリッチに作りこまれています。下記のBrowser Statisticsは一部で話題になりましたね。かなり自由度の高いフレームワークのようです。

» Axiis – Browser Statistics DEMO

Infovis

dv-js-library-infovis

こちらもグラフ構造のデータ描画ライブラリとして有名です。フレームワークではないので個別のVisualを利用する形になります。グラフ構造しか扱えないのですが、この手のライブラリとしては珍しく、Weighted Graph(ノード間のパスに重みが付いている)/Directed Graph(パスに方向がある)、の描画にも対応しています。現時点で5種類のグラフ系、ツリー系のVisualがありますが、どれもよくできています。

» Infovis DEMO

RGraph

番外ですが、HTML5用のグラフ生成ライブラリも登場しています。HTML5なのでまだまだ本格導入は難しいかもしれませんが、相当クオリティ高く仕上がっており、今後が楽しみなライブラリです。

» RGraph DEMO

8maki IT, proposal, survey, テクノロジー, デザイン , , ,

モノと関連データの関係性-Semantic Webによるスキーマ定義-

12月 13th, 2009

前回、モノをある切り口で捉え、それを適切な表現方法にあてはめて考えるアイディア出しスタイルと、モノの関連データにVisualizationをあてはめるというData Visualizationのスタイルは、脳の構造・プロセスが同じで、分かりやすいのではないか、という記事を書きました。

» アイディアの発想法とData Visualizationは同じ構造なのではないか?

そこで今回は、上記事で言及している”モノとその関連データ”とは何なのか、深く掘り下げてみたいと思います。

関連データとはプロパティである

「データから自動でVisualizationを行う」という取り組みの中で、どのようにデータを扱えばよいかという問いにぶちあたり、最近RDFおよびRDF Schema、Dublin Coreあたりを調べています。

RDF とは、主語・述語(プロパティ)・目的語(値)という3要素を用いてデータの関係性を表現するWeb上の枠組みのことです。例えば、「New Yorkの略語はNYである。」という例文は下記のようなXMLで表現されます。

<rdf:RDF
 xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
 xmlns:dcterms="http://purl.org/dc/terms/alternative">
  <rdf:Description rdf:about="urn:states:New%20York">
    <dcterms:alternative>NY</dcterms:alternative>
  </rdf:Description>
</rdf:RDF>

この例で、主語・述語・目的語はこのような意味になります。↓
主語: New York というモノが存在し、
目的語: NY という関連データがあり、
述語: 略語 という主語と関連データの関連性を意味している。

これだけだとちょっと分かりにくいかもしれませんが、表は、基本的に主語・述語・目的語の構造に落とすことができます。下記は宇多田ヒカルのWikipedia Infoboxの例です。「宇多田ヒカルの出生名は宇多田光である」ということを表しています。

utada

この構造は、前回の記事で示した、モノ⇔関連データ⇔Visualizationの構造に合致しています。

ここの述語、要はプロパティの部分とVisualizationをうまくひもづけるルールを定義できたら、「扱うデータからVisualizationを発想する」ことができるのではないでしょうか。さらに言えば、ルールさえしっかりしていれば、データとプロパティさえ定義すると自動でユーザーが求めるVisualizationを生成することができるようになります。

規格化されたプロパティの定義

ただ、適切なプロパティと適切なVisualizationをひもづけるには、プロパティの規格化が必要です。色々な人が、バラバラのプロパティ名を用いたり、統一化されていないカテゴリをプロパティとして付与したりすると、自動化が非常に困難になります。

そこでRDFでは、Dublin Coreというメタデータ記述語彙集を用いることが推奨されています。Dublin Coreには、TitleやCreatorといった15の基本要素と呼ばれるプロパティ候補があり、これらを用いることで、情報に共通化されたメタデータ、プロパティを付与することができるようになります。

さらにこれを細分化したDCMI Metadata Termsというものも存在します。DCMI Metadata Termsでは、50個以上のプロパティが定義されています。 先程の「略語」という述語(プロパティ)は、DCMI Metadata Termsのdcterms:alternativeというプロパティに置き換えることができます。

考察

このようにWeb上でデータを構造化する動きは、Semantic Webという流れの一つです。Semantic Webとは、コンピュータが理解できるように、Web上の情報に意味を付与しよう、というプロジェクトです。Data Visualizationで扱うデータをSemantic Webに合わせて構造化する方法は、現状は、割と有効だと思われます。

ただ、Semantic Webは分かりにくい上に考え方が古いので、中々浸透していません。Data Visualizationを主軸に考える場合、もっと別なデータの構造化・規格化手法を考える余地は大いにあるとは思います。

参考

こちらに、Semantic Webの概念図が載っています。コンテンツにメタデータの付与→メタデータの語彙規格化→語彙の意味把握(Ontology)→論理式を用いて結論を導く(Rules,Logic Framework)→結論の証明(Proof) という流れはいい線いっている気がしますが、先は長そうですね。

8maki IT, proposal, survey, テクノロジー, デザイン , , ,

アイディアの発想法とData Visualizationは同じ構造なのではないか?

11月 30th, 2009

(Data Visualization is the same as how to organize ideas [en])

先日、元サイボウズでアメリカでLUNARRを立ち上げられた高須賀さんにお会いしました。そこで、最近研究している Data Visualization について発想が沸いたので書き残します。各データの種類(スキーマ)から自動で適切な Visualization 方法を選択して表現する、という研究です。

高須賀さんのお話

「アイディアをひねり出すとき、いきなりすごいアイディアを考えるよりも、切り口を見つけてそこから発展させた方がいい。アイディアと切り口のバランスが取れた位置が一番エネルギーがある。」ものすごく簡単にまとめるとこういうお話でした。

つまり、ものごとを構造化してとらえ、ツールを使って着想を得た方がアイディアを出しやすい、ということ。

例: 新しいレーザーを考える。レーザーは点であり直進する。点の反対は面で、直進の反対は曲がる。これらを2次元グラフにプロットし、各象限に何が当てはまるか頭をひねる。面・曲がるという象限、つまりどこにおいても光を反射させ、面に映し出すという切り口から、スクリーンの前に置かなくてもよいプロジェクターというアイディアが生まれた。

このとき、切り口からアイディアをひねるために用いたツールが、高須賀さん曰く2×2というもの。要は2軸ある2次元グラフで昔私もマトリックスとも呼んでいました。構造化してアイディアを得る・まとめる方法は以下の高須賀さんの記事が分かりやすいです。

» 事業を考える切り口 – Toru Takasuka の起業・経営ブログ

» 新しい concept のはじまり – Toru Takasuka の起業・経営ブログ

松岡正剛の編集学校で教える編集術

こういった発想の訓練、実は以前にも受けたことがありました。松岡正剛の編集学校で体験授業です。

割と戦略コンサルのケーススタディ訓練に似ているのですが、MECEに限らず、もっと自由に発想する、ということが目的で楽しかったのを覚えています。そこでいただいたパンフレットに、6個のツールが載っていました。

edit1

1. Combination (一種合成型)
2つのものを合成して新しいアイディアを生み出す。

2. Triple Jump (三間連結型)
ホップ・ステップ・ジャンプ型で発想を展開。大・中・小や過去・現在・未来などの切り口もあり。

3. Branching (二点分岐型)
一つのものを2つに展開。この例ではブランドを切り口に展開した。

4. Trinity (三位一体型)
三位一体型、3点セットで考える発想パターン。3Cなどが代表例かも。

5.1 All Around (二軸四方型1)
Branching型の枝が2つ増えて、四方へと分岐する発想法。

5.2 2×2 (二軸四方型2)
2軸を決めてそれぞれのマスに何が入るか考える。マトリックス型。

※英語は勝手に私が変換したものです。

edit2

Data Visualizationとの関係

さて、本題ですが、切り口をツールにあてはめアイディアを得るという発想法と、Data Visualization は、頭の中では同じ構造で処理しているのではないか?というのが今回のパラダイム・シフトでした。

edit3

どちらも「分かりやすく考える」「分かりやすく表現する」ということで、頭の使い方が非常によく似ているような気がします。Data Visualization というと Computer Science チックですが、何か考えを図にまとめるときのことを考えると分かりやすくて、まず扱う対象があって、それを一つの側面で切ったデータ群があり、それをどう Visualize するか?というのは、高須賀さんのおっしゃる構造的な思考と同じプロセスを踏むのではないでしょうか。

普通 Data Visualization を調べる場合、どういった Visualization があるのか、どうプログラミングで表現するのか、といったことに目が行きがちになります。オライリー本の”Visualizing Data“もアルゴリズム中心の本でした。

そこを、扱うデータから Visualization を発想するというパラダイムに変換することで、おもしろい表現ができるだけでなく、説得力のある Data Visualization 手法を考案できる気がしました。

参考までに、こちらの図↓は様々なチャートを目的別に一覧表示しています。チートシートとして使うと便利かも。

» Chart Suggestions – A Thought Starter

p.s.

オフィスにお邪魔した際、VentureBEATの勝屋さんもいらっしゃいました。Blogに写真を載せてさらにリンクまで張っていただきました。ありがとうございました!最強のコネクターと言われるだけのことあって、超人懐っこいでしたw

» 人のつながりは無限(∞)につながる – 勝屋久の日々是々

  • Ben Fry, 増井 俊之 (監訳), 加藤 慶彦
  • 定価 : ¥ 3,780
  • 発売日 : 2008/12/01
  • 出版社/メーカー : オライリージャパン
  • おすすめ度 : (6 reviews)
    可視化の一つの手段としてProcessingの概要を知りたい人に
    情報の可視化入門
    目からウロコが。。。
    日本人の本より読みやすい
    既存のマッシュアップAPIを使うのとは違ったWeb情報の楽しみ方

8maki IT, proposal, エンジニア , , ,

Python-MySQL(MySQLdb)のメモリリーク対策

10月 27th, 2009

会社のスクリプト言語がPythonに統一されて、今月からPythonをメインに使っているのですが、MySQLに接続する際なぜかものすごくメモリを食う時がありました。その備忘録。

最近技術ネタが続いていますがf^^;

結論から先に書くと、MySQLdbのfetchallの部分を下記のように書きなおすとメモリリークが起きなくなりました。

sql = "SQL文"
con= MySQLdb.connect(db = db, host = host, user = user, passwd = passwd)
cur = con.cursor()
cur.execute(sql, params)
result = cur.fetchall()

sql = "SQL文"
con = MySQLdb.connect(db = db, host = host, user = user, passwd = passwd)
con.query(sql)
r = con.store_result() # use_result()も可
result = []
while(True):
  row = r.fetch_row()
  if not row: break
  result.insert(0, row[0]) # 初めにデータを挿入してリストの再構成を防ぎ高速化!
con.close()

» ueBLOG | PythonをつかってMySQLの巨大な結果を返すselect文を処理する
主にこちらのブログを参考にしたのですが、cursorを使わず直接connectからクエリを投げるようにしています。
大きな違いは、一度にデータを取得するのではなく、1行ずつ取得するようにしている、ということだと思います。6~9行目で取得する行を一つ一つリストに格納しています。

なお、4行目でstore_result()を使っていますが、use_result()も可能で、use_result()を使うとデータをサーバに保持しそこから一行ずつ取得するようになるので、よりメモリの消費が抑えられる、気がしますf^^;
確認していないので何とも言えないのですが。

SQLAlchemyだとメモリリークしない、と聞いて試してみたのですが、ORマッピングで導入が面倒くさそうなうえに、生SQLを叩く際は結局MySQLdbを使うようで問題は解決しませんでした。
大量のデータをMySQLに保存しそこから全文検索(エンジンはSenna)でデータを引っ張る処理を行っていて、ある特定のSQLを書く必要があったので。

参考:
» MySQLdbのメモリー・リーク – スコトプリゴニエフスク通信
» [Python] MySQLdbのメモリリーク (それなりブログ)

8maki IT, proposal, エンジニア , , ,

あなたがウォッチすべき世界的テクノロジーベンチャー50

6月 20th, 2009

BusinessWeekと、ベンチャー企業のマーケットリサーチを行っているYouNoodle(独自のアルゴリズムでベンチャー企業の数値評価をしているサービスで、割とVCの間でも好評なようです via Techcrunch)が、国の枠を超えて注目を集めているテクノロジーベンチャーを発表していました。

Our list includes fledgling tech companies—most started in 2005 and later—from the U.S., China, India, Israel, and Russia that are attracting some early buzz and are poised to grow beyond their regional or niche-market origins.
» Fifty Tech Startups You Should Know

また、Track In – Indian Business Blogでは、リストの中でインド人が創業者の会社はいくつあるか調べていました。結果、6/50社とのこと。実際私がシリコンバレーに行ったときも、インド人起業家・エンジニアの多さを実感しました。(Amazon AWSのイベントでは3割近くがインド人だったように思えます。)

しかし、、、日本人が創業しているベンチャーが一つもないですね。。。もちろん、アメリカでの指標ですし、外に出るだけが能ではないですが、リストにはアメリカに限らずスペイン(1社)やブラジル(2社)なんかのベンチャーも入っていて、なんか、悔しいですよね。早いとこ弊社も外に出てみたいものです。

最近では日本のベンチャーも海外を視野に入れてきていて、数年後また事情が変わってきている気もしますが、中々厳しいのが現状かもしれません。

ただ、全く日本人がベンチャー界隈で活躍していないかというと、そうでもなくて、VC・投資家として活躍している日本人企業がいくつかあります。

別エントリ”日本人色のするベンチャー関連企業@世界”にまとめてみたので、ご興味ある方はご覧ください。

アメリカ以外をベースにするベンチャーをマークアップしてみます。↓

Company Headquarter Total Funding
(in Million Dollars)
Year Funded CEO
Cotendo San Carlos, Calif. 7.0 2008 Ronni Zehavi
Proclivity Systems New York 6.2 2006 Sheldon Gilbert
Monitise London 19.0 2004 Alastair Lukies
Cloudera Burlingame, Calif. 11.0 2008 Michael Olson
Bloom Energy Sunnyvale, Calif. N/A 2002 K.R. Sridhar
Positive Energy Arlington, Va. 15.5 2007 Daniel Yates
Nila Los Angeles 0.6 2004 Jim Sanfilippo
Fusion-io Salt Lake City 66.5 2006 David Bradford
Raydiance Petaluma, Calif. 20.0 2005 Barry Schuler
Pelago Seattle 22.4 2006 Jeff Holden
SynapSense Folsom, Calif. 11.0 2006 Peter Van Deventer
Modu Kfar-Saba, Israel 85.0 2007 Dov Moran
Inrix Kirkland, Wash. 31.1 2004 Bryan Mistele
Sermo Cambridge, Mass. 37.5 2006 Daniel Palestrant
Livescribe Oakland, Calif. 18.6 2007 Jim Marggraff
Palantir Technologies Palo Alto, Calif. 36.7 2004 Alex Karp
SecondMarket New York N/A 2004 Barry E. Silbert
Better Place Palo Alto, Calif. 200.0 2007 Shai Agassi
Boxee New York 4.0 2008 Avner Ronen
Mochi Media San Francisco 14.0 2005 George Garrick
Huddle.net London 4.0 2006 Alaisdair Mitchell
Metaweb Technologies San Francisco 57.0 2005 Thomas Layton
Fon Madrid 48.0 2005 Martin Varsavsky
Loopt Mountain View, Calif. 13.3 2005 Sam Altman
Xobni San Francisco 14.6 2006 Jeff Bonforte
KupiVIP Moscow 11.0 2008 Oskar Hartmann
Spotify Stockholm 20.0 2006 Daniel Ek
TokBox San Francisco 14.0 2007 Ian Small
PBworks San Mateo, Calif. 2.5 2005 Jim Groff
Kosmix Mountain View, Calif. 55.0 2005 Venky Harinarayan
Evernote Mountain View, Calif. 13.5 2005 Phil Libin
Yola San Francisco 25.0 2007 Vinny Lingham
Adconion Media Group London 80.0 2005 T. Tyler Moebius
QueBarato Brazil 6.0 2007 Pending confirmation
TheFind Mountain View, Calif. 26.0 2006 Siva Kumar
Daylife New York 8.3 2007 Upendra Shardanand
Jajah Mountain View, Calif. 28.0 2005 Trevor Healy
AdMob San Mateo, Calif. 47.2 2006 Omar Hamoui
Ibibo Gurgaon, Haryana, India N/A 2007 Ashish Kashyap
Justin.tv San Francisco 4.0 2006 Michael Siebel
Komli Media ** Mumbai, India 7.0 2006 Amar Goel
RockYou Redwood City, Calif. 68.5 2006 Lance Tokuda
Etsy Brooklyn, N.Y. 31.6 2005 Maria Thomas
Sonico Buenos Aires 4.3 2007 Rodrigo Teijeiro
Scribd San Francisco 12.8 2007 Trip Adler
Slide San Francisco 58.0 2005 Max Levchin
OpenDNS San Francisco 2.5 2005 David Ulevitch
Tudou Shanghai 84.5 2005 Gary Wang
Ning Palo Alto, Calif. 104.0 2004 Gina Bianchini
Zynga San Francisco 39.0 2007 Mark Pincus

8maki proposal, survey, ビジネス, ベンチャー, ベンチャーキャピタル, 企業, 海外 ,

Data VisualizeなWeb系アプリケーションまとめ

5月 14th, 2009

昨今、新しいインターフェースを採用したアプリケーションが多く出てきている印象があります。先日Blogでも紹介したGAPMINDERですが、こういった統計データをグラフ化して公開するサービスは、最近になって注目を集めている気がします。

データが溢れてしまって、次はそれを「いかにわかりやすくまとめて表示するか」に焦点が向うのは自然かもしれませんね。そこで今回は、どういったアプローチがあって、具体的にどんなアプリケーションとして実装されているのか、調べてみました。

【目次】

2D(2次元)

大きく分けて2Dと3Dの方向性があって、2Dはいかに2次元ブラウザ上でうまくデータを表示するか、というアプローチになるでしょう。2Dはさらに、コンテンツプロバイダー側のデータをグラフ化して提供するアプリケーションと、ユーザーのデータをWeb上でわかりやすく表現するアプリケーションの二つに分類できます。

■2D(プロバイダーがデータを提供)

○莫大なDBからデータを提供するアプリケーション

Wolfram Alpha(画像↓1枚目)と最近開発が発表されたGoogle Squared(to Techcrunch)は(画像↓2枚目)有名ですよね。前者は10TBもの統計データを、検索キーワード(SQLのようなクエリ?)に応じて図を示してくれるアプリケーションで、5月にリリース予定です。あの数学アプリケーションMathematicaの作者Wolframのプロダクトとしても有名です。
wolframalpha

一方、Google Squaredの方ですが、下記の画像を見るとわかるように、Web上の検索結果をグリッド上に表示して、それぞれの結果を比較できる、というインターフェースになっています。莫大なWebデータを保有するGoogleならではのサービスですね。Google Analyticsがアクセス解析の会社を一掃したのように、巷のバーティカルサーチエンジンを恐怖に陥れるのでしょうか。

googlesquared

また、先日紹介したGAPMINDERも統計データの表示なので、こちらのアプローチに入ります。

検索エンジン系
扱うデータが膨大なため、検索エンジンの様相を呈していくのではないでしょうか?となると、データの表示は主に今までなされてきたようなグラフ化に落ち着きそうです。それよりも、検索クエリの構文とか、検索方法といったユーザーインターフェースに改善の余地が出てきそうです。

○関係性の視覚化

mixigraph_mac

また、検索エンジン系のアプリケーションでは対象としていない、データ同士の関係性を示そうとする試みもあります。一番わかりやすいのはmixigraphではないでしょうか?ノードとノードがあってその間をつなぐ線があるという図は、実生活ではよく目にしますが、なかなかWeb上では目にしません。

ただ、関係性の抽出という意味では、一つ有名な領域があります。

レコメンドエンジン系
レコメンドエンジンです。主なレコメンドエンジンは、商品同士の関連を計算して、類似商品を表示します。サイジニアのデクワス(画像↓)というレコメンドエンジンでは、ユーザーの指向から類似コミュニティを見つけて、そのコミュニティを利用して関連商品を出しているようです

deqwas

結局mixigraphも、共通の知人や関連性の高い友人を見つるのに使うのが主な目的だと思うので、ある種レコメンドエンジンと言えますね。多くのレコメンドエンジンもmixigraphのような、ビジュアル的アプローチができる気がします。

■2D(ユーザーが自分のデータを表示)

○Web上の描画支援

googlevisualization

Google Visualization APIは、ユーザーのデータをWeb上に表示する際に便利なAPIです。仕組みは簡単で、データを投げるとグラフの画像が返ってきます。また、Google Analyticsなかのひと、といったアクセス解析ソフトも、ユーザーのデータをわかりやすく表示するアプリケーションと言えばこちらの分類ですね。

API系
今後も自分のデータを簡単に、かつ分かりやすく示したいというニーズは増えてきそうですし、こういった描画支援系のサービスはAPIやASP/Saasといった方向で出てくるのではないでしょうか。

○脳内の視覚化
mindmapguidlines

Mindmapに代表されるような、脳を整理するアプリケーション群です。これはこれで別エントリでまとめたいほど多くのアプリケーションがありますが、基本はツリー構造のアプリケーションですよね。個人的にはFrieve Editor(画像↓)というのがオススメです。普通のMindmapではツリー構造しか表現できませんが、こちらは多対多の関係を表現できます。

frieveeditor

認知系
Webに限らず、多くの形が考えられそうな領域です。スライドをインタラクティブに作れるツールとか、ワークフローに特化したアプリケーションとか、それこそ無限に考えられます。けれども、人間の脳をいかに効率的に表現するか、という領域に収まる気がするので、認知系とまとめてみました。

3D(3次元)

上記のグラフ化と一線を画すのが、3Dの方向です。2Dの、「人間が紙の上にまとめる」という考え方が、3Dでは「人間がその中で行動する」という考え方になり、よりインタラクティブなアプリケーションが出ています。

ifree3d

iFree3D(to Techcrunch)(画像↑)は立方体空間の中で、Webブラウジングするアプリケーションで、サイトや画像といったアイテムを、より直観的にいじれるように3Dを活用しています。ま

た、FoxTab(画像↓)というFirefox Addonも、今開いているサイトを、3Dで表示してくれます。

foxtab

ブラウザ系
これらのアプリケーションに共通しているのが、ブラウザあるいはブラウザ支援ツールということです。より実世界に近い形でWebを動き回れたらいいんじゃないか、というのは自然なアプローチはな気がします。AR(拡張現実)も注目を集めていますし、IE vs Firefox vs その他Webブラウザ、という構図が大きく変わりそうな気配がします。

————– まとめ —————

datavisualize

こうみると、本当に分野横断的に色々なアプローチ、アプリケーションがありますね。とはいえ、今回まとめたものだけでも、一通りのトレンドを網羅しているように思えます。つまり、新しいイノベーティブなアプリケーションには、イノベーティブなインターフェースも必須になりつつある、ということなのではないでしょうか。

【参考】
こちらのブログ↓では、扱うデータによってでData Vizualizationの視覚化アプローチを7個にまとめています。

» Data Visualization: Modern Approaches | Graphics | Smashing Magazine

  • Mindmaps
  • Displaying News
  • Displaying Data
  • Displaying connections
  • Displaying Web-sites
  • Articles &  Resources
  • Tools and Services

8maki IT, Web, proposal, survey, テクノロジー, デザイン , , , , ,

「情報の可視化」における新しいアプローチ、2次元グラフを動画のように再生

5月 4th, 2009

最近、Data Visualization(情報の視覚化)というテーマで調べ物をすることが増えました。
ようは「データをいかに人がわかりやすく、接しやすいインターフェースで表示するか?」という意味で私は捉えていますが、非常に曖昧な言葉だと思います。Infographicsも「情報の視覚化」という意味で同義な気がします。

Data Visualizationのアプローチで、最もポピュラーなのがデータのグラフ化。Googleが検索結果にグラフを表示(via Techcrunch)するようになったのも記憶に新しいですが、データ描画検索エンジンとも言える、Wolfram Alpha(via Techcrunch)も注目を集めています。

そんな中、2次元グラフの推移を動画のように再生できるようにして、時間推移をわかりやすく表現するサイトがありました。 

» GAPMINDER

デフォルトで、横軸に「一人当たりGDP」、縦軸に「寿命」がプロットされていますが、さらに横軸の下を見ると、時間軸があるのが分かります。以下で5つほど、推移をお見せします。中くらいの大きさの赤い丸が日本なので、注目して見るとおもしろいです。

↓ほとんどの国が同じような位置に。

gamminder-1800

↓欧米(オレンジ・黄色の丸)の国々が右上のほうにシフトしています。
gamminder-1876

↓日本を始めとするアジア諸国が追随しています。
gamminder-1935

↓終戦付近で、日本の寿命がものすごい勢いで落ちています。
gamminder-1945

↓高度経済成長で、日本は世界一の長寿国に。左下のアフリカ諸国の格差が目立ちます。gamminder-2007

。実際に再生して連続で見てみるととてもわかりやすいので是ご覧ください→GAPMINDER

Data Visualization: Modern Approachesにもある通り、様々なグラフ化のアプローチが試されていますが、2次元グラフに時間軸を取り入れて時間推移もわかる3次元グラフにする、というアプローチは非常に有効なのではないでしょうか。意外に使われていないアプローチなので、取り上げてみました。

このサイト自体も、様々なデータを扱っているので、うまく使えば教育等の分野に使えそうですね。

8maki IT, proposal, デザイン , , ,

大規模分散処理を身近に、”Amazon Elastic MapReduce”のビジネス的インパクトは?

4月 3rd, 2009

logo_aws 先ほどAmazon Web Servicesから新しいサービスがBetaリリースされていましたね。

 その名も「Amazon Elastic MapReduce
 

MapReduceというのは、Googleの検索技術を支える分散処理アーキテクチャで、ようは「処理を細かいタスクに分けて、めちゃくちゃたくさんのPCに独立して処理させることで、スパコン並の能力を発揮させられる構造」という感じでしょう。
Amazon Elastic MapReduceのDemoはこちらから見れます。 
(Demoでは、ある文章の単語出現数を計算しています。) 

mapreduce

MapReduceを実装しているフレームワークで一番有名なのが、オープンソースのHadoopです。
商用化など、Tech界隈で話題のフレームワークなのですが、そもそも大規模分散処理用のインフラ技術なので人目につきにくく、ビジネス界隈では見慣れない名前ですよね。

言ってしまえば、「大規模分散処理が身近に!」ということなのですが、ビジネス的にどれくらい身近になるのか未知。
そこで、ちょっと計算してみました。(ものすごい大雑把な計算ですf^^;)

———— 計算 ———–

仮に、セットアップ・維持が3人日、処理が1台のサーバーで7日かかるシステムがあったとします。

するとそれにかかるコストは、だいたいこんな感じでしょうか。

  (セットアップおよび維持中)の人件費+10日分のサーバー費用(AmazonEC2.small:1台とS3:1台)
  =3人日×4万円(人月80万円)+(月8000円÷30×11日+1000円)
  ≒12.7万円 

それが、このAmazon Elastic MapReduceを使うと、だいたいセットアップ・維持に1人日、サーバーを4台使って2日くらいになると思います。すると、

  1人日×4万円+8000円÷30×2日×4台+1000円+MapReduce使用料:1000円くらい?
  ≒4.5万円

コストがおよそ1/3くらいになりますね。
もちろん前者の例ではAmazon EC2を使って、サーバー代をかなり浮かせているため、実質は20万円以上かかると思います。

———— 計算 ———–

小規模な処理だとコスト削減はこれくらいですが、サーバーを数百代、数千台使う処理だと雲泥の差に なるでしょう。

かつ、これだけ簡単に使えるようになると、多くの業者がこのサービスを使ったソリューションを提供することが考えられます。
昔なら100万円以上したECサイトの開設が、今や10万円以下で作れるようになり、販売のビジネスチャンスが大きく広がった、くらいのインパクトにはなりえそうですね。

もちろん重要なのは、この高性能演算システムを安価に使えて何をするか、なのですが。
今は下記くらいしか用法が思いつきません。。。

  • 大規模なクローリングとインデックス化が必要な検索エンジン
  • 機械学習によるレコメンドエンジン
  • データマイニング
  • ログファイルの解析
  • 科学的なシミュレーション
  • 生物学的な実験

まだまだ検索・レコメンドエンジンやアカデミックな領域を出ない分野ではありますが、逆にいえばものすごいチャンスでもあるので、何か面白いプロダクト・サービスを作る会社が出てくるのに期待ですね。

もちろん弊社でもバリバリ狙っていきますがw

なお、MapReduceの技術的説明は、id:nayoyaさんのブログが詳しいです。

※追記 Techcrunchでも紹介されていました。

8maki IT, proposal, survey, テクノロジー, ビジネス , ,

Livemocha,iKnow,Lang-8でネット語学を効率的に

2月 3rd, 2009

最近まで卒業研究で死んでたのですが、やはり海外の論文を読むのに&研究室の留学生の方とのコミュニケーションのために英語が必須となっております。

また、海外のベンチャー事情を調べるにあたり、英語だけでなく中国語やロシア語にも手をつけ始めました。

最近は質の高い語学サイトが充実していて、やり方によっては読み書きはこれでかなり上達できるのではないでしょうか?そこで今回は、最近見つけた Livemocha と、おなじみ iKnow 、そしてLang-8 を使ってみて比較しました。

比較結果

Livemocha

livemocha-top

海外発の語学サイトなのですが、日本語に対応しています。しかもかなり色々な言語に対応しており、対応言語は随一の語学サイトかもしれません。

まず『習う』からコースを始めます。ここでは単語の勉強やリスニングといった、いわゆる一般的な勉強を行えます。

ただこのサイトの特筆すべきところは、コースで課題を提出できるところ。ライティングでは、お題を出されて、それに沿った文章を書き、提出することができます。↓

livemocha2すると、提出言語が得意な人たちが課題にコメントをくれます!提出する際に、得意な人たちにお願い(自動でリストアップされます)メッセージを送ることもでき、すぐさまコメントを残してくれることもしばしば。もちろん私も日本語の課題をレビューすることが望ましいので、自分の課題提出時に、別の人の課題をレビューするようになっています。このように、お互いのレビューをかなりpushして行う仕組みになっています。

また、海外発なので、英語ユーザーの多いこと!これは日本初のサービスに比べるとうれしいところです。

さらに、スピーキングの課題も提出でき、発音の練習ができる数少ないサービスです。

iKnow

iknow-topiKnowは去年から有名ですよね。CEOの方が、かなり個性的で印象的でしたw

iKnowはコミュニケーションというよりも、単語・熟語学習に特化したサイトと言えます。もちろん、日記を書く機能もあり、他の人がコメントをくれたりしますが。

 

コースはかなり充実していて、英語を日本語で学ぶコースは80個もあり、自分の興味ある分野を見つけることができます。ビジネスや留学向けのものが特に充実しています。「プロの英語(ファイナンス編)」はかなりちんぷんかんぷんでしたf^^; 難易度も幅広くそろっていて、語彙力アップには最強のサイトではないでしょうか?

iKnowを運営している会社は、かなり記憶力定着の研究をしているようで、本当に覚えやすいです!

最近は中国語など他の言語にも対応しており(コースはまだありませんでしたが)、今後も期待できるサイトです。

Lang-8

lang8-top

相互添削型SNS とうたっているだけあって、かなりコミュニケーション色が強いです。仕組みはいたってシンプル、日記を書くとその言語の得意な人が添削してくれる、というものです。

 

でも添削エディタが非常に充実していて、添削インタフェースはとても使いやすいです。添削ってなかなか表現が難しいのですが、1文1文分けて表示できるなど、細かい部分で工夫がなされています。

また、SNSのトップページに自分の得意な言語の日記が出てくるなど、相互添削する仕組みも充実しています。何でも、

Lang-8に投稿された日記の9割が常時添削されているという。しかも、早いものだと数分、遅くとも1日以内には日記が添削されるというから驚きだ。

とのことw via ひとりで作るネットサービス

3サイト比較

  Livemocha iKnow Lang-8
語彙 ×
英語コースの単語はまだ貧弱に思えます。まだコース自体も充実しておらず、座学的に単語を覚えたりするのは向かない? やはりコースの充実っぷりは群を抜きます。語彙形成はiKnowで十分!  
リスニング ×
内容自体は語彙と同じコースを利用するのですが、設問形式なのでやりやすいです。 「Dictation」機能はかなりリスニング力が鍛えられます。  
ライティング
課題の提出は分量も少なく、毎日やるにはちょうどいい感じです。 単語を打つ機能はありますが、文章を書くというシーンはあまりありません。 自分の好きな文章を書けるので、かなり融通が利きます。もちろん論文など重すぎるものは難しいかもしれません。日記なので他の人ともコミュニケーションしやすい。
スピーキング × ×
課題ではスピーキングも行えます。とはいえ、文章を読んで発音をチェックしてもらう、というものになります。    

個人的にはいかのような使い分けが一番いいかな、と思います。

  1. 毎日、Livemochaで課題を提出する。
  2. 毎日、iKnowで単語を覚える。
  3. 長めの文章を書きたいとき、あるいは友人を作りたいときはLang-8を駆使。

ただ、ほとんど勉強したことのない言語は、まずiKnowで単語を覚えたほうがいいかもしれませんね。

8maki Web, proposal, survey, 海外, 語学 , , ,

政府系VC?「イノベーション創造機構」

11月 19th, 2008

先日、産学連携関連でお世話になっている方の同行で、経済産業省に行ってきました。

なんでも、イノベーションを促進するために、政府が出資するベンチャーキャピタルの創設を企画中とのこと。
現構想では、そのベンチャーキャピタルには民間のキャピタリストや起業成功者の方を招いて、ファンドを運用していくようです。

構想段階なので、様々な方の意見を聞いて、煮詰めていくということで、そのヒアリングの一環でお邪魔させていただきました。

そもそもそのファンドにふさわしいキャピタリストが日本にいるの?
これが全ての発端で、最後まで尾を引く議題でした。
それは量的にもそうですが、そもそもうまくいっているキャピタルの方が、わざわざ制約の多い政府の金で投資したがるかというと疑問、という集め方の問題もある、と。

シリコンバレーのように、投資対象を厳選し、さらに数社をじっくり面倒見るタイプのキャピタルの少ないこと。
もちろん非常に優秀なキャピタリストさんも独立系を中心にいらっしゃいますが、サラリーマンキャピタリストが多いのも事実。新卒でベンチャーキャピタルに行く友人の周りの内定者話を聞くとげんなりします。
もちろん後者でも投資センスが抜群によい方で結果を残されてる方の話も聞きますが、経営する側としては、突然の営業で来て自分よりも業界に詳しいわけではない人に信頼は置けるかというと疑問。
特に海外のベンチャーキャピタルをウォッチしている人にとっては・・・

また、プレーヤー自身も数が少ない。
大企業の援助をやめて、エンジニアがあぶれさせ、リスクを取って独立するようにするべきだ、という極論も飛び出しましたが、実際起業・独立される方の数が絶対的に少ない。
また、とりあえず社長になりたいという人が多く、本当にCEOにふさわしい人が経営をしている会社が少ない。参考:シリコンバレー訪問7:VC(日本人Founder)

さらにはプレーヤーの中でも初めからグローバル思考の人が少ない
経産省の担当の方は、先日までボストンにいらっしゃって、ボストン周りのスタートアップをめぐって鍛えられるMITのプログラムを見てこられたそうなのですが、日本人が一人もいなかったと。
世界中から応募が殺到しているのに・・・
日本の新興市場に上場するより、初めからNASDAQに上場しようと思うくらい必要なのでは?という意見も。

日本は上場が早すぎる。売上数億程度はシリコンバレーのベンチャーのseries B,Cクラス。
最近も相次いでベンチャーのIPOが発表されて、めでたい話ではありますが、上場しちゃうと黒字を出し続けなければならない。
適切なタイミングでもっと勝負できるようにしないと、本当のBigベンチャーは生まれないのでは?
という市場自体の問題も挙げられました。

と、ここまで話されてきて、分かり始めたのですが、
この本来ならseries B,C程度のベンチャーに、どんと数億、数十億投資できる”規模”の投資ができるキャピタルにしたい、
というのが「イノベーション創造機構」の狙いでした。

この発想自体は非常に共感できます。そもそも日本にはありませんでしたし。
けれども、こんなことできるキャピタリストが日本にいるの?
成功したキャピタリストでも2,3億以上で出資しているという話はほとんど聞きません・・・

結局ヒトの問題に戻ってしまい、本当に仕組みづくりが難しいプロジェクトだと実感。
その金で抜本的にヒトを教育する制度を見直す、支援する方が先かなと思いました。

ただ企画の部署が、投資担当の部署のようで、別の分野の企画をするというのも難しそうな印象を受けました。縦割り。

しかし、難しい難しい言ってても不毛なので、一つ案としてこれぞ!というキャピタルの人に10億1社ずつ投資させてみる、という実験を試してみるのもいいのではないか。
正直、ベンチャー界隈のことなんてやってみないとわからない、というのが事実だと思います。
(そこに投資されるお金は税金なんですけどね・・・そこのコンセンサスもやはり難しい。。。)

と、以上、ベンチャー環境の不満ばかり挙げてきましたが、その後、経産省の方と飲みに行った時の一言。

もっと若い人には反旗を翻して欲しいんだよ、俺は

この方は、学生運動でならした世代の方と良くお会いするそうで、確かに今の若者(自分含む)はおとなしくなった気もします。
逆に言えば、勝てない勝負はしない、スマートになったと言えるかもしれませんが、とはいえ社会に対する我々のメッセージが無さ過ぎるのではないか?

じゃあ、あまりにもおかしな定額給付金について、国会議事堂前でデモるか、とか考えてみましたが、ここはベンチャーに携わる者。
事業で既存のビジネス・体制を破壊する
これが最も重要な信念だと再認識しました。

【参考】
こちらの方が深くこのプロジェクトに関わっているようです。
参議院議員 田村耕太郎 公式ブログ // 政府系ファンド設立奮闘記

8maki proposal, ビジネス, ベンチャーキャピタル, 政治, 社会 , , ,