覚え書:「今週の本棚・新刊 海部宣男・評 『カルチャロミクス−文化をビッグデータで計測する』=エレツ・エイデン、ジャン=バティースト・ミシェル著」、『毎日新聞』2016年04月03日(日)付。

Resize1636

        • -

今週の本棚
海部宣男・評 『カルチャロミクス−文化をビッグデータで計測する』=エレツ・エイデン、ジャン=バティースト・ミシェル著
 『カルチャロミクス−文化をビッグデータで計測する』
 (草思社・2376円)

人文資料のデジタル化、今が好機
 インターネットで、「Google Ngram Viewer(グーグル・Nグラム・ビューワー)」のページを開ける。キーワードは要らない。記入欄に、(関心に応じて何でもよいが)試みに、Japan, China, Koreaと書き込んでみよう。「検索(search)」ボタンを押す。西暦1800年から2000年までを横軸に、三つの国の折れ線グラフがさっと出る。この間に出版された800万冊の本の中の、三つの国名の出現数の変化のグラフである。つまりこの図は、20世紀までの200年間の英語圏における、日本、中国、韓国への関心の推移を示すのだ。中国のはるか下にあった日本の名が明治維新から上昇を始め、1980年代にほぼ追いつく様子が分かる。日露戦争、第一次、第二次両大戦と、戦争ごとに日本と中国の出現数は跳ね上がっては下がる。英語圏の著作者たちの「極東」への関心のありようが、推測されよう。韓国は朝鮮戦争で上昇をはじめ、最近は日本、中国の3分の1くらいだ。

 世界的な科学者たち、漱石など日本の著名作家、環境……。書き込むとさっとオリジナル・グラフが出る快感に、あれこれグラフを書かせていると、病みつきになること必定だ。この「Nグラム・ビューワー」は、2010年にグーグルが公開し、24時間で300万ヒットした。世界で大人気だが、簡体字中国語など8カ国語で用意されているものの、日本語版がないのが残念。

 本書は、2人の若手人文学研究者による「Nグラム・ビューワー」の開発物語。それと同時に、「全書籍のデジタル化計画(グーグル・ブックス)」のデータによる、人文科学の「計測可能な研究」を宣言する本なのだ。それを彼らは、「カルチャロミクス」と名付けた。

 彼らはハーバートの大学院生、研究目的は言語の進化論だった。不規則に時制変化する不規則動詞の歴史的な変化を追ううち、彼らは進行中だった「グーグル・ブックス」のデータを使えないかと思いつく。数百年に及ぶ膨大な書籍データの言語検索で生まれる、計測できる文化研究! 思いがけない可能性の展開、大成功の興奮、ビッグデータの使用の困難。それらが、「Nグラム・ビューワー」の多彩な応用をおりまぜて展開される。世界的「名声」はどのように高まり、消えてゆくのか。大きな発明は、何年で世界に広まるのか。注意深く扱うと、大きな法則性が確かに見えてくる。自然現象にも通じる法則性だ。

 「弾圧」の効果のグラフには、息をのむ。ナチス政権下、「ドイツ民族精神」の名による現代絵画への弾圧は、ドイツの書籍からシャガールなど現代芸術作家の名前をきれいに消し去った。スターリンによる粛清、米議会の非米活動委員会の映画人ブラックリストの効果も、「Nグラム・ビューワー」ではっきりあぶり出される。中国文献に見る「天安門」は、当局による言論弾圧の効果を示して、不気味でさえある。

 書籍だけでなく、多様な歴史資料のデジタル化は人文科学に前例のない機会を与えると、著者は説く。「人文科学の分野でビッグサイエンス流の研究に乗り出すならいまなのだ」とも。

 全く同感だ。いま日本でも、規模はグーグルに及ばないが30万点の日本語典籍のデジタル化を、国家的「大型プロジェクト」の一環として進めている。ビッグデータの使用にまだ障害は多いが、「Nグラム・ビューワー」やその拡充をきっかけに、人文科学の新時代を期待したい。

 読みだしたら止まらない、刺激的な本。巻末に、関連研究の解説がある。(阪本芳久訳)
    −−「今週の本棚・新刊 海部宣男・評 『カルチャロミクス−文化をビッグデータで計測する』=エレツ・エイデン、ジャン=バティースト・ミシェル著」、『毎日新聞』2016年04月03日(日)付。

        • -





今週の本棚:海部宣男・評 『カルチャロミクス…』=エレツ・エイデン、ジャン=バティースト・ミシェル著 - 毎日新聞








Resize1170



カルチャロミクス;文化をビッグデータで計測する
エレツ エイデン ジャン=バティースト ミシェル
草思社
売り上げランキング: 4,224