5/30(土)に「Code for 青空文庫」アイデアソン #1 に参加してきました。
ITmediaニュースさんでも取り上げられ、話題になっていたイベントで補欠登録していたのですが、繰り上がりで参加させて頂けることになり、参加してきました。
本が好き(大学の頃は文芸部に所属していたくらい)で、青空文庫さんのテキストを読ませて頂くこともあったので、エンジニアとして何か力になりたいという想いがあったので、こういうイベントに参加できただけでも嬉しかったです。

「Code for 青空文庫」アイデアソン #1
https://atnd.org/events/66230

エンジニアなし、サーバ老朽化――「青空文庫」を支えるためのアイデアソン開催 | ITmediaニュース
http://www.itmedia.co.jp/news/articles/1505/14/news140.html

イベントのレポートは、既に鷹野さんがしっかりとしたレポートをまとめてられているので(速い!!)。このエントリでは個人的な感想を中心に書きたいと思います。

青空文庫を救え!「Code for 青空文庫」アイデアソン #1 レポート #aozorahack
http://www.wildhawkfield.com/2015/05/save-the-aozora-library.html

午前の部(セッション)

午前中は青空文庫の現状についての説明などのセッションでした。

青空文庫からご挨拶

最初は、青空文庫の大久保さんから「そもそも青空文庫って」というお話。

以下の4つの切り口で青空文庫の考え方をお話頂きました。

  • Universal Texts
  • Open Air Shelves
  • Digital Scribes
  • Hommo Communicans

個人的に解釈すると『自由』『共有』がキーワードなのかなと思いました。
Hommo Communicansのところで、「読まれる自由」「活用される自由」と話されていたところが印象的でした。「活用する」という言葉にテキストの未来の可能性を感じます。

他に、課題意識として以下のような点にも言及されていました。

  • 日本語マークアップとしての「青空文庫注記」をもっと活用できるのではないか?
  • ボランティア活動として無理はしない、電子写本という大がかりな話だけで無く簡単に誰でも参加出来るマイクロボランティアを広げられないか?

青空文庫注記は日本語文章をテキストファイルで記載する際には、とても参考になる情報で、いろいろなところで活用出来る可能性があると思います。
大学生時代に文芸部で編集担当していたのですが、テキストファイルで集めた原稿の改ページとか段落とか、原稿書いた部員に印刷した原稿渡して赤ペンで印入れながらやりとりしていたのを思い出します。が、関係者が増えたりシステム化が必要になるとこういうルールは必要になってくる(そもそもどういうルールが必要なのかを整理するのも大変なこと)。

参考)注記一覧 - 青空文庫
http://www.aozora.gr.jp/annotation/

青空文庫の技術的な今と将来

次に、このアイデアソンの発端となった、青空文庫の現状のサーバについて。

青空文庫のサーバがヤバいということで「急いで対応しなければ青空文庫で公開されているテキストが無くなってしまうのではないか?」 というようなイメージが広まってしまっていましたが。青空文庫で公開されているテキストはバックアップされているので大丈夫とのこと。
今回、主に問題になっているのは公開側でなく、入力・校正を司る校正システム側の保守の問題。公開前の編集中データ・校正の担当者・進捗・履歴などの情報のバックアップ運用や、サーバが古くなっていて移行が必要だが、エンジニアが居ない、お金を払って発注しようにも要件をまとめられるノウハウが無いなどという部分に問題があるということ。

参加者のコメントで「『公開されているテキストが無くなってしまう』というような問題では無くてホッとした」というのがありましたが。その通り、ひとまずホッとしました。
もちろん校正の管理情報も青空文庫の活動のための重要な情報ではありますが。

校正システムサーバの現状

校正システムサーバの現状ということで、サーバを見て現在確認出来ていることを共有頂きました。

現状データベース(PostgreSQL)からのエクスポートと、新バージョンのPostgreSQLへのインポートは、ひとまず問題無く出来ましたよ。という報告。
まだ見始めたばかりで全貌が見えていないという感じでしたが、参加者されている皆さんは、ここにかなり興味があったようで(当然ですが)、質問が活発になされていました。
個人的に思うのは、システム移行した後のユーザ利用を想定した動作テストで確認すべき点が整理されているかどうか、整理するための元ネタがあるかどうか、あたりが気になりましたが。いろいろ話を聞いていると、実際に校正システムを使ってみて把握するくらいしか無さそうな感じでした。コードから現在の機能を全て追うという方法もありますが、実際に使っている機能(だけ)を使えるように確認しておくという省力アプローチも有効かもしれないな、とか。

午後の部(アイデアソン)

午後はアイデアソンということで、インフラ・アプリ・マネジメントという分科会に分かれて、3年後の青空文庫のあるべき姿のためにということでアイデアソンを行いました。

私は、アプリ分科会のAPI・オープンデータ系のチームでアイデアを出し合い、発表してきました。
青空文庫のAPI提供するなら「本文」のデータが提供出来ることが特徴。本文を活用するためにテキストの位置を指し示すURIを定義すれば、同じ場所を引用したブログ同士が繋がったり、友達の誰が今どの部分を読んでいるかなどを共有できたりして、読書のSNS的な広がりが出来て面白いのでは無いか?というのがアイデアの主な部分。

いろいろなチームの発表がありましたが、アイデアソンにしては突飛なものがあまりなくて、堅実なアイデアが多かったと思いました。
「青空文庫で何か面白いことをしよう」というよりも「青空文庫にエンジニアが居ないなんとかしなくては!」という想いで参加した人が多かったからなのだと思います。
自由や共有の考え方がある青空文庫というものとインターネットの仕組みは、すごく相性が良いように思うので、そういう気持ちで考えていけば、もっと面白いことが出来る可能性もあるんじゃないかなと考えさせられました。

懇親会にも参加させて頂き、いろいろな話を伺ったり、意見交換などが出来て、とても充実した一日でした。