銀塩フィルムによるデジタルデータ・アーカイブとTCA(Total Cost of Archive) 1/3
最近、クラウド・コンピューティングの発達によって、デジタル・ストレージの価格は劇的に下がりました。その一方では、原発の停止にともない「電気の値段」を考えさせられるこの頃です。宇宙もそう言われていますが、情報爆発の後には収縮の時代がやってくる可能性があり、その対策を考えておく必要があると思うのです。
銀塩フィルムによるデジタルデータの保存
医療情報システムが扱う情報はどんどん増えており、今後はその長期保存を確実にすることが問題となってきます。現在、デジタルストレージのカスケードは、オンラインの高速ハードディスク、ニアラインの低速ハードディスク、オフラインの光磁気ディスクや磁気テープの順で低価格化していきます。しかし、その最後にあるオフラインメディアは、メディアの劣化や装置の生産停止などのため、ひとつのメディアではデータを10年保存することも難しく、30年以上のデータ保存のためにはメディアの継代が必要になります。クラウド・コンピューティングが発達しても、オンライン・ストレージの価格は無限には下がりません。ムーアの法則も無限ではありません。
いっぽう、映画用のアーカイブフィルムは、低温低湿の環境に保存しておけば50年くらいはメディアを放置できると思われます。密閉して涼しい山中のトンネルにでも保存しておけば電気代ゼロで保管できます。ETERNA-RDSから学んだ第一の性質は、デジタル保存よりアナログ保存の方がローコストになりうるということです。30年や50年といったスパンでのデータ保存を考えるときには、Total Cost of Archiveの考え方が重要になります。ここではTCAと略してみましょう。
TCAは保存期間ごとに異なってくるでしょうから、TCA10、TCA25、TCA50、TCA100といった単位で推計すると良いと思います。TCA50を例に取ると、データを50年間保存するための1GBあたりのcostという定義にしてみました。
保存データ量の計算
デジタルデータを映画用の白黒フィルムに保存するということは、超高密度のグレースケール二次元バーコードを撮影することを意味しています。ドキュメントのイメージをマイクロフィルムに記録することとは別です。
まったくの素人のため乱暴な計算ですが、ひとコマの35ミリフィルムには10Mega Pixelくらいは楽に記録できるでしょうから、そこに8bit 256階調の2次元バーコードを記録したとすると2.5Gbitとなります。様々な安全やエラー訂正のために4bit 16階調にしても、160Mbitです。二次元シンボルにはさまざまなエラー対策があるでしょうし、リファレンスの各階調ドットがあれば後の補正も難しくないと思うので、4ビット以上記録できるような気もします。これを1秒間に30コマの撮影ができたとすれば、4.8Gbit/secのレートで記録できる計算になります。なんだか話がうますぎるような気もしますが、60分の映画フィルムに2.16TB(テラバイト)のデータが保存できることになります。
ここで問題となるのは、フィルムに記録された10Mピクセルの画素を一つ残らず正しく読み込めるかと言うことで、正確に読める解像度を見つける必要があると思います。
読み書き速度についても、アーカイブですので1秒30コマである必要はありません。
見読性の持つ意味
ETERNA-RDSが教えてくれたもう一つの重要なことは、電子保存の4要件のうち、見読性を保持するためにはビット単位の完全性は必要ないということです。ETERNA-RDSに記録された映画を100年後(訂正:1000年後)に再生したとき、ある程度色褪せていても映画の価値はさほど失われません。もちろん画像補正で100年前(訂正:1000年前)の画質を再現することも難しくないでしょう。同様に、銀塩フィルムに保存されたデジタルデータは、経年劣化してエラーが多発しても、画像処理的手法で復元できるかもしれません。
更に面白いのは、映画のフィルムはhuman readableだということです。フィルムの最初の方の何コマかにわたって、このフィルムに記録されているデジタルデータのエンコード法についてのdocumentを焼き込んでおくことができます。現在の磁気テープが1000年後に発掘されたとしても、そのデータ記録法を解読することは容易ではありませんが、銀塩フィルムなら虫眼鏡があれば充分なのです。
いろいろ考えは尽きないのですが、今日はこのあたりでやめておきます。次のような内容も追記したいと思います。
・TOSを彷彿とさせる高速シーケンシャルアクセス
・課題はスキャナの精度と速度か
おまけ
Total Cost of Archive 略してTCAですが、英語も、カタカナの「トータルコスト オブ アーカイブ」もネット検索しても出て来ません。この概念は言葉にされていなかったのでしょうか。ストレージコストの指標というのはありそうなものですが。またぞろ「機種依存文字に続くヒットか」などと期待しています。いつの日か日経コンピュータの表紙を飾る日が来るといいな。
続報
銀塩フィルムによるデジタルデータ・アーカイブとTCA(Total Cost of Archive) 2/3 銀塩フィルムによるデジタルデータ・アーカイブとTCA(Total Cost of Archive) 3/3 (Bits on Film とTotal Cost of Archiving)
リンク: 【開発物語】富士フイルム アーカイブフィルム「エテルナ-RDS」 (1/6ページ) - SankeiBiz(サンケイビズ).
デジタルセパレーション用白黒レコーディングフィルム「ETERNA-RDS」の開発(FUJIFILM RESEARCH & DEVELOPMENT(15-21:No.57-2012)
リンク: 舞子の浜 私のコンピュータ事始め.
リンク: マイクロフィルムとは/富士マイクロ株式会社.
リンク: デジタルデータをマイクロフィルムにバックアップするサービス.
リンク: 2次元シンボルの印刷品質/2次元コードとは/バーコードの基礎知識/情報ライブラリ/ユニダックス株式会社.
| 固定リンク | 0
コメント