DNAデータ・ストレージ
すべては遺伝子に組み込まれている:DNAこそ データストレージ問題を解決する鍵
データは現代の経済のDNAとも言える存在です。 これに取り組んでいる科学者たちの研究が実を結べば、まさにその通りになります。
情報社会は、私たちの生活をあらゆる面で全く変えてしまいました。
一方デジタル技術革新により、新たな問題も生まれています。 特に厄介なのは、電子機器が日々生成する膨大な量のデータをどこに格納するかという問題です。
IDCの記憶装置の需要に関する試算では、2009年には4千億ギガバイトでしたが、2017年には14.8兆ギガバイト(=1万4,800エクサバイト)と急増しています。 この数字は毎年3分の1ずつ増加すると推定されています。
既存の技術では、持続不可能です。 近年、記憶装置のコストが劇的に安価になってきたとは言え、日々膨大なデータが生成される中、広大な設置スペースを取り、経年劣化が不可避な従来型電子アーカイブシステムを使用し続けることは一層困難かつ高価となっています。
英国ケンブリッジに本拠地を構える欧州バイオインフォマティクス研究所(EBI。欧州分子生物学研究所(EMBL)の一部門。以下、EMBL-EBI)のニック・ゴールドマン(Nick Goldman)博士を始めとする研究者が、これまでにないソリューションを模索し始めたのは、このような事情が背景にあります。 まるでDNAを取り扱うように、解決策の開発に取り組んでいます。
ゴールドマン博士は、DNAを“高密度情報暗号化能力、耐久性、実証済みの情報保持能力”がある、素晴らしい可能性を秘めた記憶装置装置と見ています。
何百万年もの時の中で進化を求める圧力に常にさらされてきたDNAは、膨大なデータを保存できる極めて効率的な手段です。DNAはこの膨大な情報に基づいて、タンパク質やその他の構成物質、ひいては複雑な有機体を作っていきます。
すべての遺伝情報は、DNAを構成する4種類の分子単位の長いらせん構造で暗号化されています。これは、CDやスマートフォンが撮る写真など、インターネットを始めとするデジタル機器が「1」と「0」で信号を構成されていることとかなり似ています。
ゴールドマン博士は、DNAらせん構造を記憶装置として採用するアイデアを最初から思い付いたわけではありませんでした。 世界中から送られたゲノム専門家が生成したDNAデータをEMBL-EBIで分類していると、保存できる以上の遺伝子情報があることに気が付きました。
「私が働いている研究所では、世界中の科学者が生成した遺伝子情報をパソコンに落とし込んでいく作業があります。 しかし、この作業は、 毎日膨大な情報が生成されるため、かなり厄介な問題となっていました」と、ゴールドマン博士は言います。

ゴールドマン博士が同僚と考えあぐねていると、素晴らしい記憶装置問題解決策をずっと見過ごしていたことに気が付きました。そう、DNAこそが解決策でした。
DNAは生物暗号だけではなく、 あらゆる 情報を保存できることに気が付いたのです。
ゴールドマン博士率いるチームは、1つのユニットとその相補で構成される180の塩基対からなるDNAのデータパケットを構築しました。こうしてできた鎖は二重のはしごのような形態、つまり二重らせん構造となりました。 この塩基対のうち、約100対は実際に保存される情報を暗号化し、20対はそのインデックス用、残りの対はこのプロセスの実行を促すために使用されます。
「難しいのは最初の転写です」と、ゴールドマン博士は言います。 「最初の転写が上手く行けば、その後の転写は簡単です」

「当初、この技術は、現在ある大切なデータのバックアップを確実な場所に保管するために使用される予定でした」とゴールドマン博士。 既存の技術は経年劣化する上、新しい技術が次々と現れる中、あっという間に古くなってしまいます。
たとえば、磁気記憶装置は、技術の進展に伴い旧型システムとみなされるようになるでしょう。そして、旧型システムに保存したデータはそのうち読み出すことができなくなってしまいます。 今日、フロッピーディスクが使えるパソコンを誰が持っているでしょうか。 8トラックテーププレーヤーはどうでしょう。
一方、DNAは地上に生命が誕生してからずっと存在しています。 また、耐久性にも優れています。
「DNAは乾燥した状態で保管することが重要です。 らせん構造は水で破壊されてしまいます。 理想的には、氷点下で保管すると良いでしょう」とゴールドマン博士は言います。 「放射線による変形を防ぐために、暗所に置くと良いでしょう。
このような環境の下で保管すれば、何世紀と情報を保存することができます。
グリーンランドの氷層の下から採取された一部のDNA検体は、50万年前のものと推定されています。ー 恐竜のDNAでさえまだ発見されていないのに。
さらに、DNAは極めて効率的な記憶装置で、1グラムで2.15億ギガバイトのデータを格納でき、人類がこれまで記録してきたすべてのデータを郊外の住宅のリビングルーム1室で保管することができます。
実に、DNAは1つの配列に4ビットがあり、2ビットしかない従来のバイナリーコンピュータよりも多くの情報を圧縮することができます(詳細は、下記のイラストを参照)。
魅力的な可能性の一つは、生き物のDNAにデータを書き込むことだとゴールドマン博士は目を輝かせます。
小規模にはこれは既に行われています。 たとえば、芸術家のエドワルド・カック(Eduardo Kac)は創世記の1文をDNAに翻訳し、これを細菌に移植しました。 また、自分のイニシャルをトレードマークとして遺伝子組換え有機体に書き込んだ人もいます。
しかも、ハードドライブにバグが入る心配はありません(現在の記憶装置ではバグが大量発生しています)。 生物が大量データの記憶装置となることはないでしょう。 ほとんどの有機体が長い“ジャンク”DNA(科学者がその目的をまだ解明できていないか、重複しているDNA)配列を持っています。「生物に移植できる“ジャンク”には限りがあります」と、ゴールドマン博士。
有機体があまりにも多くのDNAを持つと、マイナス面が現れます。 細胞が分裂する度、すべての追加されたDNAが生物学的に必要な暗号と共に複製されますが、この際にエネルギーを消費します。 また、細胞分裂が起きる度、変形リスクが発生し、暗号化されたDNAを歪めてしまうリスクがあります。 つまり、何世代も後になって、まるで伝言ゲームみたいになってしまう可能性があります。
これまでの所、DNA記憶装置はほとんどがまだ研究段階です。
「この技術の導入を希望する企業数社が興味を示しましたが、コストがかかりすぎるため取りやめとなりました」と、ゴールドマン博士は説明します。
DNAへの読み書きコストは近年大幅に低下しているとはいえ、従来のコンピュータ型記憶装置とは比べ物にならない程高価です。
たとえば、21世紀初頭に行った初の完全な人の遺伝子配列決定には数十億米ドルかかりましたが、 現在でもこの技術に約1,000米ドル、最も効率的な暗号データのDNAへの書き込みには1メガバイトあたり約3,500米ドルかかります。 また、データの読み出しにはその10分の1の費用がかかります。 一方、従来の記憶装置であれば、1,000メガバイトあたり1米セントで収まります。
別の問題もあります。 たとえば、最近、ワシントン大学の研究者が悪意のあるソフトウェアの鎖を暗号化し、商業機により配列決定されたDNAに書き込みました。 そのソフトウェアは遺伝子シーケンサのプログラムを書き換え、コンピュータを乗っ取ってしまいました。
その一方で、DNA記憶装置をより安価で、より一般に普及させるためのドライバーが市販されるようになり、その数は増えています。 Microsoftは実践的なDNA記憶装置の10年後の発売を目指しています。 また、Microsftと共同で開発を進めているTwist Bioscienceを始め、DNAScript、Nuclera Nucleics、Evonetix、Helixworks、Genome Foundryなどの企業もDNA記憶装置の開発に取り組んでいます。
今日の技術革新速度から推察するに、現在可能と思われているよりも早い時期にDNA記憶装置は一般に普及するかも知れません。