BL21DE3のブログ

誰に向けた訳でもない自分の備忘録と勉強の軌跡

自己と非自己とCRISPR

もはや一年以上前の話だが、前々回と前回でCRISPR-Casシステムの生理的な役割について書いた。今回の記事ではPAM配列の役割と自己非自己の区別について書く。早く本題に入れという人は1. 本題から読んでください。

f:id:BL21DE3:20210124005339p:plain

今回の主題はPAMというモチーフです

bl21.hatenablog.com

 前々回の記事

 

bl21.hatenablog.com

 前回の記事

0. 前置き

これまでの記事でも説明なく書いたが、CRISPR-Casは原核生物の持つ「免疫系」、それも「獲得免疫系」という説明をされることが多い。そもそも生物は他の生物とのせめぎ合いの中で発展してきた長い歴史を持っており、免疫系とは他の生物と自分を区別し、他の生物からの侵略を防ぐシステムと説明される。免疫系の歴史は古く、動物と植物が一部の防御機構を共有している事から、我々人類がまだ単細胞生物だった頃には既に何らかの防御システムを持っていたと考えられている。ヒトに限定して話を進めると、免疫系の仕組みは大きく自然免疫系と獲得免疫系に分類できる*1。大雑把に言えば、自然免疫系は「何となく怪しいやつを片っ端からやっつけてしまうシステム」であり、獲得免疫系は「既に悪いやつだと知っているやつに限ってやっつけてしまうシステム」である。

この自然免疫系と獲得免疫系によって悪いやつを排除してしまう時に大事なのが、うっかり味方をやっつけてしまわないようにすることである。これは自己と非自己を区別することによって成し遂げられる。例えば自然免疫系ではパターン認識受容体と呼ばれる分子が存在し、自分の細胞には存在しないが病原体は持っている分子を検出することができる。代表例がTLR4で、この分子は細菌に特有の分子であるLPSを検出する。TLR4がLPSを検出するとそれを持っている侵入者を殺してしまうシステムが働き、結果的に細菌が殺されてしまう。また、獲得免疫系においては抗体が武器となって侵入者から自らの細胞を守る役割を担う*2。獲得免疫系には過去に感染してきた侵入者を記憶する仕組みがあり、獲得免疫系において産生される抗体は記憶済みの侵入者が持つ分子にだけくっつく。抗体がくっついた侵入者は何らかの方法で無力化されるため、結果的に抗体は過去に遭遇した侵入者を特異的に無力化することになる。そのため、自らを攻撃してしまうことはない*3

1. 本題 

さて、若干長々と前置きを書いたが、言いたいことは単純だ。我々の持つ免疫系は自己と非自己を区別することができる。そうしないとうっかり自分の細胞を自分で殺してしまうからだ。ではCRISPR-Casは自己と非自己を区別できるか?答えは「Yes」だ。じゃあどうやって?それが今回の本題。

そもそもCRISPR-Casシステムは侵入してきた核酸(DNAやRNA)を切断する仕組みだ。そして切断の対象となる配列はスペーサーと同一の核酸配列である。だがちょっと待ってほしい。スペーサー配列と同じ配列が切断されてしまうのならスペーサー配列自身も切断の対象となってしまう。また、スペーサー配列と相同な配列がうっかり自分のゲノムDNAにもあったらやはりそこで切断されてしまう。それは困る。そこでCRISPR-Casシステムにおいても自己非自己、すなわち自分の核酸配列と侵入してきた外来の核酸を区別する必要があり、そのために用いられるのがプロトスペーサー隣接モチーフ(PAM)と呼ばれる2-5 bpの短い配列である。

今で言うところのPAMが発見されたのは、CRISPR-CasシステムがMGEに対する防御システムではないかと言われ始めた頃である。2005年頃、まずCRISPRのスペーサーがファージのゲノム配列から獲得されたものであることが知られるようになる。今ではこのスペーサーの由来となる配列は、スペーサーの源になる配列という意味でプロトスペーサーと呼ばれるが、研究者たちはこのプロトスペーサーとその前後の配列を並べてみる。そこでプロトスペーサーの近傍の5 bpの領域がACAAA、GTAAA、ATAAAなどの特定の配列に偏っていることに気づいた。しかしながら、この時はこの保存された5bpのモチーフ*4が、何の役割を持つかまではわからなかった。

www.microbiologyresearch.org

↑(今で言うところの)PAMを初めて発見した論文

 

この謎のモチーフにPAMという略称が付けられたのは、CRISPR-CasがMGEに対する防御システムであることが証明された後の2009年。ここで下の論文の筆者らはPAMの配列がスペーサの取り込みに極性を与えている、つまり、PAMの向きとスペーサーとして取り込まれる配列の向きが常に一致することを示した。また、PAMがCRISPR-Casのシステムによって異なることもこの時点で明らかにされる。つまり、CRISPR-Casと一口に言っても連鎖球菌のものと大腸菌のもので全然機構が異なる訳だが、同じように一口にPAMといってもCRISPR-Casが異なればPAMも違う。

www.microbiologyresearch.org

↑PAMを命名した論文

 

その後何やかんやあって、CRISPRがadaptationの過程で外来遺伝子を取り込む際にはPAMが近くにある配列を選択的に切断して取り込むこと、CRISPRを持つ原核生物のゲノム上にあるスペーサー配列は近くにPAMが存在しないためにCRISPR-Casによって切断されないことなどが明らかにされる。また、PAMの存在はCRISPR-Casを応用したゲノム編集を行う際にも制約条件となる。ゲノム編集技術はCRISPR-Casシステムの第三のステップであるinterferenceを利用しているが、この工程においてもCRISPR-CasシステムはPAMが近くにない配列を切断きない。従ってある系を利用してゲノム編集を行う際には、目標とする配列の近くにそのCRISPR-CasシステムのPAMがないとならない。それゆえ、色んなグループがPAMの異なる様々なCRISPR-Casを応用したゲノム編集技術を開発する訳である。PAMの異なる複数の系があれば、そのうち一つぐらいは任意の配列の近傍にあると期待できるのだから。

とはいえ、開発初期はともかく、最近主に使用されている系ではPAMの制約はほとんど取り払われており、あまり気にする事ではないのかもしれない。

2.おまけ

自己と非自己の区別は生物の恒常性維持に重要な役割を果たし、これが破綻すると疾患を引き起こす。この免疫系の破綻は哺乳類においては多発性硬化症のような自己免疫疾患として顕在化するが、CRISPR-Casシステムも哺乳類の免疫系と同様に自己を標的としてしまうことがある。これはself-targetingスペーサーとも呼ばれる現象で、基本的に自分のゲノムを切断して壊してしまうので自身には不利益をもたらす。自己標的型のスペーサーが存在する機構はPAM配列を持つ自分のゲノム配列をうっかり取り込んだり、標的配列を持つ外来遺伝子を排除し切れずにプロファージなどの形でうっかり感染してしまったりしたときなどに生じる。そのままでは不都合なのでスペーサーとして取り込んだ配列に変異が生じたり、スペーサーが抜け落ちたり、Casが機能を失ったりして対処?するらしい。なんともそそっかしい話である。

www.frontiersin.org

↑おまけの話はこちらから

 

免疫生物学(原書第9版)

免疫生物学(原書第9版)

  • 発売日: 2019/03/08
  • メディア: 大型本
 

 ↑(真核生物の)免疫系の話は基本的に『免疫生物学』が出典です

 

*1:ちなみに獲得免疫系は基本的には脊椎動物しか持っていない

*2:細かくいうと獲得免疫系は細胞性免疫と液性免疫に区別できて抗体は後者の武器に過ぎず、細胞性免疫では他の武器を使うが、あまりに本題からそれるので割愛

*3:自らをうっかり攻撃してしまうことが無い訳ではなく、うっかり自分を攻撃してしまう抗体が産生されると自己免疫疾患が発生する

*4:今更ながら説明しておくと、生物学の文脈においてモチーフとは似たような機能を持つDNAやアミノ酸において保存されている配列上のパターンのことです

オンライン学会の発表の注意点!

若干タイトル詐欺だが、オンライン学会で発表することになったので自分なりにオフラインの学会との違いから発表者としての注意点を考えてまとめてみる。なお、書いてる本人はオンライン学会での発表経験がないし、ZOOMとかも(このご時世にも関わらず)あまり使ってないので悪しからず。

1. アスペクト比について

これは最初に考えたこと。普段口頭発表の時は4:3を使うことが多い。これは普段使うスクリーンのアスペクト比を考えてのことだが、そもそも日本で16:9のスクリーンはまだそこまで多く見ない。従って今までの常識的には4:3の方が汎用性が高かった訳だが、オンライン学会は事情が異なる。普通に考えて参加者の多くはスクリーンに投影などしないし、パソコンのモニターにスライドを映すだろう。デスクトップ用の対角27inchぐらいのモニタであればアスペクト比は4:3でも16:9でも変わらないだろうが、少なくない参加者はラップトップの小さい、16:9のモニタにそのままスライドを映すだろう。この時に4:3だとただでさえ小さいモニタの端を有効に使えない。それを考えると16:9で用意した方が親切ではなかろうか。

また、アスペクト比についてはポスター発表は口頭発表以上に要注意だと思う。国際学会ならともかく、日本国内の学会は縦長のA0ないしB0のポスターを作らせることが多い。しかしである。オンライン学会の場合、参加者のほとんどは16:9にしろ4:3にしろ横長のモニタにポスターを映す可能性が極めて高い。このときにポスターを縦長で作ると、全画面表示だとしても画面のほとんどの面積を有効に使えない。オンライン学会の場合、ポスターの形式は学会によって様々な様だが、どの様な場合も横長に作るべきなのは間違い無いと思われる。できれば口頭発表と同じ理由で16:9で作るのが理想だろう。

2. フォントサイズについて

フォントサイズは口頭発表とポスター発表で今までも学会とは求められることが正反対になると思われる。

口頭発表の場合、フォントサイズは今までより小さくして構わない。大会場のスクリーンに映す場合は後ろの聴衆にも読めるように最低でも20pt程度の大きさが必要だが、オンライン学会の場合、聴衆はモニタのすぐそばにいる。多少フォントサイズが小さくても問題はないはずなので、20pt未満のサイズでも問題にはならないはず。

ポスター発表の場合は逆。ポスターサイズの紙で発表する場合はジャンプ率を設定してあえて小さい文字を使い、興味がある人だけが寄ってそれを読めばよい。しかしオンライン学会では小さい文字を読むためにはわざわざ拡大するという手間をかけなければならない。自分はそんな面倒なことをしたくないので、ラップトップの小さいモニタでも(老眼でなければ)読める

ぐらいの大きさのフォントを使うべきと考える。仮にパワポのデフォルトの16:9のスライドサイズを想定すれば、14pt前後が目安だろうか。もちろんこれはスライドサイズ次第なので、スライドサイズの設定が大きい場合はより大きいフォントサイズが必要になろう。

3. 背景色

これは正直正解がまだわからない。

病理医ヤンデル on Twitter: "今までこんな色気のないパワポを作ることは(学術関係であっても)まずありえなかったが、発表の場がZoomになってから話は変わった。背景をグレーにする利点は明らかだし、PC画面ではスクリーン投影とは違い文字を増やしても(学術内容の)理解を妨げづらい。以前の常識が次々覆る… https://t.co/WPYBPxToeC"

グレーが良いという声もあるみたいだが、経験不足故に理由がよくわからなかった。とりあえず今は白にしてる。

4. マイク

散々言われていることなので改めて書くほどのことではないが、念のため。やはりマイクは外付けのものを用意すべきだろう。デスクトップはそもそも付いていないことも多いし、ラップトップは付いていることが多いものの、内蔵マイクは声がこもって聞こえるように感じる。自分は昔のiPhoneに付属していたイヤホンのマイクを使用しているが、内臓よりはクリアに聞こえる、ような気がする。ベストは専用のマイクやヘッドセットを用意することだろう。

5. パワポで作る発表動画について

学会によってはあらかじめ発表動画を作成して、それをアップロードすることを求める場合がある。これは諸刃の剣である。その場で一発勝負ならなあなあで許されるところもあるし、逆にどんな練習したって完璧な発表をできる人は少ないのでそんなに差がつかない。しかし改めて録画できると準備にかけた時間の違いが露骨に出る。気にしない図太い神経がある人は別だが、そうでないなら納得できるまで撮り直す。幸にしてパワポでスライド毎に録画できる。その場合は録画したいスライドで記録を始めて、終了時に次のスライドへ進まずEscを押して記録を終えること。

また、個人的にはスライド切り替え時の間が長いと、集中が切れる気がする。自分の発表の準備の参考にYoutuberの動画見たりしたが、テンポがよくて、集中が途切れにくい。録画終了時後にナレーションをトリミングできるので、間が長いと感じたらナレーションの終了後の間を切ってしまってもよいと思う。その場合はスライドの切り換えのタイミングも調整すること。音声だけトリミングすると、音声が切れてからスライドの切り換えの間に無駄な時間が流れる。ライブ配信でなければ聴衆は巻き戻して聞き直すこともできるので、テンポは基本的に早い方が良いと思われる。最終提出物がmp4なら動画編集ソフトを使って編集するのも手だが、慣れてない人だと余計な手間がかかるだけの可能性もあり。この辺のノウハウは「パワポ 録画 音声」とかでYoutube検索すると参考になる動画が山ほどある。

 

徒然なるままに書いたが、こんなところだろうか。他に思いついたことや入手した情報が有れば追記するかも。

 

 

Apple AirPods Pro

Apple AirPods Pro

  • 発売日: 2019/10/30
  • メディア: エレクトロニクス
 

↑EarPodsじゃなくてAirPods Proにしたらもっと音声が良くなるんだろうか…(ならなそう)

ワクチンと著作権とCRISPRと

Twitterで面白いツイートを見かけた。

灯爺とろおち on Twitter: "『ワクチンでDNAが変わってしまう』←わからないけどまぁ言わんとすることはわかる、わからないけど 『ワクチンでDNAが変わるとその人自身が製薬会社の著作物になる』←ディストピア系SFに一石を投じる天才的な発想。この設定で映画一本作れる。"

巷で話題のRNAワクチンを接種した人のゲノムDNAが変化することはないし、変わったとしてそこに著作権が生じることはあり得ないのだが、話題をDNA配列と知財の関係性に置き換えて少し考えてみる。

まず、知財といえば著作権の他に特許だとか商標だとかもある。そして特許についてはDNA配列が登録されることは山ほどあって、例えば下のリンクにある名古屋大学のグループによる申請がある。

メンテナンス情報 (Maintenance information) | J-PlatPat/AIPN

この例もそうだが、例えば何かの病気の診断目的で行われるPCR法を開発した場合は、用いられるプライマーやプローブの配列が特許の一部を構成する。また、ちゃんと調べてないので断定はしないが、例のRNAワクチンもおそらくその配列が特許の一部として登録されているものと思われる。もちろん人のゲノムDNA自体が誰かの特許になるという状況は考えにくいのだが。

しかしこれはあくまで特許の話だ。DNA配列に著作権が生じることはあるだろうか?

そもそも著作権とは著作物を保護するための権利と言える。では著作物とは何かといえば、日本の著作権法によれば「思想又は感情を創作的に表現したものであって、文芸、学術、美術又は音楽の範囲に属するもの」と定義され、平たくいえば小説や漫画、音楽、演劇、映画、絵画、プログラムなどがこれに含まれる(何事も例外はあるので細かいことは自分で調べてください)。従って最初のところで話題にした「ワクチンによって変化したDNA配列」は思想又は感情を創作的に表現したものとは言い難いためにどう転んでも著作物にはなり得ず、そこに著作権は生じえない訳である。

若干脇道に逸れるが、著作権は"人が"創作したものにしか生じないと考えられる。なぜかと言えばアメリカで実際にそれが争点になった裁判があって、その判例で人以外の動物には著作権が生じないと示されたためである。これはサルの自撮り訴訟という有名な裁判で、カメラを森に設置してサルが半ば偶然に撮影した写真に自らの著作権を主張したフォトグラファーが、人以外の動物に著作権が生じないと主張しサルの自撮りをパブリックドメインとして公開したウィキメディア財団などと争ったもの。詳しい経緯はWikipediaにある。

サルの自撮り - Wikipedia

日本国内では著作権法には明示されていないし、そういう事例があるかわからないが、おそらく同じ見解が示されるのではないだろうか。

さて、話をDNA配列と著作権の関係に戻す。この話題を考えたときに真っ先に頭に浮かんだのが次の論文だ。

CRISPR–Cas encoding of a digital movie into the genomes of a population of living bacteria | Nature

この論文は何をした論文かというと、一言で言えばCRISPRをUSBメモリみたいな情報記録媒体として使うというクレイジー(褒め言葉)なことをやった論文である。まず彼らは静止画のピクセルについて、そのピクセルの位置と輝度をバイナリに置き換えた。それをさらに塩基配列に置き換えると、あるピクセルの位置データと輝度データが1つのスペーサーに記録される。これを全てのピクセルについて行い、各ピクセルのデータをエンコードした合成DNAを用意する。これをCas1-Cas2を持った大腸菌にぶち込むとランダムにいずれかのピクセルの情報を取り込むので、大腸菌の集合体全体で画像データの情報を記録できる。逆に今度はCRISPR座位のDNA配列を片っ端から読むことで、DNA配列のデータから元の画像データをデコードすることができる訳だ。もう少し工夫するとさらに動画も記録できるので、筆者らは映画の元祖とも言うべき馬の走る連続写真をウィキメディア・コモンズから引用して大腸菌に記録させている。

File:Muybridge race horse animated 184px.gif - Wikimedia Commons

さて、ここで記録されたデータはとっくに著作権が切れた、というか著作権という概念があったかなかったか怪しい時代のデータであるため、当然にして著作権は存在しない。しかしである。この大腸菌に保存された動画はなんでもよかった。著作権を有するコンテンツが大腸菌などのCRISPRのDNA配列に保存される可能性も、もはやあると言っても過言ではない訳だ。この手の大腸菌のゲノムDNAを記録媒体にしたり、プログラミングに使ったりする研究が数多く進められている中、DNA配列が著作物を記録する時代も近い、のかもしれない…

Casって何者?

 前回の記事ではCRISPRの役割について説明した。

bl21.hatenablog.com CRISPRの話をする上で避けては通れないのがCasタンパク質である。前回は意図的に具体的な話をしなかったが、今回の記事はCasをメインに説明したい。

前回の記事で説明した通り、CRISPR-Casは外部の脅威=可動性遺伝因子(MGE)に対する防御システムである。そしてCRISPRは過去に遭遇したMGEのデータベースと説明した。データベースだけあってもMGEを無効化するシステムがなければ実際に原核生物の細胞をMGEから守ることはできない。その役割、すなわちCRISPRに保存されたデータと、細胞内に侵入を試みる侵入者の顔=DNA配列を照合し、一致した場合に侵入者を排除する役割を持つのがCasタンパク質である。

ここまで単にCasタンパク質とだけ説明したが、ゲノム編集の話を少しでも聞いたことのある人であれば違和感を持つだろう。ゲノム編集で有名になったのはCRISPR-Cas9システムである。「9」って何?という疑問はあって然るべきである。そう、Casタンパク質はCRISPRに関連したタンパク質の総称であり、単一のタンパク質の名称ではない。現時点で大雑把に分類して10種類以上のCasタンパク質が知られており、一つのCRISPR-Casシステムには3個以上のCasタンパク質が付随している。Cas9はその内の一つである。また、付随するCasタンパク質の組み合わせにより、CRISPR-Casシステムは細かく分類できる。

Evolutionary classification of CRISPR–Cas systems: a burst of class 2 and derived variants | Nature Reviews Microbiologywww.nature.com

↑最新の分類体系。

www.nature.com

↑少し古い分類体系。こちらはResearchgateにPDFあり。

CRISPR-Casシステムの中でも、ここではII型のCRISPR-Casを例にとってその機能を説明しよう。II型を例に取るのは(1)有名なCRISPR-Cas9システムの元となっているのでゲノム編集の話にもつなげやすい、(2)関与するCasタンパク質の種類が少ない(この関与タンパク質が少ないことこそがゲノム編集技術にも応用できた所以である)ため説明がしやすい、(3)研究が非常に活発といったメリットがあるためである。II型でも特に構成タンパク質が単純なII-C亜型のCRISPRを構成するタンパク質としてはCas1、Cas2、そして有名なCas9が知られる。

さて、CRISPR-Casによる防御システムは3つのステップによって構成されている。最初のステップがadaptation、次がexpression、最後がinterferenceである。各ステップにおいて異なるCasタンパク質が働くため、Casタンパク質の役割はCRISPR-Casの各ステップに沿って説明する。

f:id:BL21DE3:20210110231508p:plain

II型CRISPR-Casシステムによる防御の仕組み

第一のステップ、adaptationは、ヒトの免疫でいうところの感作に相当する。この過程ではCRISPRというデータベースに新しいスペーサーとして新規に感染してきたMGEのDNA配列が取り込まれる。このスペーサーの取り込みはCas1タンパク質とCas2タンパク質が一緒になって行う。実はこの二つのタンパク質はCRISPR-Casの間で高度に保存されており、II型に限らずほぼ全てのCRISPRにおいて、新規スペーサーの獲得にはこの二つのタンパク質が関わる。

第二のステップ、expressionは、CRISPR座位のDNA配列を鋳型としてcrRNAと呼ばれるRNA配列を合成する過程である。まずCRISPRの配列全長が転写され、pre-crRNAと呼ばれる長いRNAができる。この長いRNAはリピートに相補的な配列の部分で切断され、短いRNA=crRNAに成熟する。この時、II型CRISPRではさらにtracrRNA*1と呼ばれるcrRNAと相補的な配列を持ったRNAが別に転写される。Cas9とtracrRNAはpre-crRNAと複合体を形成し、これをRNase III*2が切断することでpre-crRNAが成熟し、Cas9-crRNA-tracrRNA複合体が形成される。

第三のステップであるinterferenceはMGEの再侵入時に行われる、感染阻止の過程である。Cas9-crRNA-tracrRNA複合体はcrRNAの配列(すなわちスペーサー)と相補的な配列を持つDNAが再び侵入してきた時に、これを切断してしまう。遺伝情報を保持するDNAが切断されてしまったMGEは感染を成立できなくなるため、結果として原核生物はMGEから守られる訳である。

という訳で、前回「CRISPRのスペーサーは実はウイルスバスターのパターンファイルと同じで、過去に遭遇した脅威=MGEの配列が保存されている。そしてCasタンパク質は新しく入ってきたDNAがCRISPRに保存された配列と一致する場合に、これを直ちに壊してしまうことで原核生物を既知の脅威から守るわけである。」と説明した内容の少し具体的な話でした。ちなみに最近ではバイオ系が専門でない人でも知っているゲノム編集は、CRISPR-Casシステムの3つのステップのうち、最後のinterferenceのステップを応用しているものである。

上で説明した通り、CRISPR-Casを構成するCasタンパク質は分類系統によって異なり、例えばCas9はII型に特徴的なタンパク質で、他の系統には存在しない。では他のCRISPRではどうやって再感染したMGEの核酸を切断するかというと、例えばI型ではCas3が切断の役割を担うなど、(Cas1-Cas2がほぼ共通していることを除けば)それぞれの系統で異なるタンパク質が各ステップで機能している。逆にCasと名のつくタンパク質であれば基本的には上の3つのステップのどこかで機能していると考えて良い。詳しい話は上でリンク貼った引用文献で。

CRISPR-Casシステムに関連したトピックとして「自己非自己の識別」や「ゲノム編集技術」、「自己免疫的なスペーサー」なんかがある訳だが、それはまた今度。

*1:本当はII型でもtracrRNAを欠くものがある

*2:CRISPR-Casの構成タンパク質には含まれず、より普遍的な役割を持つタンパク質

CRISPRはウイルスバスターのパターンファイルだよ、というお話

今の所属先はジャーナルクラブがあまり頻繁に回ってこない。しかも今年は新型コロナのせいで延期・中止が頻発し、結果的に一度も回ってこなかった。そこで5年眠らせていたこのブログを掘り出して(気が向けば)1人ジャーナルクラブをやりたい。内容はCRISPRに関連するもの。しかしいきなり始めてもそもそもCRISPRって何?ところから始めないとならないので、とりあえず、この記事でCRISPRとは何かということを説明したい。なお高校生物ぐらいは概ね理解している人を読者として想定している。「RNA?DNAのこと?」とか、「ウイルスと細菌って何が違うの?」とか思ってしまう人にはちんぷんかんぷんかもしれない。

2020年度のノーベル化学賞はエマニュエル・シャルパンティエとジェニファー・ダウドナの2人に送られた。この2人の受賞理由は「ゲノム編集手法の開発」であり、このノーベル化学賞を受賞した技術の背景にあるのがCRISPR、あるいはCRISPR-Casシステムである。ゲノム編集についてこの記事では説明しない。(気が向けば)別の記事で説明する。

本題。CRISPRとは何か。一言で言えば「原核生物が持っているゲノム上の反復配列で、可動性遺伝因子に対する獲得免疫機構の構成要素の一つ」である。

では、もう少し丁寧に説明しよう。原核生物とは細菌と古細菌のことである。これらの生物は単細胞であり、原則的に核膜を持たないなど、我々を含む真核生物とは異なった構造を持つ。

CRISPRがそんな原核生物のゲノム配列から発見されたのは1978年に遡る。発見したのは現在九州大学に石野良純先生。ただ、当時はiap遺伝子という酵素遺伝子のことを調べていた時にたまたまゲノム配列上に見出したよくわからない謎の配列という扱い。当時はDNAの配列を読むのも一苦労な時代だったこともあり、また今とは比較にならないくらいデータベースも限られていたので、機能がわからなかったのも無理はない。

jb.asm.org

↑はその時の論文

一方、機能が不明ではあったが、この時点でCRISPRの構造的特徴はすでにほぼ定義されている。CRISPRの構造的特徴は、下の模式図に示した反復配列(リピート)とリピートの間に挟まれたスペーサーの組み合わせにある。単細胞多細胞を問わず、生物のゲノムに同じ配列が繰り返される反復配列が見出されるのは珍しいことではない。しかし、繰り返しの単位であるリピートが規則正しく等間隔に間=スペーサーを開けて並ぶ構造はあまり一般的ではないと思われ、CRISPRに特徴的である。

f:id:BL21DE3:20201224224501p:plain

当初は大腸菌で発見されたCRISPRだが、その後細菌や古細菌の間で普遍的に存在する構造であることが徐々に明らかにされる。また、2000年代初頭までにはインターネットの普及もあってDNA配列のデータベースがかなり拡充し、既に解読済みのゲノム配列と新規に読まれた配列の比較が容易になる。こうした技術的な進歩を背景に、CRISPRの近傍にCRISPR関連タンパク質(Casタンパク質)と呼ばれるタンパク質の遺伝子があることが明らかになり、また、CRISPRのスペーサー配列がファージやプラスミドに由来することが判明する。

ファージは原核生物に感染するウイルス。ウイルスというと近頃はウイルス=コロナウイルスぐらいの勢いで語られがちだが、ファージは細菌や古細菌にしか感染せず、ヒトやその他の動物には感染しない。そして下の模式図のような、SFの映画に出てくる宇宙船みたいな形をしている。

https://upload.wikimedia.org/wikipedia/commons/1/11/Bacteriophage_structure_ja.png

user:Y_tambe, CC BY-SA 3.0, via Wikimedia Commons

プラスミドは細菌が持っている、ゲノムDNA以外の遺伝情報を保持する環状の短いDNA。例えば大腸菌の全ゲノム配列はおよそ5×106塩基長程度だが、プラスミドは(ものによってかなり幅があるものの)103のオーダーと考えて良い。プラスミドは、細菌の増殖に必須ではないが特定の環境下において役に立つ遺伝情報を持っていることが多い。

ファージやプラスミドは可動性遺伝因子(英語表記の略称でMGEと呼ばれることが多い)とも呼ばれ、ある系統から別の系統に遺伝子を移す働きを持つ。あるPCから別のPCにデータを移すUSBメモリみたいなものである。

f:id:BL21DE3:20201228222442p:image

ところで、ファージやプラスミドは原核生物にしてみれば余計なものであり、できれば受け入れたくないものである。ファージは感染した原核生物を殺す*1し、プラスミドは役に立つことが多いものの、発育に必須ではないため、役に立たない状況下では単なるコストである。ノートPCにバスパワーの外付けHDDを使いもしないのに付けていたら無駄に電源が消費されて、電池切れが早まるだけである。それと同じ。

従って可動性遺伝因子にはできれば感染したくない。そこで働くのが原核生物のもつ「免疫系」の仕組みである。そしてCRISPRはCasタンパク質とともに、原核生物の「免疫系」の一部を構成する。この「免疫系」は外部から余計なデータが入ってこないようにPCを守るウイルスバスターみたいなものと思えばよい。

f:id:BL21DE3:20201230014809p:image

余談だが、セキュリティソフトがウイルスバスターだけでないように、原核生物の持つ「免疫系」の仕組みもCRISPR-Casだけではない。最近では使用頻度が激減中の制限酵素分子生物学の実験系で特定の核酸配列を切断するために使われてきたEcoRIとかNotIとかそんな名前のついているあの酵素たちである)は最もよく知られる防御システムのエフェクターである。制限修飾系と呼ばれるシステムの詳しい説明は分子生物学の教科書に書いてあるので、ここでは説明しない。

さて、ウイルスバスターのようなセキュリティソフトはどのようにPCを外部の脅威から保護しているかご存知だろうか。実はウイルスバスターのようなセキュリティソフトも全くの未知の脅威からPCを守るのは難しい。そこでパターンファイルと呼ばれるPCに悪影響を及ぼすファイルのデータベースを作成しておく。そして何らかの方法で入ってきたファイルがパターンファイルに登録されていたものと類似する場合は、そのファイルを隔離したり削除したりすることでPCを脅威から守る*2

CRISPR-Casはまさにこのウイルスバスターと同じことをする。CRISPRのスペーサーは実はウイルスバスターのパターンファイルと同じで、過去に遭遇した脅威=MGEの配列が保存されている。そしてCasタンパク質は新しく入ってきたDNAがCRISPRに保存された配列と一致する場合に、これを直ちに壊してしまうことで原核生物を既知の脅威から守るわけである。これが実験的に証明されたのが2007年のことである。

CRISPR Provides Acquired Resistance Against Viruses in Prokaryotes | Science

↑非常に有名な2007年の論文。リンクは貼らないがresearchgateでPDFが入手可能。

という訳で、CRISPRをウイルスバスターのパターンファイルに擬えて、その役割を説明した。次回(があるのかはわからんが)は実際にCRISPR-Casがどのように外部の脅威から原核生物を守るか、もう少し詳しく説明したい。質問や間違いの指摘はコメント欄まで。

*1:厳密にはそうとも限らないが、ここでは割愛

*2:とは言うものの筆者は情報系の専門知識はほとんどないので間違っているかもしれないが、ご了承ください

EYES WIDE SHUT

EYES WIDE SHUTを買った。中古で。前にレンタルで借りて観たことがあったのだけど、380円とかいうあほみたいな安さにつられて買ってしまった。

それを2,3日前に観たのだけど、同じ映画でも二度観ると新たな発見があるものだ。

この映画は大雑把に言ってしまえば、主人公ビル(トム・クルーズ)が妻であるアリス(ニコール・キッドマン)*1を裏切って浮気しそうになるんだけど結局しないというストーリーなのだけど、その間にやたらエロチックな謎の儀式*2があったりして、かなり怪しげな雰囲気を漂わせている。

で、その怪しい儀式とは別にビルの浮気相手になりかける女の子がいるのだけど、路上でビルをひっかけるその女の子はルームメイトが留守にしているアパートにビルを連れ込む。女の子はビルに150ドルでセックスしようとビルに持ちかけ、ビルも一度は同意するのだけど、ビルは結局キスしただけで帰ってしまう。

そんな女の子の部屋の棚の上に置いてある本のタイトルが映る。その本のタイトルは"Introducing Sociology"。入門社会学と訳したらいいのだろうか。男を家に連れて売春を持ちかける女の子はきっと高等教育を受けているのだろう。自分はそこに妙な生々しさを感じてしまった。

改めて観ると、キューブリックの芸の細かさに驚かされるばかりな二時間半だった。
アイズ ワイド シャット (字幕版)

アイズ ワイド シャット (字幕版)

*1:ちなみにトム・クルーズニコール・キッドマンはこの映画撮影時実際に夫婦だった

*2:おそらくこのシーンの存在故にR18指定