シングルセルRNA-Seq解析

シングルセル
RNA-Seq解析

従来の遺伝子発現解析

= 細胞集団をまとめて解析

➔ 全体の平均が分かる

scRNA-seq

= 個々の細胞を解析

​➔ 個々の細胞の違いが分かる

シングルセルRNA-Seqとは

シングルセルRNA-Seqとは

シングルセルRNA-Seqとは

組織を構成する個々の細胞の遺伝子発現を調べる方法です。

Bulk RNA-Seqでは細胞集団における平均的な遺伝子発現を検出するのに対して、個々の細胞の遺伝子発現を調べる single cell RNA-seq 解析(scRNA-seq)により、組織を構成する様々な細胞の機能・活性化状態が詳細に解析できます。

ImmunoGeneTeqs社

シングルセルRNA-Seqの特徴

ImmunoGeneTeqs社

シングルセルRNA-Seqの特徴

ImmunoGeneTeqs社

シングルセルRNA-Seqの特徴

BD Rhapsody システムにおいてナノウェル・磁気ビーズを利用した whole transcriptome scRNA-seq 解析です。

 

*日本ベクトン・ディッキンソン株式会社よりBD Rhapsody™ シングルセル解析システムを使用したサービスプロバイダーとして認定されております​

当社独自の固相ビーズからの全cDNA増幅法 (TAS-Seq法) により、高感度・高精度な解析を実現しています。

BD社 SampleTag、BioLegend社 Hashtag等によるマルチプレックス解析に対応しており、多くのコストを必要とせず多検体解析が可能です。

BD Rhapsody Express システムの貸し出し、現地へ作業員の派遣も可能です。 (別途費用)

マウス肺、すい臓ラ氏島、腎臓や、ヒト肺、胃がんの生検サンプル由来白血球、ヒト末梢血好中球などの解析実績があります。

ヒトリウマチ肺の解析例

S1:4055細胞、S2:4938細胞をプールし、PCA空間上でクラスタリング後、その結果をtSNEによる次元圧縮により可視化しました。

ImmunoGeneTeqsのRhapsody とTAS-Seqを組み合わせた手法では、Batch effectがほとんど無く、基本的にはBatch effect補正の必要がありません。

TAS-Seqによる細胞検出頻度はFACSとほぼ同様

TAS-Seqによる細胞検出頻度はFACSとほぼ同様

Batch effect補正なしにマイナーなSubpopulationまで網羅的に同定

Batch effect補正なしにマイナーなSubpopulationまで網羅的に同定

* クラスタリングとは似たような遺伝子発現パターンを持った細胞を探してクラスター(集団)に分けることを指します。

* 異なる実験環境(Batch)で計測されたデータの場合、同じ臓器・細胞であっても、Batch間でデータに差が生じる" Batch effect "(実験間誤差)が存在し、それらの影響によりクラスタリング結果の解釈など、データ解釈が困難となる場合、Batch effect補正が必要な場合もありますが、Batch effect補正を実施することでbiological な違いもマスクしてしまう可能性があります。

解析実績のあるサンプル

マウス

ヒト

BD RhapsodyシステムとTAS-seqを用いた

シングルセルRNA-Seq解析ワークフロー

BD RhapsodyシステムとTAS-seqを用いたシングルセル RNA-Seq解析ワークフロー

お客様がオンサイトで細胞懸濁液からcDNA合成まで行い(➊~➍)、弊社へサンプル送付

*BD Rhapsody Express システムの貸し出し、現地へ作業員の派遣も可能です。 (別途費用)

お客様がオンサイトで細胞懸濁液からcDNA合成まで行い(➊~➍)、弊社へサンプル送付

*BD Rhapsody Express システムの貸し出し、現地へ作業員の派遣も可能です。 (別途費用)

弊社にてTAS-seqによるcDNA増幅、シーケンス情報解析後、データを納品

弊社にてTAS-seqによるcDNA増幅、シーケンス情報解析後、データを納品

必要な機材・試薬を
弊社よりお客様へ送付


➊ 細胞のロード
(自然落下・ポワソン分布)


➋ 過剰量のビーズのロード


➌ 細胞溶液、各種細胞由来mRNAをビーズに補足


➍ ビーズの回収・逆転写

お客様がオンサイトにて➊~➍まで行ったサンプルを当社へ送付

事前確認事項

* マルチプレックス解析をご希望の際は、FAQページの『マルチプレックス解析について』をご参照ください。

サンプルの受け入れ

当社指定プロトコルにて合成頂いたcDNA (IGT社でcDNA増幅以降を受託)

凍結細胞(IGT社で細胞抗体染色やcDNA合成以降を受託)

凍結組織(IGT社で組織からの細胞懸濁液調整以降を受託)

* 凍結細胞、組織から調整をご希望の場合はお問合わせください

* 細胞や組織を凍結保存頂く際は、当社指定の保存液、凍結方法をご使用下さい

サンプル送付方法

サンプルは乾燥・液漏れが無いようご注意いただき、下記発送先までご送付ください (平日17時到着まで対応可能)

当社指定プロトコルにて逆転写済みのBD Rhapsody beadsを発送する場合は、冷蔵便にてご発送ください

凍結細胞・組織をご発送の場合は、凍結状態を維持するために十分量のドライアイスを同梱し冷凍便でお送りください

* 遠隔地を除き翌日必着でご送付ください

サンプル送付先

〒278-0022
千葉県野田市山崎2669
東京理科大学野田キャンパス17号館1階

イムノジェネテクス株式会社

納期

サンプル受領から

2.5ヶ月程度

納品物 (HDD)

作業報告書

シーケンス生データ一式

マッピング結果ファイル(遺伝子発現テーブル並びにRNA velocity解析用発現テーブル、解析レポートファイル等)

シーケンスデータから1細胞ごとの遺伝子発現テーブルを作成いたします

報告書を抜粋したもの をご確認いただけます

報告書のうちSeurat解析のレポートはオプションとなり、別途費用をいただきます

報告書の例としてオプション解析も含めた場合を、Latest Dataからご覧いただけます

参考価格

サンプル数

サンプル数

解析細胞数/サンプル

解析細胞数/サンプル

価格 (税込)

価格 (税込)

シングル

シングル

1

10,000

10,000

¥953,700

¥953,700

5,000

5,000

¥914,100

¥914,100

マルチプレックス

マルチプレックス

2

10,000

10,000

¥1,427,800

¥1,427,800

5,000

5,000

¥1,260,600

¥1,260,600

3

6,667

6,667

¥1,564,200

¥1,564,200

4

5,000

5,000

¥1,566,400

¥1,566,400

マッピング解析レポート

マッピング解析の概略

1.

得られたシーケンスから、アダプター配列を除去します。

2.

品質の高い配列を取得し、サイクルごとの塩基組成を確認し、シーケンシングに問題がないことを確認します。

3.

得られたシーケンスのcDNA部分について、参照配列にマッピングします。

4.

マッピングされたシーケンスデータを、各1細胞に対応する固有のバーコード配列に基づき分割し、各細胞の遺伝子発現データを得ます。

5.

Barcode rank plot(図1)に基づき、分析に有効な細胞を検出します。またscatter plotにより、得られた細胞ごとのリード数と検出遺伝子数の分布につき確認することができます。

結果例

表1では、cDNA部分のマッピング率、シーケンスリードの利用効率、最終的に得られた細胞数、細胞集団の平均遺伝子検出数などについての情報を示します。

図1にBarcode rank plotを示します。これは有効な細胞数を決定するためのプロットです。

表1 マッピングの統計:検出された細胞と遺伝子の数

項目

数または割合 (%)

Total raw reads:大元の全リード数

Total raw reads:大元の全リード数

640,067,050

640,067,050

Total reads after trimming and quality filtering:

アダプター除去・クオリティフィルタリング後の総リード数

Total reads after trimming and quality filtering:

アダプター除去・クオリティフィルタリング後の総リード数

601,568,258

601,568,258

Cell barcode calling rate:

細胞バーコードに割り当てられた割合

Cell barcode calling rate:

細胞バーコードに割り当てられた割合

90.36

90.36

Mapping rate against genome:

ゲノムに対するマッピング率

Mapping rate against genome:

ゲノムに対するマッピング率

99.72

99.72

Unique-mapping rate against genome:

ゲノムに対するユニークマッピング率

Unique-mapping rate against genome:

ゲノムに対するユニークマッピング率

92.28

92.28

Feature assignment rate:

機能割り当て率

Feature assignment rate:

機能割り当て率

82.86

82.86

Final usable reads:

最終的に使用可能なリード

Final usable reads:

最終的に使用可能なリード

470,344,073

470,344,073

Minimum read number of survived cells:

生存細胞の最小読み取りリード数

Minimum read number of survived cells:

生存細胞の最小読み取りリード数

6,293

6,293

survived cells:

検出された細胞数

survived cells:

検出された細胞数

5,640

5,640

Total reads of valid cells:

有効な細胞の合計リード数

Total reads of valid cells:

有効な細胞の合計リード数

398,748,815

398,748,815

Percent of total reads of valid cells:

有効な細胞の合計リードの割合

Percent of total reads of valid cells:

有効な細胞の合計リードの割合

84.78 

84.78 

Median reads per cell:

有効な細胞におけるリード数の中央値

Median reads per cell:

有効な細胞におけるリード数の中央値

59,859

59,859

Mean reads per cell:

有効な細胞におけるリード数の平均値

Mean reads per cell:

有効な細胞におけるリード数の平均値

70,700

70,700

Median symbols per cell:

有効な細胞における検出遺伝子数の中央値

Median symbols per cell:

有効な細胞における検出遺伝子数の中央値

4,098

4,098

Mean symbols per cell:

有効な細胞における検出遺伝子数の平均値

Mean symbols per cell:

有効な細胞における検出遺伝子数の平均値

4,373

4,373

total genes detected:

検出された全遺伝子数

total genes detected:

検出された全遺伝子数

53,098

53,098

図1 Barcode rank plot

縦軸は細胞バーコードごとのリード数。横軸は細胞バーコードあたりのリード数の多い順に各細胞バーコードに付けられた順位。変曲点がマゼンタの縦線で示されている。

Seurat解析による
細胞クラスタリング・マーカー遺伝子検出解析のレポート

Seurat解析による細胞クラスタリング・マーカー遺伝子検出解析のレポート

1) データの前処理

tag (BioLegend社Hashtag、BD社Sampletagなど) を用いて1度に複数サンプルを同時解析する場合、各細胞のtag発現量を求め、各細胞におけるtag発現量の多寡に基づいて、どの細胞がどのサンプル由来であるのかを決定 (図2、表2)

表2 各サンプルタグに割り当てられた細胞の数

ダブレット

ダブレット

mouseSample

Tag10

mouseSample

Tag10

mouseSample

Tag6

mouseSample

Tag6

mouseSample

Tag7

mouseSample

Tag7

mouseSample

Tag8

mouseSample

Tag8

mouseSample

Tag9

mouseSample

Tag9

細胞数

細胞数

875

875

4,402

4,402

4,917

4,917

4,305

4,305

4,088

4,088

4,544

4,544

図2

図2 各細胞バーコードのサンプルタグ発現量と、各細胞にアサインされたtagの関係をヒートマップで図示

2) Seuratにおける前処理

ミトコンドリア遺伝子の発現が高い細胞 (0.25以上) の除去 (図3)

ダブレット細胞およびタグが発現していなかった細胞を除去 (tagを用いた解析の場合)

ScaleData関数を使用したスケーリング

Pseudocolor density plotやRidgeplotにより、検出遺伝子数および遺伝子あたりの発現数の分布を求め、問題がないか概ね確認

図3 統計データのpseudocolor 密度プロット

この図においては、1つの点が1つの細胞に対応し、細胞が同じ位置で重なるところはその重なりの密度を求め、密度が低い方から濃い方へ青から赤のスペクトルに対応させて、その密度に応じたスペクトル内の色で表されています。

左上:横軸は検出された遺伝子数、縦軸は各細胞におけるミトコンドリア遺伝子に由来するリード数の総リード数に対する割合。この割合が0.25以上の細胞は、計算から除きました。

左上:横軸は検出された遺伝子数、縦軸は各細胞におけるミトコンドリア遺伝子に由来するリード数の総リード数に対する割合。この割合が0.25以上の細胞は、計算から除きました。

左下:横軸は検出された遺伝子数、縦軸は各細胞におけるリボソームRNAに由来するリード数の総リード数に対する割合。

左下:横軸は検出された遺伝子数、縦軸は各細胞におけるリボソームRNAに由来するリード数の総リード数に対する割合。

右上:横軸は検出された遺伝子数、縦軸は各細胞におけるリボソームタンパク質遺伝子に由来するリード数の総リード数に対する割合。

右上:横軸は検出された遺伝子数、縦軸は各細胞におけるリボソームタンパク質遺伝子に由来するリード数の総リード数に対する割合。

右下:横軸は各細胞の総リード数、縦軸は各細胞の検出された遺伝子数。

右下:横軸は各細胞の総リード数、縦軸は各細胞の検出された遺伝子数。

3) 主成分分析とJackStrawプロット

大きく発現変動している遺伝子をFindVariableFeatures関数で検出した後、それら遺伝子に関する主成分分析(PCA)を実施します。遺伝子発現パターンに基づく細胞のクラスタリングのために使用する主成分(PC)の数を、Jackstraw解析により決定します

図4 JackStrawプロット

p値が1 x 10-5未満となる71までの主成分数を、以降の解析に使うことにしました。

4) クラスタリング

細胞のクラスタリングを実行します。遺伝子発現の似た細胞が1つのクラスターとなります。

5) Seuratクラスタリングシルエットスコアプロット

解像度パラメータを決定します。 (図5) ここでは、解像度1.5において平均シルエットスコアが最大なので、1.5が適切と考えて以降の解析に進んでいます。

図5 それぞれの解像度パラメータにおけるクラスタリングの平均シルエットスコア

6) Fit-SNEプロットおよびUMAPプロットによるSeuratクラスタリング結果の可視化

FIt-SNE (George C. Linderman et al. Nat Methods 2019) を用いて、4)で行ったクラスタリング結果を視覚化します 。(図6) またUMAP解析でも視覚化します (図7)

図6 クラスタリング結果のFlt-SNEによる表示

50個のクラスターが検出されました。

図7 クラスタリング結果のUMAPによる表示

50個のクラスターが検出されました。

7) 各サンプルにおける細胞組成の解析

各クラスターに含まれる細胞数を求めます (表3)

サンプル間の細胞組成の違いを求めます (図8、図9)

表3 タグごと(サンプルごと)の各クラスターに含まれる細胞数

Seurat_clusters

Seurat_clusters

mouseSampleTag10

mouseSampleTag10

mouseSampleTag6

mouseSampleTag6

mouseSampleTag7

mouseSampleTag7

mouseSampleTag8

mouseSampleTag8

mouseSampleTag9

mouseSampleTag9

0

529

785

558

526

587

1

672

640

458

352

651

2

284

272

334

273

338

3

228

243

198

172

208

4

182

150

167

135

176

5

114

232

164

138

120

6

171

130

150

158

149

7

167

148

100

213

113

8

113

210

159

110

123

9

121

146

140

110

157

クラスター番号は、図6、図7のSueratクラスター番号に該当します。0から9までのみ表示しています。

元のデータは.txtに保存されます。またhtmlファイルでも全体を表示することができます。

図8

各細胞クラスターの全細胞に対する割合を、サンプルごとに積み上げ棒グラフで図示

50個のクラスターが検出されました。

図9

細胞組成割合のサンプル間での差異に関する系統樹解析

50個のクラスターが検出されました。

8) 各細胞クラスターにおけるマーカー遺伝子の検出

各細胞クラスターにおいて特徴的に高く発現しているマーカー遺伝子を見つけます (図10、表4)

トップ6のマーカー遺伝子の発現パターンをFIt-SNE、UMAPにより可視化しました(図11、図12)

図10 各クラスターにおけるトップ20のマーカー遺伝子の発現パターンをヒートマップで図示

縦軸に各クラスターにおいて特徴的な20の遺伝子、横軸には各クラスターにある個々の細胞を並べ、個々の細胞における遺伝子発現量を右にあるスペクトルの色で表しました。クラスター内にある個々の細胞の遺伝子発現がどのくらい類似度があるか、あるいはクラスターごとの遺伝子発現の比較などができます。

表4 各クラスターにおいて検出された全マーカー遺伝子

gene

gene

cluster

cluster

p_val_adj

p_val_adj

avg_logFC

avg_logFC

within_avg_exp

within_avg_exp

without_avg_exp

without_avg_exp

pct.1

pct.1

pct.2

pct.2

p_val

p_val

H2-Eb2

H2-Eb2

cluster0

cluster0

0

0

5.014

5.014

5.309

5.309

1.834

1.834

0.374

0.374

0.056

0.056

0

0

Fcer2a

Fcer2a

cluster0

cluster0

0

0

5.011

5.011

6.404

6.404

2.931

2.931

0.743

0.743

0.093

0.093

0

0

Cr2

Cr2

cluster0

cluster0

0

0

5.008

5.008

5.426

5.426

1.955

1.955

0.383

0.383

0.038

0.038

0

0

Ighd

Ighd

cluster0

cluster0

0

0

4.973

4.973

7.332

7.332

3.885

3.885

0.934

0.934

0.124

0.124

0

0

Bank1

Bank1

cluster0

cluster0

0

0

4.453

4.453

6.884

6.884

3.797

3.797

0.859

0.859

0.107

0.107

0

0

H2-Ob

H2-Ob

cluster0

cluster0

0

0

4.437

4.437

6.954

6.954

3.879

3.879

0.875

0.875

0.128

0.128

0

0

H2-DMb2

H2-DMb2

cluster0

cluster0

0

0

4.422

4.422

7.049

7.049

3.984

3.984

0.905

0.905

0.193

0.193

0

0

Fcmr

Fcmr

cluster0

cluster0

0

0

4.411

4.411

6.694

6.694

3.636

3.636

0.783

0.783

0.083

0.083

0

0

Cxcr5

Cxcr5

cluster0

cluster0

0

0

4.275

4.275

5.358

5.358

2.394

2.394

0.4

0.4

0.037

0.037

0

0

H2-Oa

H2-Oa

cluster0

cluster0

0

0

4.273

4.273

5.664

5.664

2.703

2.703