PubMedID 34812110
タイトル An exploratory text analysis of the autophagy research field.
ジャーナル Autophagy 2021 Nov;1-14.
著者 Yim WW, Kurikawa Y, Mizushima N
  • オートファジー論文のテキストマイニング
  • Posted by 東京大学大学院医学系研究科 Yim Willa, 栗川義峻
  • 投稿日 2021/12/09

 先日Autophagy誌にアクセプトされた我々の研究成果を報告させていただきます。オートファジーの論文に関するメタ解析を行いました。
 1950年代にオートファジーが発見されて以来、その論文出版数は年を追うごとにうなぎ上りに増え続けています。しかしあまりに出版数が多いため、新しくオートファジーに参入しようとする研究者にとって、論文のサーベイや研究課題を探すことが非常に難しくなっています。そこで我々は、オートファジー分野における研究の動向をつかむために、オートファジーに関する約42,000の論文の要旨に対してテキストマイニングを行いました。
 まず、論文の出版数に基づくと、1960年代から現在までには3つのフェーズ(1975年以前、1976~2000年、2001年以降)があることがわかりました。特に最後のフェーズは指数関数的に論文出版数が増加しており、これは前のフェーズにおいてブレークスルーとなった被引用回数が高い論文がいくつも出版されたためだと考えられます。
 次に、これまでのオートファジー研究の動向を調べるために、解析対象とした論文の要旨に出現する遺伝子名の頻度の解析および使用されている用語(単語及び5 wordsまでの連語)の抽出を行いました。これらの解析から、オートファジー研究の第2フェーズでは超微細構造解析や生化学的解析に関連する遺伝子名・用語が中心であったのが、第3フェーズに入り、分子機構や生理的意義に関連する語へと変遷していることが分かりました。
 さらに、抽出した用語に対してLDA (Latent Dirichlet Allocation; 潜在的ディレクリ配分法)を用いて研究トピックの抽出を試みたところ、17の研究トピックに分けることができました。研究トピックを見ても「超微細構造観察」が第2フェーズでは最も多い研究トピックであったのが、第3フェーズに入ると様々な研究トピックが出現し、近年ではどのトピックもほぼ同数の論文数が出版されていることが明らかになりました。
 最後に、このようなオートファジー研究の多様性について、疾患およびモデル生物の側面から解析しました。疾患については癌、神経変性疾患、感染症、循環器系疾患、代謝を中心とした幅広い領域にわたって論文が出版されていました。またモデル生物については第3フェーズに入ってから哺乳類と酵母以外に関する論文数が増加していました。これらの結果もオートファジー研究が多岐にわたる領域で展開されていることを裏付けます。
 以上の結果から、オートファジー研究は分子機構の基盤が確立されてから、生理学・病理学的意義の解明やオートファジーの制御法などの展開へと爆発的な成長を遂げたと考えられます。今後は、生体の恒常性におけるオートファジーの役割や分子機構に関する未解決課題、そして哺乳類以外のモデル生物へのオートファジー研究の拡張などが次の研究トレンドを作り出すだろうと考えられます。
 本研究は、昨年の9月、eLife誌に ”The growth of acronyms in the scientific literature(PMID: 32701448)”という論文が発表されていることを知ったのがきっかけでスタートしました。一か月もあれば投稿できて、実験もするわけでもないので年内にアクセプトまで行けるだろうと高を括って始めたのですが、気づいたらアクセプトまで1年かかってしまいました。解析を始めると凝りたくなるもので、テキスト分析について基本から応用まで多くのことを学びました。テキスト分析は他の分野でも活用できますし、文献レビューのツールとしても有用だろうと考えています。
 結果はある程度予想通りではありましたが、我々の印象をきちんと数字にして定量的に示すことができたのは良いことだったと思います。若輩者の考えでは、Apgの発見後すぐに論文数が増えて新しいフェーズに入ると思っていたのですが、実際には約15年してから第3フェーズに移行しました。このことは、電子顕微鏡観察やApgの同定、機能解析など基礎的な仕事を積み重ねることの重要性を象徴しているように思います。研究者一個人としても分野としても、地に足をつけて倦まず弛まず研究を進めることが必須であると、解析を通じて実感しました。