「DeepMind」のAI がどのように科学に革命を起こしているか?

020 年、Alphabet(Googleの親会社)の完全子会社DeepMind Technologiesが開発しているニューラルネットワークのDeepMindは1つではなく350,000 のタンパク質の構造を予測し、再び世界 を 驚か せました。

その後、2022年7月、DeepMindとそのパートナーはさらに先へ進みました。同社は、ほぼすべての既知のタンパク質の構造を明らかにしました。 細菌からヒトまでの2億以上のタンパク質であり、医薬品開発と進化研究の宝庫となる可能性があります。

さらに、このすべてのデータは公開データベースに追加されており、誰でも無料で検索できます。
ジャーナルNatureが指摘しているように、「今日から、科学的に知られているほぼすべてのタンパク質の 3D形状を決定することが、Google検索に入力するのと同じくらい簡単になります。」

タンパク質の形状はその機能を決定しますが、これまで科学者たちはほとんどのタンパク質がどのように構造化されているかについて知りませんでした。この新しいリソースは、ライフサイエンスにおける発見を加速させ、新薬の開発を加速させる可能性があります。

今日のブログでは、DeepMind がこの驚くべきマイルストーンに到達した経緯と、それが科学と人間の健康の未来にとって何を意味するかについて説明します。

Abundance360コミュニティで議論している ように、バイオテクノロジー分野がいかに急速に加速しているかを考えると、今後10年間で、数千億ドル規模のスタートアップと、これまでにないブレークスルーがもたらされるでしょう。

タンパク質は、複雑な3D構造を作成するためにねじれたり曲がったりするアミノ酸の長い鎖で構成されています。
これらの形状は、タンパク質の機能を大きく決定します。それが構造的支持体、重要な細胞プロセスを触媒する酵素、または他の重要な生体分子の輸送を助けるチャネルとして機能するかどうかです。

これは、タンパク質の構造を決定することが、その機能を理解する上で重要であることを意味します。X線結晶構造解析やクライオ電子顕微鏡などの技術を使って実験的にこれを解決することは可能ですが、時間と費用がかかります。

そのため、科学者は長い間、実験的に推測するのがはるかに簡単なアミノ酸配列に基づいてタンパク質の構造を予測できるソフトウェアを設計しようとしてきました. ただし、これは言うは易く行うは難しです。

問題は、配列内のすべてのリンクがいくつかの異なる方法で折り畳まれる可能性があるため、アミノ酸の各ストリングの可能な構成の数が膨大になることです. そのため、タンパク質の折り畳みのコードを解読することは、50 以上にわたって生物学の「壮大な挑戦」の1つでした。

2018年、同社は権威あるCritical Assessment of Techniques for Protein Structure Prediction (CASP) コンペティションで初の試みで優勝した後、タンパク質フォールディングの世界を一変させました。

これは、膨大な量のタンパク質データで訓練された AlphaFold(タンパク質の構造予測を実行するGoogleのDeepMindによって開発された人工知能プログラム)と呼ばれるディープラーニングニューラルネットワークに依存して、特定のアミノ酸のペア間の距離と、それらを結合する化学結合の角度を推定しました。

誰かが最新の AI技術を問題に適用しようとしたのはこれが初めてではありませんでしたが、DeepMind のソリューションは以前のアプローチよりもはるかに正確でした。43の最も困難なタンパク質ターゲットのうち 25で最高の予測を達成したのに対し、2 位になったチームは3つだけでした。

これらの予測は実際に役立つにはほど遠いものであったため、2年後 DeepMindはCASPに戻ってきて、初期の結果を水から吹き飛ばした新しいバージョンのAlphaFoldを提供しました。彼らは、GPT-3 のような大規模な言語モデルの台頭の背後にあるニューラルネットワークアーキテクチャであるトランスフォーマーの力を利用してこれを実現しました。

テストされたタンパク質の約 3 分の 2 で、新しいバージョンの AlphaFold は、構造的類似性の尺度で 100点満点中90点以上のスコアを獲得しました。その精度では、不一致は、ソフトウェアによるエラーではなく、ラボでの実験エラーによって説明される可能性が高くなります。

研究者たちは、この結果を、タンパク質構造予測の問題を大きく解決した「ゲームチェンジャー」として歓迎しました。2021年7月、同社は、欧州バイオインフォマティクス研究所 (EMBL-EBI) と提携して、自由にアクセスできるAlphaFoldタンパク質構造データベースを立ち上げ、レジストリに新しいタンパク質を着実に追加していました。

そして今年の夏、DeepMindはAlphaFoldを使用して 自然界に存在するほぼすべてのタンパク質の構造を解明し、データベースに2億以上の新しいレコードを追加したと発表しました。

DeepMindのCEO であるDemis Hassabis氏は、記者会見で記者団に対し、「本質的に、タンパク質の宇宙全体をカバーしていると考えることができます。「私たちはデジタル生物学の新しい時代の始まりにいます。」

大げさに聞こえるかもしれませんが、この新しいタンパク質構造の宝庫の重要性を過小評価することはできません. これらはまだ予測にすぎませんが、EMBL-EBIによると、約35%は実験によって決定された構造と同じくらい正確であると考えられており、45%は幅広い用途で実際に役立つほど正確です。

それらが何を可能にするかを理解するために、DeepMind がすでにリリースしたタンパク質構造のはるかに小さなコレクションを使用して、すでに達成されたブレークスルーを見ることができます。

基礎科学では、AlphaFoldは核膜孔複合体の構造を解明するのに役立ちました。これは、細胞核に出入りするものを制御する 1,000のタンパク質の寄せ集めです。また、ミツバチの免疫系に関与する重要なタンパク質を特徴付けるのにも役立ちます.

より実用的なレベルでは、英国のポーツマス大学の研究者が AlphaFoldを使用して、プラスチックを分解できる新しい酵素を開発しています。また、結晶構造解析と組み合わせて、新しいマラリア ワクチンの有望な標的となる可能性のあるタンパク質の構造を決定するためにも使用されています。

タンパク質の構造を理解することは、タンパク質が特定の薬物の標的となるかどうかを判断するために重要です。また、アミノ酸配列からタンパク質の形状を予測できれば、その配列を微調整した場合の構造への影響を解明することもでき、新薬を設計するための強力なツールとなる可能性があります。

これは明らかにDeepMind の計画の一部です。Hassabis氏は、「エンドツ エンドの創薬」について考え始めていると述べており、昨年、同社は Isomorphic Labsという新しいベンチャー企業をスピンオフしました。このベンチャー企業は、AlphaFoldやその他のAI ツールを使用して創薬を加速します。

この分野の最も困難な問題に対して、この技術がどれほど役立つかについては、まだ疑問があります。AlphaFoldは、タンパク質が他の生体分子、または構造が固定されていないいわゆる「無秩序な」タンパク質とどのように相互作用するかについてほとんど何も教えてくれません。そして重要なことに、小分子薬が結合する領域の構造を予測することに関しては、特に信頼できないことがわかっています。

それにもかかわらず、このツールが医薬品開発パイプラインの一部を大幅にスピードアップする可能性があるというのは、幅広いコンセンサスのようです。このデータベースが すべての疑問に答えているわけではありませんが、科学者たちは、かなり優れた予測でさえ、ブレークスルーを起こすためにどこを探すべきかについての重要な手がかりを提供していることに気付き始めています。

そして、これは始まりに過ぎません。
AlphaFoldが登場する前に、自然界のほぼすべてのタンパク質について5年以内に正確な予測ができると構造生物学者に話していたら、彼らは笑っていたでしょう。

それでも、DeepMindはその栄光に安住することはまずなく、残りの課題はほぼ確実に視野に入っています。

DeepMind の継続的なブレークスルーは、AIが科学的発見に与える影響を示しています。
そして、ほぼすべてのタンパク質の構造を予測する人工知能の能力を、量子コンピューティング (医療とヘルスケアを混乱させる態勢にある別の技術) で予想されるブレークスルーと組み合わせると、個別にカスタマイズされた精密医療が科学から移行する世界からそう遠くありません。

指数関数的な技術の融合により、ヘルスケアほど大きなブレークスルーをもたらしている場所はありません。
ヘルスケアにおける人工知能の使用に関心があり、これまでの進歩に興奮している野心的な起業家であれば、参加するのに今ほど適した時期はありません。

ピーター・ディアマンディス著

(via AWAKEN

Last Updated on 2022年9月14日 by M林檎

コメントを残す

メールアドレスが公開されることはありません。