iBlog ブログ
第2回iSeminar開催 × 第3回iSeminar参加受付中!
こんにちは🌤
今回は、5月25日に開催された第2回iSeminarについてです。
今回の講演者は、情報・システム研究機構 統計数理研究所教授の吉田亮先生。
テーマは、「データ駆動型物質探索を加速する統計的機械学習の先進技術」でした。
YOSHIDA LAB HP : http://daweb.ism.ac.jp/yoshidalab/research.html
今回も130名以上の方にご登録いただき、盛況でした!ありがとうございました。
個人的にはとても難しい内容でした😲💦
有機低分子化合物のケミカルスペースには、およそ1060 の候補分子が存在しますが、現在のデータベースに登録されている有機化合物の数は108程度に過ぎないそうです。
そこで、データ科学の先進技術を用いることで、残された広大な未踏領域の中から、革新的な特性を有する新物質を見つけ出す、というのが講演のテーマでした。
しかしそこには、「内挿的予測の限界」(未踏領域にはそもそもデータがない、ということ)という問題があることが示されます。
分子設計の例では、高分子の化学構造をインプットとし、熱電導率などの熱物性を持つモノマー(単量体)を予測するモデルを使用することで、いろんなターゲットに対し、高い熱伝導率を持つポリマー(重合体)にはどんな構造があるのか?を機械学習を駆使して、予測できるのだとか。
しかし、新しい材料を見つけることを確実に、かつ効率的に行うには、もっと研究基盤を整備する必要があると先生は感じられたそうです。
立ちはだかる問題は、データがないこと(まだまだ少数のデータしかないこと)。
では限られたデータに基づいて、どうやって機械学習するのか?
その解決策の例として、転移学習や実験計画報告が挙げられていました。
最後のテーマ、「データ科学に資するデータを創出する」では、データ駆動型研究の本質はパワーゲームである、という点を強調されていました。
データの量は未来永劫増加していくことから、現在はデータ駆動において「原始時代」に位置しているそうです。データを制するものが勝つ、という時代の到来を予想されていました。
私たち非専門家にとっても、データ社会の進歩そのものは他人事ではありません。
データの格差という観点では、近年データ資本主義という言葉を耳にするようになりました。
当然のように社会に浸透している「価格」や「貨幣」は、物質を比較検討することを可能にした、情報を圧縮した尺度ですが、ビッグデータや機械学習の発達に伴って、従来の比ではない膨大な情報を合理的かつ網羅的に比較検討できる市場経済が構築されてきています。
金融資本主義から、データという無形資産が資本主義の柱となる(データ社会の歴史が「原始時代」から先へと連なっていく)過程で、ここでもパワーゲームが働き、産業構造や経済活動が変質していくことは想像に容易いです。
機械学習やビッグデータ等について学び、データ・リテラシーを身につけることは、非専門家である私たちの消費生活においても、重要性が増していきそうですね!
私自身、今回の講演を聞いて、基本的な部分から学んでみたいと思いました。
さて、次回のiSeminarは、6月23日の14時から15時半を予定しています。
自治医科大学 感染・免疫学講座 細菌学部門 講師の、氣駕恒太朗先生をお迎えします。
テーマは、「バクテリオファージを利用した次世代創薬研究」。
次回も、異分野に携わる方にとって新たな分野への興味を誘発する機会になればと思います✨
参加登録は以下よりお願いします。
🔻Twitterアカウント
https://twitter.com/InterdiscipBiol
🔻Instagramアカウント
https://www.instagram.com/interdiscipbiol/