お知らせ connpassではさらなる価値のあるデータを提供するため、2024年5月23日(木)を以ちましてイベントサーチAPIの無料での提供の廃止を決定いたしました。
2024年5月23日(木)以降より開始予定の「connpass 有料API」の料金プランにつきましてはこちらをご覧ください。

お知らせ connpassをご利用いただく全ユーザーにおいて健全で円滑なイベントの開催や参加いただけるよう、イベント参加者向け・イベント管理者向けのガイドラインページを公開しました。内容をご理解の上、イベント内での違反行為に対応する参考としていただきますようお願いいたします。

このエントリーをはてなブックマークに追加

4月

14

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7

参加者同士インタラクティブに議論し、理解を深める

主催 : SOLEIL DATA DOJO

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7
ハッシュタグ :#DeepLearning
募集内容

オンライン参加

無料

先着順
11/30

申込者
dz2cgto
isseki_j
y_temp
tizawa3
hiro10
Kiyoshi Negishi
yoshi600
samurai
yhas
kishimoto_soma
申込者一覧を見る
開催日時
2023/04/14(金) 19:30 ~ 20:30
募集期間

2023/03/31(金) 23:03 〜
2023/04/14(金) 20:30まで

会場

オンライン開催

参加者への情報
(参加者と発表者のみに公開されます)

イベントの説明

次回は8章からスタートします。

開催趣旨

本勉強会では、マテリアルズインフォマティクスについて理解を深めることを目的とし、下記の本を一章ずつ取り上げていく予定です。事前に予習し、コードを一通り動かしてから参加されることをオススメします。参加者同士の質問・意見交換やディスカッションをメインに進めていく予定です。

『化学・化学工学のための実践データサイエンス―Pythonによるデータ解析・機械学習―』(金子 弘昌(著), 朝倉書店, 2022年10月)

※ 書籍はご自身で入手のうえ、ご参加ください。

参加対象者

  • マテリアルズインフォマティクスの理解・Pythonによる実装力を高め、業務や研究に活用した社会人・学生・研究者の方
  • Pythonの基礎的な文法やJupter Notebook、Google Colaboratoryの基本的な使い方を習得されている方

参加方法

Connpassの「参加者への情報」に記載のzoomリンクよりご参加ください。

勉強会の進め方

  • その日に取り扱う章を前もって各自ご自身で読み進めておいてください。
  • 勉強会では、皆で書籍の内容を確認しながら、必要に応じてGoogle Colaboratory等で実際にコードを動かしていきます。
  • ポイントごとに立ち止まって疑問点をぶつけ合い、意見交換し、理解を深めていければと思います。

※ 一人が資料準備してきて一方的にレクチャーする形式ではなく、参加者同士インタラクティブにディスカッションしながら進めていきます。

書籍の紹介文(https://www.asakura.co.jp/detail.php?book_code=25047)

内容紹介
ケモインフォマティクス,マテリアルズインフォマティクス,プロセスインフォマティクスなどと呼ばれる化学・化学工学系のデータ処理で実際に使える統計解析・機械学習手法を解説。Pythonによるサンプルコードで実践。

目次
1.はじめに
・分子設計・材料設計・プロセス設計・プロセス管理
・事前準備~Python環境とDCEKit~

2.データセットの作成
・説明変数x の決め方・選び方
・特徴量の作成
・モデルの逆解析の活用

3.化学データ・化学工学データの前処理
・説明変数の標準化をするべきか
・標準偏差が0の説明変数
・対数変換やロジット変換
・スペクトル・時系列データの前処理
・外れ値検出もしくは外れサンプル検出
・欠損値の補完

4.特徴量選択(変数選択)
・注意点
・同じ値を多くもつ特徴量の削除
・相関係数
・クラスタリング
・GAPLS, GASVR
・スペクトル解析
・時系列データ解析
・Boruta

5.データセットの可視化・見える化
・可視化をする理由
・手法選択のポイント
・結果を評価する指標
・GTM

6.クラスタリング
・メリット
・GMM
・SGTM

7.回帰分析とクラス分類
・定性的な特徴量から定量的な特徴量へ
・回帰分析/クラス分類の回帰分析
・アダブースト
・勾配ブースティング
・アンサンブル学習
・半教師あり学習
・転移学習
・モデルの予測精度を上げるために

8.モデルの検証
・手法の選び方
・注意点
・ハイパーパラメータの選択に失敗したとき
・実測値vs.推定値プロットの見方
・オーバーフィッティング(過学習)
・小さなデータセット
・トレーニングデータとテストデータの分け方
・ダブルクロスバリデーション
・yランダマイゼーションによる危険度を評価
・特徴量の標準化
・ハイパーパラメータの最適化

9.モデルの適用範囲・ベイズ最適化
・モデルを構築するのにサンプルはいくつ必要か
・内挿・外挿
・守りのAD,攻めのBO
・モデルがどれくらい外挿できるかの検証方法
・ガウシアンカーネルを用いたサポートベクター回帰
・特徴量の非線形変換によるモデルの適用範囲の拡大

10.モデルの逆解析
・チェックリスト
・モデルの予測性能が低いとき
・説明変数の感度
・ランダムフォレストや決定木で構築したモデルの逆解析
・部分的最小二乗法でモデルの逆解析
・材料設計の限界(モデルの逆解析の限界)
・モデルの予測結果の活用方法~モデルの逆解析と目的変数の評価~
・目的変数が複数個あるとき
・GMR
・VBGMR
・遺伝的アルゴリズムを用いた逆解析
・GTMR

索引

参加者同士の質問・情報交換

Scribble Osaka Lab(SOL)のSlackワークスペースで、参加者同士の質問・情報共有用チャンネルを設けております。参加ご希望の方は、申込みフォームで招待メール送り先のEmailアドレスをお教えください。

その他

ソレイユデータ道場については、公式HPやFacebookページをご参照ください。

公式HP:https://soleildatadojo.com/
Facebookページ:https://www.facebook.com/soleildatadojo/

資料 資料をもっと見る/編集する

資料が投稿されると、最新の3件が表示されます。

フィード

SOLEIL DATA DOJO

SOLEIL DATA DOJO さんが 【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 を公開しました。

2023/03/31 23:03

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 を公開しました!

グループ

SOLEIL DATA DOJO

イベント数 318回

メンバー数 1249人

終了

2023/04/14(金)

19:30
20:30

募集期間
2023/03/31(金) 23:03 〜
2023/04/14(金) 20:30

会場

オンライン開催

オンライン開催

参加者(11人)

dz2cgto

dz2cgto

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

isseki_j

isseki_j

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

y_temp

y_temp

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

tizawa3

tizawa3

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

hiro10

hiro10

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

Kiyoshi Negishi

Kiyoshi Negishi

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

yoshi600

yoshi600

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

samurai

samurai

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

yhas

yhas

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

kishimoto_soma

kishimoto_soma

【オンライン開催】『化学・化学工学のための実践データサイエンス』読書会#7 に参加を申し込みました!

参加者一覧(11人)