データサイエンス
東京海洋大学海洋資源環境学部2年前期講義

担当:溝端浩平

地球科学データの解析を通じて、データサイエンスの基本的な概念と⼿法について理解する。
特に、統計学的な観点からデータの観察手法、分析手法、可視化手法を学ぶ。
 

ー導入ー
01: FortranおよびGMTのインストール状況確認
本授業ではプログラミング言語Fortran、可視化ツールGeneric Mapping Tool(GMT)を使用する。
サンプルを用いてFortranスクリプトのコンパイルと実行、GMTによる可視化を学ぶ。

ー1次元データ解析(アスキーデータの分析)ー
02:データ分析の進め方(分析目的、データの収集と加工(データ配列の変更など)の基礎)

南方振動指数の説明、おさらい、タヒチとダーウィンのデータ読み込み


03: データの収集と加工(南方振動指数の計算1):
 タヒチとダーウィンにおける海面気圧データの標準化(平均・分散・標準偏差)


04: データの収集と加工(南方振動指数の計算2):
  月平均標準偏差の計算,南方振動指数(SOI)の計算

 


05: データ観察1(時系列データ解析):
  フィルタ処理(移動平均,自己相関係数による周期性の観察)





06: データ観察2(時系列データ解析):
 フーリエ変換による周期性の抽出


07: データ分析1:
 El Nino監視海域の海面温度データとSOIとの関係(クロス集計)



08: データ分析2:
 データの標準化、最小二乗法による線形回帰式の導出,
 決定係数の算出(相違性・傾向性・関連性の抽出)


ー2次元データ解析(グリッド化された地球観測データ(バイナリデータ)の分析ー
09: データ分析の進め方(分析目的・データの収集と加工、特にバイナリデータの取り扱い)

10: データ観察(時空間解析1):
 海面温度の特徴抽出、各グリッドにおける長期トレンドの計算
 (特異性・相違性・傾向性の観察)

11: データ観察(時空間解析2):
 海面水位上昇トレンドの計算、地衡流・渦運動エネルギー・相対渦度の計算(別のページへ移行)
 (特異性・相違性・傾向性の観察)



       

12: データ分析(時空間解析3): コンポジット解析・Regression解析
 (関連性・仮説検証・知識発見・原因究明・可視化)



13: データ分析(時空間解析4): 同時・ラグ相関解析・複合データを用いた最適観測海域・観測時期の選定 (計画策定・判断支援)