データサイエンス概論
東京海洋大学 大学院講義(後期集中)

担当:溝端浩平

地球科学データの解析を通じて、ビッグデータとハンドリングの解析手法について例題とともに学ぶ。
講義資料等はMicrosoft Teamsを用いて配布する。
 

1. データサイエンス・ビッグデータについて
本講義では地球科学分野におけるデータサイエンス、ビッグデータ解析について紹介する。
ビッグデータの種類、地球科学で扱うデータのフォーマット、ソフトウェア、データ配布のポータルサイトなど今後の講義で把握しておくべき事柄について説明する。


2. データ可視化
- 1-D/2-D/3-D plots including Hovmoller, T-S diagram, Wind Rose etc. using GMT, MATLAB

3. 基礎統計、相関係数、線形回帰、ラグ相関、重回帰
大学院生にとってはおさらいになるが、基本的な統計手法について説明する。
主に海洋の温暖化シグナル、気候変動指数、データのフィルタリングなどを紹介する。





4. 回帰分析、重回帰モデル
2を踏まえて相関係数、回帰式などをもう一度おさらいし、研究事例の説明を行う。
ある解析結果を参考にして重回帰式を構築する。
多重共線性についても触れる。





5. コンポジット解析



6.次元削減(EOF)
- 主成分分析: 北極振動、太平洋十年規模変動, 南極振動, etc.
- 特異値分解: Sea level pressure vs. Sea surface temperature, etc.




7. フィルタリング/フーリエ解析/スペクトル解析




8. ウェーブレット解析