知名線上課程 Spark第二部曲: SQL輕鬆處理半結構化資料技巧(含教材) 講師:Erica Li 影音教學 中文發音 繁體中文版(DVD版)
利用Spark SQL的特性,做出商業智慧報表不再難!TibaMe的Spark第二部曲: SQL輕鬆處理半結構化資料技巧,課程中將帶領你學習:取得資料、資料前處理基本功,並透過了解SQL、DataFrame的優點,並利用課堂中所學實作製作商業智慧報表。
認識 Spark SQL
Introduction to SparkSQL
Initialize SparkSQL with SQLContext
From SchemaRDD to DataFrame
Phases of Query Planning
Spark SQL 支援的資料來源
Data sources
資料匯入與匯出
Input - connected with local system
Input - connected with HDFS
Input - connected with Hive
Output
Dataframe
Dataframe operations(1)
Dataframe operations(2)
UDF(User Defined Functions)的使用
Create your first user defined functions
效能調校 (Performance Tuning)
Performance tuning in SparkSQL
注意事項 (Tips)
Tips
Review of SparkSQL
|
|