相似文件
換一批
經(jīng)管之家送您一份
應(yīng)屆畢業(yè)生專屬福利!
求職就業(yè)群
經(jīng)管之家聯(lián)合CDA
送您一個(gè)全額獎(jiǎng)學(xué)金名額~ !
感謝您參與論壇問題回答
經(jīng)管之家送您兩個(gè)論壇幣!
+2 論壇幣
共享Multivariate Statistics with R(2009新書)絕對(duì)是好書!
Paul J. Hewson
March 17, 2009
1 Multivariate data 1
2 Matrix manipulation 11
3 Measures of distance 33
3.1 Mahalanobis Distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.1 Distributional properties of the Mahalanobis distance . . . . . . . . . . . . . 35
3.2 Definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3 Distance between points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.3.1 Quantitative variables - Interval scaled . . . . . . . . . . . . . . . . . . . . . 38
3.3.2 Distance between variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3.3 Quantitative variables: Ratio Scaled . . . . . . . . . . . . . . . . . . . . . . 42
3.3.4 Dichotomous data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.5 Qualitative variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3.6 Different variable types . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4 Properties of proximity matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4 Cluster analysis 51
4.1 Introduction to agglomerative hierarchical cluster analysis . . . . . . . . . . . . . . . 54
4.1.1 Nearest neighbour / Single Linkage . . . . . . . . . . . . . . . . . . . . . . . 54
4.1.2 Furthest neighbour / Complete linkage . . . . . . . . . . . . . . . . . . . . . 55
4.1.2 Furthest neighbour / Complete linkage . . . . . . . . . . . . . . . . . . . . . 55
4.1.3 Group average link . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.1.4 Alternative methods for hierarchical cluster analysis . . . . . . . . . . . . . . 58
4.1.5 Problems with hierarchical cluster analysis . . . . . . . . . . . . . . . . . . . 59
4.1.6 Hierarchical clustering in R . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2 Cophenetic Correlation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Divisive hierarchical clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 K-means clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.4.1 Partitioning around medoids . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.4.2 Hybrid Algorithms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5 K-centroids . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5 Multidimensional scaling 71
5.1 Metric Scaling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1.1 Similarities with principal components analysis . . . . . . . . . . . . . . . . . 73
5.2 Visualising multivariate distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3 Assessing the quality of fit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.3.1 Sammon Mapping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6 Multivariate normality 79
6.1 Expectations and moments of continuous random functions . . . . . . . . . . . . . . 79
6.3 Multivariate normality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
6.5.1 R estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.6 Transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
7 Inference for the mean 85
7.1 Two sample Hotelling’s T2 test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.2 Constant Density Ellipses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.3 Multivariate Analysis of Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8 Discriminant analysis 95
8.1 Fisher discimination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
8.2 Accuracy of discrimination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
8.3 Importance of variables in discrimination . . . . . . . . . . . . . . . . . . . . . . . . 99
8.4 Canonical discriminant functions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8.5 Linear discrimination - a worked example . . . . . . . . . . . . . . . . . . . . . . . . 100
9 Principal component analysis 101
9.1 Derivation of Principal Components . . . . . . . . . . . . . . . . . . . . . . . . . . 103
9.1.1 A little geometry . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
9.1.2 Principal Component Stability . . . . . . . . . . . . . . . . . . . . . . . . . 108
9.2 Some properties of principal components . . . . . . . . . . . . . . . . . . . . . . . . 110
9.8 Illustration of Principal Components . . . . . . . . . . . . . . . . . . . . . . . . . . 112
9.8.1 An illustration with the Sydney Heptatholon data . . . . . . . . . . . . . . . 112
9.8.2 Principal component scoring . . . . . . . . . . . . . . . . . . . . . . . . . . 113
9.8.3 Prepackaged PCA function 1: princomp() . . . . . . . . . . . . . . . . . . 114
9.8.4 Inbuilt functions 2: prcomp() . . . . . . . . . . . . . . . . . . . . . . . . . 115
9.9 Principal Components Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
9.10 “Model” criticism for principal components analysis . . . . . . . . . . . . . . . . . . 117
9.10.1 Distribution theory for the Eigenvalues and Eigenvectors of a covariance matrix118
9.13 Sphericity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
9.15.1 Partial sphericity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
9.22 How many components to retain . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9.22.1 Data analytic diagnostics . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9.23.1 Cross validation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
9.23.2 Forward search . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
9.23.3 Assessing multivariate normality . . . . . . . . . . . . . . . . . . . . . . . . 138
9.25 Interpreting the principal components . . . . . . . . . . . . . . . . . . . . . . . . . 141
9.27 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
10 Canonical Correlation 143
10.1 Canonical variates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
10.2 Interpretation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
10.3 Computer example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
10.3.1 Interpreting the canonical variables . . . . . . . . . . . . . . . . . . . . . . . 147
10.3.2 Hypothesis testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
11 Factor analysis 149
11.1 Role of factor analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
11.2 The factor analysis model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
11.2.1 Centred and standardised data . . . . . . . . . . . . . . . . . . . . . . . . . 152
11.2.2 Factor indeterminacy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
11.2.3 Strategy for factor analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
11.3 Principal component extraction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
11.3.1 Diagnostics for the factor model . . . . . . . . . . . . . . . . . . . . . . . . 158
11.3.2 Principal Factor solution . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
11.4 Maximum likelihood solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
11.5 Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
11.6 Factor scoring . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
掃碼加我 拉你入群
請(qǐng)注明:姓名-公司-職位
以便審核進(jìn)群資格,未注明則拒絕
|