対応分析(correspondence analysis)は、フランスのベンゼクリ(Benzecri)によって1960年代に提唱され、1970年代から普及し始めたカテゴリカルデータの解析方法で、コレスポンデンス分析とも呼ばれている。
類似の方法としては、1940年代に林知己夫氏によって提案された数量化Ⅲ類、1980年代に西里静彦氏によって提案された双対尺度法(dual scaling)などがある。それぞれの方法が提案された背景は異なるが、基本的なアプローチおよびアルゴリズムの中核は同じである。
データ形式によっては、それぞれの手法の解析結果は変換によって一致させることも可能である。一時的には、数量化Ⅲ類と対応分析は異なるデータ分析方法と見なされたが、既に数理的には同等であることが証明されている。
数量化Ⅲ類および対応分析の基本的考え方は、分割表において、行の項目と列の項目の相関が最大になるように、行と列の双方を並び替えることである。問題解決のアプローチは、主成分分析、因子分析とほぼ同じである。そこで、対応分析を制約つき主成分分析 [1]、正準相関分析 [2]、質的因子分析として見なす研究者もいる。
対応分析は、データの構造を再現する面では、古典的主成分分析より効果が劣るが、特徴別に分類する面では、古典的主成分析より良い結果を示すケースが多い。
対応分析の大まかなアルゴリズムを説明するため、表1のような度数に関する分割表があるとする。