(1)質的比較分析について
質的比較分析(qualitative comparative analysis: QCA)は、Ragin(1987)によって提唱された分析手法であり、社会現象における事例を複数の特性の組み合わせとしてとらえ、事例間の類似と差異を体系的に検討することを可能にする手法として、社会学や政治学の世界を中心に注目を集めています。
例えば「AIを使った人材の採用を行なっている企業はどういう企業なのか?」というように、ある事象の帰結がすでにわかっており、それを数量的に把握することができるような場合、通常分析に用いられるのは、回帰分析をはじめとする多変量解析になります。
この場合、例えば「AIを使った人材の採用を行なっている企業かどうか?」を0、1の2値からなる従属変数として設定し、種々の説明変数を投入したプロビット(もしくはロジスティック)回帰モデルを組んで、パラメータを推定するというやり方になるだろう。経営学に限らず、社会科学の多くの分野において、因果関係の推定はこうした方法で行われることが多いでしょう。
母集団において従属変数の値(この場合は0、1)に十分な分散があり、そこから得られたサンプルにもそれが十分に反映されている場合には、そのサンプルのデータに対して回帰モデルを当てはめることによって、従属変数の変動を左右する要因を推定することが可能になるわけです。
反対に言えば、回帰モデルの推定のためにはサンプル数が十分に大きいことが絶対的な条件となっており、その条件が満たされない場合、多重共線性や自由度の問題に対して極めて脆弱になってしまうのです。
このように、研究者が観察しうる事象に該当する事例数が「小規模Nもしくは中規模Nの研究デザインにおいて、1つの事例内の複雑性を適切に扱うのと同時に、体系的な事例間の比較を可能にする」のがQCAです。
とはいえ、何をもって少数事例、多数事例とするかに関して明確な区別が存在するわけではありません。
例えばQCA提唱者のRaginは、小規模N(small number)とは2事例から10ないし15事例までを指し、これを超える規模つまり10ないし15から100事例程度の場合を中規模N(mediam number)の状況と呼んでいます。
これに対して田村(2015)は、およそ一桁の事例数の場合に少数事例、10から30程度の場合に中程度の事例といい、それ以上の事例数の場合をもって多数事例(large number)と呼ぶとしています。
つまり事例規模に関する理解は、研究者によって微妙に異なる訳であるが、いずれの基準を採用するにしても、母集団においてすら少数の事例しかない「多様な入り口を設定」という現象を扱う本研究においては、QCAによる因果関係の分析が極めて有望な選択肢といえます。
詳しくは以下のテキストを見てみてほしいのですが、ここではイメージを掴んでもらうために簡単に説明してもらいます。
参考文献:
Ragin, C. C. (1987) The Comparative Method. Moving Beyond Qualitative and Quantitative Strategies. Berkeley. Los Angeles and London: University of California Press.
Rihoux, B., and Ragin, C. C. (2009) Configurational Comparative Methods: Qualitative Comparative Analysis (QCA) and Related Techniques. (石田淳・齋藤圭介完訳『質的比較分析(QCA)と関連手法入門』晃洋書房, 2016).
田村正紀(2015)『経営事例の質的比較分析法: スモールデータで因果を探る』白桃書房.
(2)QCAの考え方と分析の流れ
ではQCAとは、具体的にどのような手法なのでしょうか。
経営学分野においてこの手法を導入した比較的初期の研究であるため、本研究ではまず、この点を簡単に説明しておきましょう。
いま仮に、ある社会現象Yが生じる原因を知りたいとします。
例えば、「AIを使った人材の採用を行なっている企業はどういう企業なのか?」だとしましょうか。
研究者として、X1、X2、X3という3つの原因を想定し、この3つと結果である現象Yの生起に関する様々なパタンを、ケースとしてデータ収集したとする。QCAでは、そうしたケース1つ1つについて、原因となる条件、結果となる現象が存在するかどうかということを、0、1の2値によって置き換えていく。
これは集合論でいうところの「全体集合」と「空集合(Φ)」をそれぞれ0と1の2値で表していることになり、このことにより、各ケースが種々の原因条件の集合に属するか否か、ということを表現しています。
原因条件の選択については、Amenta amd Paulsen(1994)による議論が役に立ちます。
彼らは、QCAにおいて原因条件を選定アプローチには、少なくとも以下の5種類があるとしています。
(1)包括的アプローチ:分析を何度も反復する中で、可能性のある要因を全て検討する
(2)パースぺクティブ・アプローチ:2、3の理論をもとに、その理論が示す一連の条件をモデルに投入してテストを行う。当該現象に関する理論が一定程度ある場合に有効なアプローチ。
(3)有意性アプローチ:統計的な優位性の基準にもとづいて、条件を選択する
(4)再検討アプローチ:先行研究では退けられているが、研究者が重要と考える条件を加えるアプローチ
(5)結合的理論アプローチ:単一の結果に対して多元的な原因の組み合わせがあることを予測するような理論に基づいて条件を選択する
(6)帰納的アプローチ:既存の理論ではなく、事例に関する知識と洞察に基づいて条件を選択する。その事例に関わる理論が不足している場合に有効なアプローチ
これらのうち、いずれを選択するべきかということは、研究者が対象とする事例のタイプ、その事例を対象とした先行研究の蓄積のレベル、研究者が調査に先立って事例に関する知識を持つことができる程度に依存します。
このようなデータをもとに、全ての原因条件と結果となる現象の組み合わせを一覧表として整理した真理表(truth table)を構成します。
真理表の各行は、独立変数である原因条件の組み合わせ、そして、それぞれの条件の組み合わせによって起こる結果となる現象が、それぞれ2値で与えられます。
真理表の行数は、原因となる条件Nに対して2のN乗行となる。結果であるYは、同じ原因条件の組み合わせの事例のうち、Yが起こったケースの数を数えて判断することになります。
例えば、各行のケースのうちすべてのケースで事象Yが起こっている場合に結果の値を1に、すべてのケースで結果Yが起こっていない場合には0を与えています。
この例では、同じ原因条件を持つケースはすべて同じ結果につながっていますが、場合によっては、同一の条件の組みあわせにもかかわらず、生起する結果が異なることもあリマス。
このように相互に矛盾を含んだ行(contradictory row)をどう扱うかに関しては、様々な基準が設定されています。
なお、表1の下から2行目は、論理的にはありうるが実際にはそのような事例が観察されなかった、ということを表しているのですが、こうした自体はしばしば起こります。
これは研究者による事例の収集不足による場合もあるが、より重要な原因としては、論理的にありうる原因条件の組み合わせに対して、現実に生起するバリエーションが限定されていることによリます。
このように、論理的にはありうるが経験的には生起していない(あるいは少なくとも、当該研究においては観察されていない)組み合わせは論理的残余(ligical remainder) と呼ばれ、取り扱いに関してかなり議論がなされている。本研究では、後に述べるようにこの論理的残余を0として扱うことにします。
真理表のイメージ
原因となる条件 |
結果 |
該当する事例数 |
||
X1 |
X2 |
X3 |
Y |
|
0 |
1 |
1 |
0 |
1 |
0 |
1 |
0 |
0 |
1 |
0 |
0 |
1 |
0 |
2 |
0 |
0 |
0 |
1 |
4 |
1 |
1 |
1 |
1 |
3 |
1 |
1 |
0 |
1 |
2 |
1 |
0 |
1 |
|
0 |
1 |
0 |
0 |
1 |
1 |
さてこのように真理表を得ることで、いよいよ分析が行われることになります。
分析はこの真理表にもとづき、結果Yをもたらす原因条件の組み合わせをブール代数式で表現することで行われます。
ブール代数式では、ある原因条件が存在する(つまり、その条件の値が1である)場合には大文字を、存在しない(値が0である)場合には小文字を使い、結果Yをもたらす多元結合因果(multiple conjunction causation)を以下のように表現するのです。これをブール式といいます。
X1*X2*X3 + X1*X2*x3 + x1*x2*x3 → Y・・・・・・・・・・・・・・・・・(1)
ブール式中で*は集合論でいうところの「かつ(AND)」つまり積集合を、+は「または(OR)」つまり和集合を、→は同値関係を、それぞれ表します。
つまり(1)式は、Yが生起するためには、X1とX2とX3が同時に存在する、もしくはX1とX2が存在しX3が存在しない、もしくはX1とX2とX3 がいずれも存在しないという、いずれかの条件が必要だということを意味します。
ただしこれは、Yをもたらす原因条件の記述としては、やや複雑すぎます。
QCAではこのように得られた一次的な多元結合因果を、ブール最小化と呼ばれる手続きに従って、より縮約された式へと変換していくのです。
ブール最小化とは、長く複雑な式を、より短く、より節約的な式へと変換することです。
具体的には、ブール式中の2つの項(つまり条件の組み合わせ)の相違がただ1つの原因条件だけであり、かつ、それぞれの項で同じ結果が生じているのであれば、2つの項の相違にあたる原因条件は、結果の正規に対して無関係であるため削除する、という方法になります。
集合論の言葉でいうならば、全ての条件組み合わせ集合を包含するような、より単純な部分集合を見つけていく、という手続きになります。
直感的ないい方をするならば、論理的に1つの項にまとめることができる2つ以上の項はまとめる、ということですね。
上記の例で考えてみましょう。
(1)をベン図に表したものが図1であり、それをブール最小化によりまとめたものが図2になります。
図1において、X1*X2*x3とX1*X2*X3と書かれている部分は、要するにX1とX2が重なった部分に他ならないため、これはX1*X2とより簡略化して表現することができます。
また図1でX1x2x3とされている部分と、x1x2x3とされている部分は、要するにX2とX3の空集合であるから、これはx2x3と簡略化できます。
このようにして(1)は、以下の(2)のブール式へと変換できるのです。
X1*X2 + x2*x3 → Y・・・・・・・・・・・・・・・・・・・・・・・・・・・(2)
つまりX1とX2が同時に存在する、もしくはX2とX3がどちらも存在しない場合に結果Yが生起する、というのが、この分析の最終的な結果になるわけです。
左図1 Yをもたらす原因条件のベン図による表現:(1)式に対応 (左)
右図2 Yをもたらす原因条件のベン図による表現:(2)式に対応 (右)
(3)QCAのメリットとデメリット
このようにRaginが提唱したQCAは、観察対象となる事例を数値的かつ客観的に処理するという意味では多変量解析に代表される定量的研究に近く、事例を各原因条件の組み合わせとして捉えることで、特定の事例が持つ複雑さを捨象せずに現象に宿る因果関係を探求するという意味ではケーススタディに代表される定性的な研究に近いといえます。
こうした性質を持つため、QCAはしばしば、定量的研究と定性的な研究を架橋するアプローチともいわれるのです。
QCAの主要なメリットとしては、以下の点がしばしば指摘されています。
(1)社会的な現象の多様性と因果関係の複雑性を分析することができること
(2)事例間の論理的かつ体系的な比較が可能であること
(3)分析の手続きが体系化されており、透明であること
(4)多変量解析と同じように、多数の事例を処理することもできること
(5)より節約的な説明モデルを得ることができること
このうち(1)については、多変量解析によっても成し遂げることができる。多様な変数を扱い、それらの中から、統計的、論理的に意味のある連関を見出すことのが、多変量解析の醍醐味ですらあります。
例えば上記の例でも、Yを従属変数、X1X2X3を説明変数としたプロビット(もしくはロジスティック)回帰モデルを組んで、パラメータを推定するということも、場合によっては可能である。ただ、先に述べたように、多変量解析によって分析を行うためには、一定数以上のサンプル数が必要になります。
複数の要因間の関係を読み解くための分析、例えば交互作用項付の重回帰分析には相当数のサンプル数が必要になり、小サンプルでの分析は、多重共線性や自由度に対して極めて脆弱になります。
その点QCAは、少数事例であっても因果関係を分析することが可能です。
とはいえこの手法にも、様々な問題はあります。
しばしば指摘されるのは、以下のような点です。
(1)データの2値化の問題
(2)事例に対する敏感さ
(3)分析に用いる原因条件をどのように選択するかという問題
(4)因果関係のメカニズムが、ブラックボックスに入ってしまうこと
(5)時間的変化を考慮していないこと
QCAは、結果となる事象の生起、そして原因となる条件の有無を、いずれも0、1の2値で捉えるが、こうした変換により現実のケースが持つリッチな情報が極端に縮約されています。
実際には比率尺度や間隔尺度や順序尺度の水準である現象ですら、分析の便宜上、名義尺度へと変更されてしまうのです。
この点を指摘したのが(1)。
この手法が提唱された当初から、この問題は指摘されてきたのですが、この点についてRaginは、この手法を紹介した代表的なテキストであるRihoux and Ragin(2009)の中でこう回答しています。
2値化は、複雑性を縮減させるという点で単純化の1つのかたちである。たとえ情報の損失をともなったとしても、単純化は十分に正当化できる。実際、「質的」か「量的」か、経験的か否かを問わず、社会科学など全ての科学的研究は、世界の無限の複雑性に関して、単純化へと一歩足を進めることを必然的に含意する。単純化は、複雑性についての私たちの理解を深めることを可能にしてくれるのだ。(中略)つまり2値化は、単純化をとおして、複雑な内的特性の組み合わせを示す限られた事例について、厳密な比較を可能にするのだ。
(2)は、少数事例であっても社会現象の因果関係に迫ることができる、というQCAの特徴に関わる指摘です。
例えば多変量解析の場合、仮にいくつかの少数事例において、ある説明変数X1と従属変数Yが同時に生起していたとしても、他の大多数の事例においてそのような関係が存在していなければ、私たちはそこにX1とYの因果関係を見てとる事はできません。
大量サンプルの存在によって、少数の例外的な事象の影響が相殺されるからです。
これに対してQCAでは、X1とYの組み合わせが20の事例で観察されようとも、あるいはたった1つの事例だけで観察されようとも、その組み合わせに同等の重要性を与えることになります。
その意味で、たった1つの事例に対して、分析結果が極めて敏感になるわけです。
したがってQCAにおいては、観察されたX1とYの関係が、逸脱値や外れ値ではなく、論理的にも経験的にも意味のあるものであるということを、(データではなく)研究者自身が判断しなければなりません。
反対にいえば、その限りにおいて、多変量解析であれば見逃していたかもしれない、変数と変数の意味のある連関を見出す可能性に開かれ手法でもあります。
残りの(3)(4)(5)は、いずれも、QCAに特有の問題というよりは、多変量解析を含めた数量的な研究一般に当てはまることですね。
統計解析においてそうであるように、QCAにおいても、投入する変数の選択は、論理的、理論的あるいは経験的な考察に基づいた上でなされなければなりません(3及び4)。
時間の経過を分析できないことも、QCAの限界です。
多変量解析の分野では、計量経済学の分野を中心に、説明変数が生起する時間的順序をモデルに組み込んだりすることが可能になっているが、少なくとも現時点では、そのような時間の経過を分析の中に取り込む事はできません。
QCAではブール式の条件を、時間的な順序を考慮して配列する事はできないのが現状です。
従ってこの分析を行う際に、研究者自身が変数の間の時間的な連関を意識して、従属変数と説明変数を選択することが極めて重要になります。