はじめに

このノートは「ベイズ統計」に関する何らかの内容をまとめ、ベイズ統計への理解を深めていくために作成している。今回は「社会科学のためのベイズ統計モデリング」の第8章を写経していく。基本的には気になった部分を写経しながら、ところどころ自分用の補足をメモすることで、自分用の補足資料になることを目指す。私の解釈がおかしく、メモが誤っている場合があるので注意。

社会科学のためのベイズ統計モデリング

9.1 遅延価値割引のモデル

2つの選択肢を与えられ、どちらの選択肢を選ぶか。

今すぐ1万円もらえる
1年後に1万円もらえる

多くの人は「今すぐ1万円もらえる」という即時報酬を選ぶ。このような現象を遅延価値割引(Delay Discounting)と呼ぶ。時間経過を伴って、財やサービスの主観的な価値が下がる現象のこと。

いくつかのモデルが提案されており、基本的なモデルが指数価値割引モデル、現在の公用が\(U(A)\)であるような財\(A\)に対し、\(t\)時間後の効用を

\[ \begin{eqnarray} U(A,t) = U(A) e^{-kt} \end{eqnarray} \]

と表すモデルのこと。\(k(k>0)\)は割引率パラメタで、割引の度合いをコントロールする。\(e^{-kt}\)は割引因子と呼ばれ、割引のされ方を表現する。現在価値に対する将来価値の割引を表す。\(k\)が正の間、割引因子\(e^{-kt}\)は0から1の範囲を取るため、財\(U(A)\)は初期時点よりも必ず小さくなる。

経済学の分野では、指数価値モデルが規範的なモデルとして利用されているが、心理学の分野では、他にも双曲価値モデルも提案されており、行動実験の結果から、双曲価値モデルのほうが現実を説明しやすいと言われる。時間が経過するに連れて、時点間の割引因子はの比は小さくなるためである。

\[ \begin{eqnarray} U(A,t) = U(A) \frac{1}{1+kt} \end{eqnarray} \]

赤色が指数価値モデル、青色が双曲価値モデルを可視化したもの。双方\(k=0.1, U(A)=50000\)である。青色の双曲価値モデルは、時間経過と共に割引が緩やかになることがわかる。

library(tidyverse)
library(rstan)

options(max.print = 999999)
rstan_options(auto_write=TRUE)
options(mc.cores=parallel::detectCores())

t <- seq(0, 24, 0.1)

expmodel <- function(U, k, t){
  return(U * exp(-k*t))
}

hyperbolicmodel <- function(U, k, t){
  return(U * 1/(1+k*t))
}

df <- tibble(
  t = t,
  y1 = expmodel(50000, 0.1, t),
  y2 = hyperbolicmodel(50000, 0.1, t)
)

ggplot() + 
  theme_bw(base_size = 15) + 
  geom_line(data = df, aes(t, y1), col = 'tomato') +
  geom_line(data = df, aes(t, y2), col = 'royalblue') +
  scale_x_continuous(breaks = seq(0, 24, 2)) +
  labs(title = 'Delay Discounting Model(k=0.1)', y = "U(A)")

9.2 遅延価値割引の理論的整理

Sozou(1998)のモデルに基づいてメカニズムを考える。将来得られる財の効用を割り引く理由として、遅延の間に財の獲得を妨げる事象が生起するリスクを人々が考慮している可能性がある。そのため、将来得られるはずの財は、一定の確率で獲得を失敗する可能性があるため、価値を割り引く。

遅延価値割引の割引因子が\(t\)時間後にその財がまだ存在している確率によって計算され、その期待値が効用の割引になるとSozou(1998)のモデルでは考える。

理論的背景の詳細については、参考書にかかれているため、下記の通りメモ程度に記載しておく。

SozouModel(1998)

9.3.1 選好を決定する方略

遅延価値割引は、ある財について、現在と将来の効用を元に選好が決定されると考える。\(d\)時間後の財\(A\)を獲得できる場合\(A^{delay}\)、即時に財\(A\)を獲得できる場合\(A^{soon}\)とする。つまり、\(d=0\)のとき\(A^{s}=A^{0}\)と同じ。\(A^{delay}\)と\(A^{soon}\)の2つの財について、どちらを選好するかを確率モデルで表現する。即時報酬\(A^{soon}\)と遅延報酬\(A^{delay}\)の効用は、

\[ \begin{eqnarray} U(A,t) &=& U(A,0) = U(A^{s}) \\ U(A,t) &=& U(A,d) = U(A^{d}) \\ \end{eqnarray} \]

即時報酬\(A^{s}\)を選好すれば0、遅延報酬\(A^{d}\)を選好すれば1とする確率変数を考える。それが、パラメタ\(\theta^{d}\)をもつベルヌイ分布に従うと考える。\(A^{d} \succeq A^{s}\)は\(A^{d}\)を\(A^{s}\)よりも選好することを表す。

\[ \begin{eqnarray} P(A^{d} \succeq A^{s}) = \theta^{d} \end{eqnarray} \]

遅延報酬\(A^{d}\)が選択される確率は、即時報酬\(A^{s}\)と遅延報酬\(A^{d}\)の効用の差に基づいて決定されると考える。人は効用を最大化するように選好するわけではなく、ときとして効用が小さい方を選好する場合もある。

選好関数としてソフトマックス行動戦略と呼ばれる選好関数を仮定する。\(\beta\)は逆温度パラメタと呼ばれ、\(\beta=0\)ならば確率は0.5となり、\(\beta \rightarrow \infty\)の場合、\(U(A^{s})\)が少しでも\(U(A^{d})\)より大きければ0、\(U(A^{d})\)が少しでも\(U(A^{s})\)より大きければ1になる。

\[ \begin{eqnarray} \theta^{d} = \frac{exp\{\beta U(A^{d})\}}{exp\{\beta U(A^{s})\}+exp\{\beta U(A^{d})\}} \end{eqnarray} \]

このソフトマックス選好関数は即時報酬\(A^{s}\)と遅延報酬\(A^{d}\)の差を説明変数とした\(\beta\)を回帰係数としたロジスティック回帰分析と同様の確率モデルで表現できる。

\[ \begin{eqnarray} \theta^{d} &=& \frac{exp\{\beta \cdot U(A^{d})\}}{exp\{\beta \cdot U(A^{s})\}+exp\{\beta \cdot U(A^{d})\}} \\ &=& \frac{exp\{\beta \cdot U(A^{d})\}\frac{1}{exp\{\beta \cdot U(A^{d})\}}}{(exp\{\beta \cdot U(A^{s})\}+exp\{\beta \cdot U(A^{d})\})\frac{1}{exp\{\beta \cdot U(A^{d})\}}} \\ &=& \frac{1}{1 + exp\{-\beta \cdot [U(A^{d}) - U(A^{s})]\}} \\ \end{eqnarray} \]

効用関数は、指数割引モデル、双曲割引モデルを利用できる。

\[ \begin{eqnarray} U(A^{s}) &=& U(A,t) = U(A,0) = A e^{-0k} \\ U(A^{1}) &=& U(A,t) = U(A,1) = A e^{-1k} \\ U(A^{2}) &=& U(A,t) = U(A,2) = A e^{-2k} \\ ... \\ U(A^{t}) &=& U(A,t) = U(A,t) = A e^{-tk} \\ \end{eqnarray} \]

9.3.2 行動データによるモデリング

即時報酬\(A^{s}\)と遅延報酬\(A^{d}\)の主観的等価点を推定する手法が用いられる。主観的等価点とは、

1. 即時報酬\(A^{s}\)を5万円、遅延報酬\(A^{d}\)は1年後に5万円という条件を提示
1. 即時報酬\(A^{s}\)を4万円、遅延報酬\(A^{d}\)は1年後に5万円という条件を提示
1. 即時報酬\(A^{s}\)を3万円、遅延報酬\(A^{d}\)は1年後に5万円という条件を提示
1. 即時報酬\(A^{s}\)を2万円、遅延報酬\(A^{d}\)は1年後に5万円という条件を提示
1. 即時報酬\(A^{s}\)を1万円、遅延報酬\(A^{d}\)は1年後に5万円という条件を提示

このような質問を繰り返し、選好がひっくり返る点に即時報酬があると判断する。

9.4 ベイズ統計モデリングによる遅延価値割引の推定

サンプルデータとStanでサンプリングする際に利用するデータを用意する。

dat <- read.csv('https://raw.githubusercontent.com/HiroshiHamada/BMS/master/ch09/discount_data.csv')

N <- ncol(dat[-(1:3)])
Trial <- nrow(dat)
D <- dat$D
amount_soon <- dat$amount_soon/10000
amount_delay <- 5
choice <- t(dat[-(1:3)]-1)

datastan <- list(
  N = N,
  Trial = Trial,
  D = D,
  amount_delay = amount_delay,
  amount_soon = amount_soon,
  choice = choice
  )

datastan

## $N
## [1] 30
## 
## $Trial
## [1] 50
## 
## $D
##  [1]  1  1  1  1  1  1  1  1  1  1  3  3  3  3  3  3  3  3  3  3  6  6  6  6  6
## [26]  6  6  6  6  6 12 12 12 12 12 12 12 12 12 12 24 24 24 24 24 24 24 24 24 24
## 
## $amount_delay
## [1] 5
## 
## $amount_soon
##  [1] 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0
## [20] 0.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5
## [39] 1.0 0.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5
## 
## $choice
##       [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13]
## sub1     0    1    1    1    1    1    1    1    1     1     0     0     1
## sub2     0    1    1    1    1    1    1    1    1     1     0     1     1
## sub3     0    0    0    0    0    1    1    1    1     1     0     0     0
## sub4     0    1    1    1    1    1    1    1    1     1     0     0     0
## sub5     0    1    1    1    1    1    1    1    1     1     0     0     0
## sub6     0    0    0    0    1    1    1    1    1     1     0     0     0
## sub7     0    1    1    1    1    1    1    1    1     1     0     0     0
## sub8     0    1    1    1    1    1    1    1    1     1     0     1     1
## sub9     0    1    1    1    1    1    1    1    1     1     0     1     1
## sub10    0    0    0    1    1    1    1    1    1     1     0     0     0
## sub11    0    0    0    1    1    1    1    1    1     1     0     0     0
## sub12    0    0    1    1    1    1    1    1    1     1     0     0     0
## sub13    0    0    0    0    0    0    1    1    1     1     0     0     0
## sub14    1    1    1    1    1    1    1    1    1     1     1     1     1
## sub15    0    0    1    1    1    1    1    1    1     1     0     0     0
## sub16    0    0    0    1    1    1    1    1    1     1     0     0     0
## sub17    0    0    0    0    0    1    1    1    1     1     0     0     0
## sub18    0    1    1    1    1    1    1    1    1     1     0     1     1
## sub19    0    1    1    1    1    1    1    1    1     1     0     1     1
## sub20    0    0    1    1    1    1    1    1    1     1     0     0     1
## sub21    0    1    1    1    1    1    1    1    1     1     0     1     1
## sub22    0    0    0    1    1    1    1    1    1     1     0     0     1
## sub23    0    0    0    1    1    1    1    1    1     1     0     0     0
## sub24    0    0    0    0    0    1    1    1    1     1     0     0     0
## sub25    0    1    1    1    1    1    1    1    1     1     0     0     1
## sub26    0    1    1    1    1    1    1    1    1     1     0     1     1
## sub27    0    0    0    0    0    0    0    1    1     1     0     0     0
## sub28    0    1    1    1    1    1    1    1    1     1     0     0     0
## sub29    0    0    0    1    1    1    1    1    1     1     0     0     0
## sub30    0    0    0    1    1    1    1    1    1     1     0     0     0
##       [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25]
## sub1      1     1     1     1     1     1     1     0     0     0     1     1
## sub2      1     1     1     1     1     1     1     0     1     1     1     1
## sub3      0     0     0     1     1     1     1     0     0     0     0     0
## sub4      1     1     1     1     1     1     1     0     0     0     0     1
## sub5      0     1     1     1     1     1     1     0     0     0     0     0
## sub6      0     1     1     1     1     1     1     0     0     0     0     0
## sub7      1     1     1     1     1     1     1     0     0     0     0     1
## sub8      1     1     1     1     1     1     1     0     1     1     1     1
## sub9      1     1     1     1     1     1     1     0     1     1     1     1
## sub10     0     0     1     1     1     1     1     0     0     0     0     0
## sub11     0     0     0     0     0     1     1     0     0     0     0     0
## sub12     1     1     1     1     1     1     1     0     0     0     1     1
## sub13     0     0     0     0     1     1     1     0     0     0     0     0
## sub14     1     1     1     1     1     1     1     1     1     1     1     1
## sub15     1     1     1     1     1     1     1     0     0     0     0     0
## sub16     0     0     1     1     1     1     1     0     0     0     0     0
## sub17     0     0     0     1     1     1     1     0     0     0     0     0
## sub18     1     1     1     1     1     1     1     0     0     1     1     1
## sub19     1     1     1     1     1     1     1     0     1     1     1     1
## sub20     1     1     1     1     1     1     1     0     0     1     1     1
## sub21     1     1     1     1     1     1     1     0     0     1     1     1
## sub22     1     1     1     1     1     1     1     0     0     0     0     1
## sub23     1     1     1     1     1     1     1     0     0     0     1     1
## sub24     0     0     0     1     1     1     1     0     0     0     0     0
## sub25     1     1     1     1     1     1     1     0     0     1     1     1
## sub26     1     1     1     1     1     1     1     0     0     1     1     1
## sub27     0     0     0     0     1     1     1     0     0     0     0     0
## sub28     1     1     1     1     1     1     1     1     1     1     1     1
## sub29     0     0     0     0     1     1     1     0     0     0     0     0
## sub30     1     1     1     1     1     1     1     0     0     0     1     1
##       [,26] [,27] [,28] [,29] [,30] [,31] [,32] [,33] [,34] [,35] [,36] [,37]
## sub1      1     1     1     1     1     0     0     0     0     1     1     1
## sub2      1     1     1     1     1     0     1     1     1     1     1     1
## sub3      0     0     1     1     1     0     0     0     0     0     0     0
## sub4      1     1     1     1     1     0     0     0     0     0     1     1
## sub5      1     1     1     1     1     0     0     0     0     0     0     0
## sub6      1     1     1     1     1     0     0     0     0     0     0     0
## sub7      1     1     1     1     1     0     0     0     0     0     1     1
## sub8      1     1     1     1     1     0     0     1     1     1     1     1
## sub9      1     1     1     1     1     0     1     1     1     1     1     1
## sub10     0     1     1     1     1     0     0     0     0     0     0     0
## sub11     0     0     0     0     1     0     0     0     0     0     0     0
## sub12     1     1     1     1     1     0     0     0     0     0     1     1
## sub13     0     0     0     0     1     0     0     0     0     0     0     0
## sub14     1     1     1     1     1     1     1     1     1     1     1     1
## sub15     1     1     1     1     1     0     0     0     0     0     1     1
## sub16     0     0     1     1     1     0     0     0     0     0     0     0
## sub17     0     0     1     1     1     0     0     0     0     0     0     0
## sub18     1     1     1     1     1     0     0     1     1     1     1     1
## sub19     1     1     1     1     1     0     1     1     1     1     1     1
## sub20     1     1     1     1     1     0     0     0     1     1     1     1
## sub21     1     1     1     1     1     0     0     0     1     1     1     1
## sub22     1     1     1     1     1     0     0     0     0     1     1     1
## sub23     1     1     1     1     1     0     0     0     0     0     1     1
## sub24     0     0     1     1     1     0     0     0     0     0     0     0
## sub25     1     1     1     1     1     0     0     0     0     1     1     1
## sub26     1     1     1     1     1     0     0     0     1     1     1     1
## sub27     0     0     0     0     1     0     0     0     0     0     0     0
## sub28     1     1     1     1     1     0     1     1     1     1     1     1
## sub29     0     1     1     1     1     0     0     0     0     0     0     0
## sub30     1     1     1     1     1     0     0     0     1     1     1     1
##       [,38] [,39] [,40] [,41] [,42] [,43] [,44] [,45] [,46] [,47] [,48] [,49]
## sub1      1     1     1     0     0     0     0     0     0     1     1     1
## sub2      1     1     1     0     1     1     1     1     1     1     1     1
## sub3      0     0     0     0     0     0     0     0     0     0     0     0
## sub4      1     1     1     0     0     0     0     0     0     0     1     1
## sub5      0     0     1     0     0     0     0     0     0     0     0     0
## sub6      0     0     0     0     0     0     0     0     0     0     0     0
## sub7      1     1     1     0     0     0     0     0     0     1     1     1
## sub8      1     1     1     0     0     0     0     0     1     1     1     1
## sub9      1     1     1     0     1     1     1     1     1     1     1     1
## sub10     0     0     0     0     0     0     0     0     0     0     0     0
## sub11     0     0     1     0     0     0     0     0     0     0     0     0
## sub12     1     1     1     0     0     0     0     1     1     1     1     1
## sub13     1     1     1     0     0     0     0     0     0     0     0     0
## sub14     1     1     1     1     1     1     1     1     1     1     1     1
## sub15     1     1     1     0     0     0     0     0     0     1     1     1
## sub16     0     0     1     0     0     0     0     0     0     0     0     0
## sub17     0     1     1     0     0     0     0     0     0     0     0     0
## sub18     1     1     1     0     0     1     1     1     1     1     1     1
## sub19     1     1     1     0     0     0     0     0     1     1     1     1
## sub20     1     1     1     0     0     0     0     0     0     0     1     1
## sub21     1     1     1     0     0     0     0     0     0     1     1     1
## sub22     1     1     1     0     0     0     0     0     0     0     0     0
## sub23     1     1     1     0     0     0     0     0     1     1     1     1
## sub24     0     1     1     0     0     0     0     0     0     0     0     0
## sub25     1     1     1     0     0     0     0     0     1     1     1     1
## sub26     1     1     1     0     0     0     0     0     0     1     1     1
## sub27     0     0     0     0     0     0     0     0     0     0     0     0
## sub28     1     1     1     0     1     1     1     1     1     1     1     1
## sub29     0     0     1     0     0     0     0     0     0     0     0     0
## sub30     1     1     1     0     0     0     0     0     1     1     1     1
##       [,50]
## sub1      1
## sub2      1
## sub3      0
## sub4      1
## sub5      0
## sub6      0
## sub7      1
## sub8      1
## sub9      1
## sub10     0
## sub11     1
## sub12     1
## sub13     1
## sub14     1
## sub15     1
## sub16     0
## sub17     0
## sub18     1
## sub19     1
## sub20     1
## sub21     1
## sub22     1
## sub23     1
## sub24     1
## sub25     1
## sub26     1
## sub27     0
## sub28     1
## sub29     0
## sub30     1

即時報酬と遅延報酬の関係は5万円から5千円づつ減少し、10パターン存在する。そして、遅延報酬の遅延期間は「1ヶ月、3ヶ月、6ヶ月、12ヶ月、24ヶ月」の5パターン。つまり、合計50パターン存在する。被験者は30人で、列ごとに条件の組み合わせ、行ごとにその結果が対象のセルに記録される。

D: DelayのDで遅延報酬のタイミングを表す。
amount_soon: 即時報酬の金額
sub1: 被験者1(Subject)
sub2: 被験者2(Subject)

             [,1]  [,2]  [,3]  [,4] ... [,48] [,49] [,50]
D               1     1     1     1 ...    24    24    24
amount_soon 50000 45000 40000 35000 ...  5000 10000  5000
sub1            0     1     1     1 ...     1     1     1
sub2            0     1     1     1 ...     1     1     1
sub3            0     0     0     0 ...     0     0     0
..
sub28           0     1     1     1 ...     1     1     1
sub29           0     0     0     1 ...     0     0     0
sub30           0     0     0     1 ...     1     1     1
pid             1     1     1     1 ...     5     5     5

被験者1のデータでより詳しくデータの詳細を確認する。\(A^{s}\)を選好すれば0をとる確率変数。

D=1, soon=50000のとき0: 1ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は50000円。回答は0なので即時報酬\(A^{s}\)を選択。
D=1, soon=45000のとき1: 1ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は45000円。回答は1なので遅延報酬\(A^{d}\)を選択。
D=1, soon=40000のとき1: 1ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は40000円。回答は1なので遅延報酬\(A^{d}\)を選択。
…
D=1, soon=5000のとき1: 1ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は5000円。回答は1なので遅延報酬\(A^{d}\)を選択。

             [,1]  [,2]  [,3]  [,4]  [,5]  [,6]  [,7]  [,8]  [,9] [,10] [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26] [,27] [,28] [,29] [,30] [,31] [,32] [,33] [,34] [,35] [,36] [,37] [,38] [,39] [,40] [,41] [,42] [,43] [,44] [,45] [,46] [,47] [,48] [,49] [,50]
D               1     1     1     1     1     1     1     1     1     1     3     3     3     3     3     3     3     3     3     3     6     6     6     6     6     6     6     6     6     6    12    12    12    12    12    12    12    12    12    12    24    24    24    24    24    24    24    24    24    24
amount_soon 50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 50000 45000 40000 35000 30000 25000 20000 15000 10000  5000
sub1            0     1     1     1     1     1     1     1     1     1     0     0     1     1     1     1     1     1     1     1     0     0     0     1     1     1     1     1     1     1     0     0     0     0     1     1     1     1     1     1     0     0     0     0     0     0     1     1     1     1

このように見たほうが、わかりやすいかもしれない。遅延期間が長くになるにつれて、回答0が増え、即時報酬\(A^{s}\)を選択しやすくなっている。下記は、24ヶ月後の例。

D=24, soon=50000のとき0: 24ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は50000円。回答は0なので即時報酬\(A^{s}\)を選択。
D=24, soon=45000のとき0: 24ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は45000円。回答は0なので即時報酬\(A^{s}\)を選択。
D=24, soon=40000のとき0: 24ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は40000円。回答は0なので即時報酬\(A^{s}\)を選択。
…
D=24, soon=25000のとき0: 24ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は25000円。回答は0なので即時報酬\(A^{s}\)を選択。
D=24, soon=20000のとき0: 24ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は20000円。回答は1なので遅延報酬\(A^{d}\)を選択。
…
D=24, soon=5000のとき0: 24ヶ月後の遅延報酬\(A^{d}\)は50000円、即時報酬\(A^{s}\)は5000円。回答は1なので遅延報酬\(A^{d}\)を選択。

## 1ヶ月後
              [,1]  [,2]  [,3]  [,4]  [,5]  [,6]  [,7]  [,8]  [,9] [,10] 
D                1     1     1     1     1     1     1     1     1     1 
amount_soon  50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 
sub1             0     1     1     1     1     1     1     1     1     1 
--------------------------------------------------------------------------
## 3ヶ月後
             [,11] [,12] [,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] 
D                3     3     3     3     3     3     3     3     3     3 
amount_soon  50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 
sub1             0     0     1     1     1     1     1     1     1     1 
--------------------------------------------------------------------------    
## 6ヶ月後
             [,21] [,22] [,23] [,24] [,25] [,26] [,27] [,28] [,29] [,30] 
D                6     6     6     6     6     6     6     6     6     6 
amount_soon  50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 
sub1             0     0     0     1     1     1     1     1     1     1 
--------------------------------------------------------------------------
## 12ヶ月後
             [,31] [,32] [,33] [,34] [,35] [,36] [,37] [,38] [,39] [,40] 
D               12    12    12    12    12    12    12    12    12    12 
amount_soon  50000 45000 40000 35000 30000 25000 20000 15000 10000  5000 
sub1             0     0     0     0     1     1     1     1     1     1 
--------------------------------------------------------------------------
## 24ヶ月後
             [,41] [,42] [,43] [,44] [,45] [,46] [,47] [,48] [,49] [,50]
D               24    24    24    24    24    24    24    24    24    24
amount_soon  50000 45000 40000 35000 30000 25000 20000 15000 10000  5000
sub1             0     0     0     0     0     0     1     1     1     1

モデルは下記の通り。最初は個人差を無視して、被験者全員が同じ割引率\(k\)をもつという仮定をおく。即時報酬\(A^{s}_{i}\)の大きさは、選択肢\(i \in \{ 1,2,3,...,49,50\}\)によって変更され、遅延報酬\(A^{d}\)は固定で50000円とする。\(P_{i}\)は選好データを表し、パラメタ\(\theta^{d}\)をもつベルヌイ分布に従うと仮定する。パラメタ\(\theta^{d}\)は、効用\(U(A^{s}_{i}), U(A^{d}_{i})\)の差がロジスティック関数で構造化されている。即時報酬の効用\(U(A^{s}_{i})\)は提示された即時報酬の金額\(A_{i}\)そのもの、遅延報酬の効用\(U(A^{d})\)が指数(双曲)価値割引される。

モデル1

\[ \begin{eqnarray} P_{i} &\sim& Bernoulli(\theta_{i}^{d}) \\ \theta_{i}^{d} &=& logistic(\beta \{U(A^{d}) - U(A^{s}_{i}) \}) \\ U(A^{s}_{i}) &=& U(A, t) = U(A_{i}, 0) = A_{i} \\ U(A^{d}_{i}) &=& U(A, t) = U(50000, d) = 50000 \cdot e^{-kd} \\ k &\sim& half\_Cauchy(0, 5) \\ \beta &\sim& half\_Cauchy(0, 5) \end{eqnarray} \]

Stanのモデルは下記の通り。

data {
  int N;
  int Trial;
  real D[Trial];
  real amount_delay;
  real amount_soon[Trial];
  int<lower=0,upper=1> choice[N,Trial];
}

parameters {
  real<lower=0> k;
  real<lower=0> beta;
}

model {
  real v_soon;
  real v_delay;
  
  for(t in 1:Trial) {
 // 双曲割引の場合は、下記v_delayを書き直す。
 // v_delay = amount_delay*1/(1+k*D[t]);
    v_delay = amount_delay*exp(-k*D[t]);
    v_soon = amount_soon[t];
    for(n in 1:N){
      target += bernoulli_logit_lpmf(choice[n,t] | beta*(v_delay-v_soon));
    }
  }
  target += cauchy_lpdf(k | 0,5) - cauchy_lccdf(0 | 0,5);
  target += cauchy_lpdf(beta | 0,5) - cauchy_lccdf(0 | 0,5);
}

モデルの挙動を確認しておく。

// N    : 30
// Trial: 50
model {
  for(t in 1:Trial) {
    v_delay = amount_delay*exp(-k*D[t]);
    v_soon = amount_soon[t];
    
    for(n in 1:N){
      target += bernoulli_logit_lpmf(choice[n,t] | beta*(v_delay - v_soon));
    }
  }
}

// Trial=1, N=1のとき
// v_delay = amount_delay*exp(-k*D[t]);
// v_delay = 5*exp(-k*D[1]);
// v_delay = 5*exp(-k*1);

// v_soon = amount_soon[t];
// v_soon = amount_soon[1];
// v_soon = 5.0;

// target += bernoulli_logit_lpmf(choice[n,t] | beta*(v_delay - v_soon));
// target += bernoulli_logit_lpmf(choice[1,1] | beta*(5*exp(-k*1) - 5.0));
// target += bernoulli_logit_lpmf(0 | beta*(5*exp(-k*1) - 5.0));
--------------------------------------------------------------------------------
// Trial=50, N=30のとき
// v_delay = amount_delay*exp(-k*D[t]);
// v_delay = 5*exp(-k*D[50]);
// v_delay = 5*exp(-k*24);

// v_soon = amount_soon[t];
// v_soon = amount_soon[50];
// v_soon = 0.5;

// target += bernoulli_logit_lpmf(choice[n,t] | beta*(v_delay - v_soon));
// target += bernoulli_logit_lpmf(choice[30,50] | beta*(5*exp(-k*24) - 0.5));
// target += bernoulli_logit_lpmf(1 | beta*(5*exp(-k*24) - 0.5));

ここでは、stan_model()関数で最初にコンパイルしておいてから、

model <- stan_model('exponential.stan')

sampling()関数でサンプリングする。

fit <- sampling(object = model, data = datastan, seed = 1989)

推定結果を確認する。割引率は\(k=0.5\)と推定された。

print(fit, prob = c(0.025, 0.5, 0.975), digits_summary = 1)

## Inference for Stan model: anon_model.
## 4 chains, each with iter=2000; warmup=1000; thin=1; 
## post-warmup draws per chain=1000, total post-warmup draws=4000.
## 
##               mean se_mean  sd   2.5%    50%  97.5% n_eff Rhat
## k              0.1       0 0.0    0.0    0.1    0.1  3172    1
## beta           0.9       0 0.0    0.9    0.9    1.0  2840    1
## log_lik[1]   -14.8       0 0.5  -15.9  -14.8  -13.7  2775    1
## log_lik[2]   -29.9       0 1.2  -32.3  -29.9  -27.5  3241    1
## log_lik[3]   -31.4       0 1.2  -33.8  -31.4  -29.2  3020    1
## log_lik[4]   -14.3       0 0.5  -15.2  -14.3  -13.3  2782    1
## log_lik[5]   -20.1       0 0.8  -21.7  -20.1  -18.7  3149    1
## log_lik[6]   -24.3       0 0.9  -26.1  -24.3  -22.6  3106    1
## log_lik[7]   -14.8       0 0.5  -15.7  -14.8  -13.9  2751    1
## log_lik[8]   -19.3       0 0.8  -20.8  -19.3  -17.8  3093    1
## log_lik[9]   -29.9       0 1.2  -32.3  -29.9  -27.5  3241    1
## log_lik[10]  -25.4       0 1.0  -27.3  -25.3  -23.6  3096    1
## log_lik[11]  -35.0       0 1.2  -37.5  -35.0  -32.6  2977    1
## log_lik[12]  -17.5       0 0.5  -18.4  -17.5  -16.6  2888    1
## log_lik[13]  -34.7       0 1.1  -36.9  -34.6  -32.6  2956    1
## log_lik[14]  -37.7       0 1.6  -41.0  -37.7  -34.5  3240    1
## log_lik[15]  -15.7       0 0.4  -16.5  -15.7  -14.9  2764    1
## log_lik[16]  -24.9       0 0.9  -26.8  -24.9  -23.1  3103    1
## log_lik[17]  -27.8       0 0.9  -29.7  -27.8  -26.0  3054    1
## log_lik[18]  -24.4       0 0.9  -26.2  -24.4  -22.6  3202    1
## log_lik[19]  -21.0       0 0.8  -22.7  -21.0  -19.4  3147    1
## log_lik[20]  -15.6       0 0.5  -16.6  -15.6  -14.6  2808    1
## log_lik[21]  -16.1       0 0.6  -17.4  -16.1  -15.0  2946    1
## log_lik[22]  -15.6       0 0.4  -16.4  -15.6  -14.8  2824    1
## log_lik[23]  -16.7       0 0.4  -17.5  -16.6  -15.8  2769    1
## log_lik[24]  -27.0       0 0.8  -28.7  -26.9  -25.4  3061    1
## log_lik[25]  -16.1       0 0.6  -17.3  -16.1  -15.0  2924    1
## log_lik[26]  -16.1       0 0.6  -17.4  -16.1  -15.0  2946    1
## log_lik[27]  -42.8       0 1.6  -46.2  -42.7  -39.7  2931    1
## log_lik[28]  -31.2       0 1.2  -33.6  -31.2  -28.8  3245    1
## log_lik[29]  -27.2       0 1.0  -29.1  -27.1  -25.3  3068    1
## log_lik[30]  -17.8       0 0.5  -18.8  -17.8  -16.8  2958    1
## v_soon         0.5     NaN 0.0    0.5    0.5    0.5   NaN  NaN
## v_delay        1.4       0 0.1    1.2    1.4    1.6  3099    1
## lp__        -712.0       0 1.0 -714.8 -711.7 -711.0  2179    1
## 
## Samples were drawn using NUTS(diag_e) at Wed Jan 10 17:14:16 2024.
## For each parameter, n_eff is a crude measure of effective sample size,
## and Rhat is the potential scale reduction factor on split chains (at 
## convergence, Rhat=1).

事後分布を可視化しておく。

stan_plot(
  fit,
  pars = c('k'),
  point_est = 'mean',
  ci_level = 0.95,
  outer_level = 1.00,
  show_density = TRUE,
  fill_color = 'grey') + 
  theme_bw()

推定された\(k\)を使って遅延価値割引の曲線を可視化する。

ms <- rstan::extract(fit)
# qua <- apply(ms$k, 2, quantile, prob = c(0.025, 0.25, 0.5, 0.75, 0.975))
qua <- quantile(ms$k, prob = c(0.025, 0.25, 0.5, 0.75, 0.975))

a <- purrr::map_dfc(.x = qua, .f = function(x){
  expmodel(50000, x, t)
})

d_est <- tibble(t, a) 

ggplot() +
  theme_bw(base_size = 15) +
  geom_ribbon(data = d_est, aes(x = t, ymin = `2.5%`, ymax = `97.5%`), fill = 'black', alpha = 1/6) +
  geom_ribbon(data = d_est, aes(x = t, ymin = `25%`, ymax = `75%`), fill = 'black', alpha = 2/6) +
  geom_line(data = d_est, aes(x = t, y = `50%`), size = 0.5) + 
  labs(x = 'Time (Month)', y = 'U(A)') +
  scale_x_continuous(breaks = seq(0, 30, 2)) +
  scale_y_continuous(breaks = seq(0, 50000, 5000)) +
  labs(title = 'Delay Discounting Exponential Model')

9.6.2 階層モデル

割引率\(k\)に個人差を認めた階層モデルを推定する。階層モデルはパラメタについて、さらに確率分布を仮定し、そのパラメタを推定する二段構えになっているため階層モデルと呼ばれる。階層モデルを考えるに当たり、割引率の個人差がそのような確率分布に従うかを考える必要がある。割引率\(k_{i}\)はハザード率、主観的に財がなくなる時間を表していると考えている。0以上の値をとるが、必ずしも1以下とは限らない。ここでは、個人\(j\)の割引率\(k\)が対数正規分布に従うと仮定する。一瞬勘違いするが、\(\mu_{k},\sigma_{k}\)の添字の\(k\)は、割引率\(k\)のパラメタを意味する文字であって、\(k\)個あるという意味ではない。複数あるのは\(k_{j}\)の方であり、個人\(j\)個分存在する。

モデル2

\[ \begin{eqnarray} P_{j(i)} &\sim& Bernoulli(\theta_{j(i)}^{d}) \\ \theta_{j(i)}^{d} &=& logistic(\beta \{U_{j}(A^{d}) - U(A^{s}_{i}) \}) \\ U(A^{s}_{i}) &=& A_{i} \\ U_{j}(A^{d}) &=& 50000 \cdot e^{-k_{j}d} \\ \beta &\sim& half\_Cauchy(0, 5) \\ k_{j} &\sim& LogNormal(\mu_{k}, \sigma_{k}) \\ \mu_{k} &\sim& Normal(0,10^2) \\ \sigma_{k} &\sim& half\_Cauchy(0, 5) \\ \end{eqnarray} \]

モデルは下記の通り。

data {
  int N;
  int Trial;
  real D[Trial];
  real amount_delay;
  real amount_soon[Trial];
  int<lower=0,upper=1> choice[N,Trial];
}

parameters {
  real<lower=0> k[N];
  real<lower=0> beta;
  real mu_k;
  real<lower=0> sigma_k;
}

model {
  real v_soon;
  real v_delay;
  for (t in 1:Trial) {
    v_soon = amount_soon[t];
    for(n in 1:N){
      v_delay = amount_delay*exp(-k[n]*D[t]);
      target += bernoulli_logit_lpmf(choice[n,t] | beta*(v_delay-v_soon));
    }
  }
  target += lognormal_lpdf(k | mu_k,sigma_k);
  target += normal_lpdf(mu_k | 0,10^2);
  target += cauchy_lpdf(sigma_k | 0,5) - cauchy_lccdf(0 | 0,5);
  target += cauchy_lpdf(beta | 0,5) - cauchy_lccdf(0 | 0,5);
}