Chapter 5 Modelos de Pérdidas Agregadas

Vista previa del capítulo. Este capítulo presenta modelos de probabilidad para describir la siniestralidad agregada (siniestros totales) de una cartera de pólizas de seguro. Se presentan dos enfoques de modelización tradicionales, el modelo de riesgo individual y el modelo de riesgo colectivo. Además, se analizan estrategias para calcular la distribución de la siniestralidad agregada, entre los que se incluyen métodos exactos en casos específicos, recursión y simulación. Finalmente, se examinan los efectos de las modificaciones individuales en las pólizas, tales como deducibles, coaseguros e inflación, sobre las distribuciones de frecuencia y severidad y, por lo tanto, sobre la distribución de pérdidas agregadas.

5.1 Introducción

El objetivo de este capítulo es construir un modelo de probabilidad para describir los siniestros totales de un sistema de seguros que ocurren en un período de tiempo determinado. El sistema de seguros puede ser una única póliza, un contrato de seguro colectivo, una línea de negocio o el conjunto total del negocio de una entidad aseguradora. En este capítulo, siniestros totales se refieren al número o al importe de los siniestros de una cartera de contratos de seguro. Sin embargo, la modelización que se presenta puede adaptarse fácilmente a una configuración más general.

Considere una cartera de seguros de \(n\) contratos individuales, donde \(S\) representa las pérdidas agregadas de la cartera en un período de tiempo determinado. Existen dos enfoques para modelizar las pérdidas agregadas \(S\), el modelo de riesgo individual y el modelo de riesgo colectivo. El modelo de riesgo individual considera la pérdida de cada contrato individual y representa las pérdidas agregadas como:

\[\begin{aligned} S_n=X_1 +X_2 +\cdots+X_n, \end{aligned}\]

donde \(X_i~(i=1,\ldots,n)\) se interpreta como el importe de la pérdida del contrato \(i\)-ésimo. Cabe destacar que \(n\) denota el número de contratos en la cartera y por lo tanto es un número conocido en lugar de una variable aleatoria. En el modelo de riesgo individual normalmente se asume que los \(X_{i}\) son independientes. Debido a las diferentes características de cada contrato, como la cobertura y la exposición, los \(X_{i}\) no se consideran necesariamente idénticamente distribuidos. Una particularidad de la distribución de cada \(X_i\) es la masa de probabilidad en cero que corresponde al evento de no siniestros.

El modelo de riesgo colectivo representa las pérdidas agregadas en base a una distribución de frecuencias y una distribución de gravedad:

\[\begin{aligned} S_N=X_1 +X_2 +\cdots+X_N. \end{aligned}\]

Aquí, uno piensa en un número aleatorio de siniestros \(N\) que puede representar tanto el número de pérdidas como el número de pagos. En cambio, en el modelo de riesgo individual se considera un número fijo de contratos \(n\). Supongamos que \(X_1, X_2, \ldots, X_N\) representa la cuantía de cada pérdida. Cada pérdida puede o no corresponder a un mismo contrato. Por ejemplo, se pueden generar múltiples reclamaciones en un mismo contrato. Normalmente se considera \(X_i>0\) ya que si \(X_i=0\) entonces el siniestro no ha ocurrido. Frecuentemente se asume que condicionado a \(N=n\), \(X_{1},X_{2},\ldots ,X_{n}\) son variables aleatorias iid. La distribución de \(N\) se denomina la distribución de frecuencias, y la distribución de \(X\) se conoce como la distribución de severidad. Se asume además que \(N\) y \(X\) son independientes. En el modelo de riesgo colectivo las pérdidas agregadas se pueden descomponer en el proceso de frecuencia (\(N\)) y el modelo de gravedad (\(X\)). Esta flexibilidad permite al analista estudiar estas dos componentes por separado. Por ejemplo, el crecimiento de las ventas debido a una relajación de los criterios de suscripción podría dar lugar a una mayor frecuencia de pérdidas, pero podría no afectar a la gravedad de las mismas. Del mismo modo, la inflación u otros factores económicos podrían tener un impacto en la severidad pero no en la frecuencia.

5.2 Modelo de Riesgo Individual

Como se menciona previamente, en el modelo de riesgo individual, \(X_i\) se considera la pérdida del \(i\)-ésimo contrato y se interpreta

\[\begin{eqnarray*} S_n=X_1 +X_2 +\cdots+X_n \end{eqnarray*}\]

como la pérdida agregada de todos los contratos de una cartera o grupo de contratos. Aquí, las \(X_i\) no se distribuyen necesariamente de forma idéntica y se cumple que

\[\begin{aligned} {\rm E}(S_n) &= \sum_{i=1}^{n} {\rm E}(X_i)~. \end{aligned}\]

Bajo el supuesto de independencia de las \(X_i\) (que implica \(\mathrm{Cov}\left( X_i, X_j \right) = 0\) para todo \(i \neq j\)), se puede demostrar que

\[\begin{aligned} {\rm Var}(S_n) &= \sum_{i=1}^{n} {\rm Var}(X_i) \\ P_{S_n}(z) &= \prod_{i=1}^{n}P_{X_i}(z) \\ M_{S_n}(t) &= \prod_{i=1}^{n}M_{X_i}(t), \end{aligned}\]

donde \(P_{S_n}(\cdot)\) y \(M_{S_n}(\cdot)\) son la función generadora de probabilidad (pgf) y la función generadora de momentos (mgf) de \(S_n\), respectivamente. La distribución de cada \(X_i\) tiene masa de probabilidad en cero, que corresponde al caso en el que no han habido siniestros en el contrato \(i\)-ésimo. Una estrategia para incluir masa en cero en la distribución es construirla en dos partes:

\[\begin{aligned} X_i = I_i\times B_i = \left\{\begin{array}{ll} 0~, & \text{si }~ I_i=0 \\ B_i~, & \text{si }~ I_i=1 \end{array} \right. \end{aligned}\]

Aquí, \(I_i\) es una variable de Bernoulli que indica si ocurren o no pérdidas en el contrato \(i\)-ésimo, y \(B_i\) es una variable aleatoria con soporte no negativo que representa la cuantía de las pérdidas en el contrato condicionado a que han ocurrido. Supongamos que \(I_1 ,\ldots,I_n ,B_1 ,\ldots,B_n\) son mutuamente independientes. Denotemos \({\rm Pr} (I_i =1)=q_i\), \(\mu_i={\rm E}(B_i)\), y \(\sigma_i^2={\rm Var}(B_i)\). Se demuestra (véase Suplemento técnico 5.A.1 para más detalles) que

\[\begin{aligned} \mathrm{E}(S_n)& =\sum_{i=1}^n ~q_i ~\mu _i \\ \mathrm{Var}(S_n) & =\sum_{i=1}^n \left( q_i \sigma _i^2+q_i (1-q_i)\mu_i^2 \right)\\ P_{S_n}(z) & =\prod_{i=1}^n \left( 1-q_i+q_i P_{B_i}(z) \right)\\ M_{S_n}(t) & =\prod_{i=1}^n \left( 1-q_i+q_i M_{B_i}(t) \right) \end{aligned}\]

Un caso particular del modelo anterior es cuando \(B_i\) sigue una distribución degenerada con \(\mu_i=b_i\) y \(\sigma^2_i=0\). Un ejemplo es un seguro de vida temporal o seguro de capital diferido en el que \(b_i\) representa el importe del capital asegurado en el contrato \(i\)-ésimo.

Otra estrategia para acomodar masa en cero en la pérdida de cada contrato es considerarlos globalmente a nivel de cartera, como en el modelo de riesgo colectivo. Aquí, la pérdida total es \(S_{N} = X_1 + \cdots X_N\), donde \(N\) es una variable aleatoria que representa el número de reclamaciones distintas de cero que se produjeron en todo el conjunto de contratos. Por lo tanto, todos los contratos de la cartera pueden no estar representados en esta suma, y \(S_N=0\) cuando \(N=0\). El modelo de riesgo colectivo se discutirá en detalle en la siguiente sección.


Ejemplo 5.2.1. Pregunta de Examen Actuarial. Una compañía de seguros vendió 300 pólizas de seguro contra incendios de la siguiente forma:

\[ {\small \begin{matrix} \begin{array}{c c c} \hline \text{Número de} & \text{Máximo de la} & \text{Probabilidad de}\\ \text{Polizas} & \text{Póliza} & \text{Siniestro por póliza}\\ & (M_i) & (q_i) \\ \hline 100 & 400 & 0,05\\ 200 & 300 & 0,06\\ \hline \end{array} \end{matrix} } \]

Se sabe que:
(i) El coste del siniestro por póliza, \(X_i\), se distribuye uniformemente entre \(0\) y el máximo de la póliza \(M_i\).
(ii) La probabilidad de ocurrencia de más de un siniestro por póliza es \(0\).
(iii) Los siniestros son independientes.

Calcular la media, \(\mathrm{E~}(S_{300})\), y la varianza, \(\mathrm{Var~}(S_{300})\), de la siniestralidad total. ¿Como variarán los resultados si ahora cada siniestro es igual al máximo de la póliza?

Mostrar Solución de Ejemplo

Continuación. Ahora supongamos que todos reciben el máximo de la póliza \(M_i\) si ocurre un siniestro. ¿Cuál es la pérdida agregada esperada \(\mathrm{E~}(\tilde{S})\) y la varianza de la pérdida agregada \(\mathrm{Var~}(\tilde{S})\)?

La cuantía del siniestro por póliza \(X_i\) es ahora determinista y se establece en \(M_i\) en vez de ser un valor aleatorio, así que \(\sigma_i^2 = \mathrm{Var~} (X_i) = 0\) y \(\mu_i = M_i\). Una vez más, la probabilidad que ocurra una reclamación para cada póliza es \(q_i\). En este contexto, la pérdida agregada esperada es

\[\begin{aligned} \mathrm{E~}(\tilde{S}) &= \sum_{i=1}^{300} q_i \mu_i = 100 \left\{0,05(400) \right\} + 200 \left\{ 0,06(300) \right\} = 5.600 \end{aligned}\]

La varianza de la pérdida agregada es \[\begin{aligned} \mathrm{Var~}(\tilde{S}) &= \sum_{i=1}^{300} \left( q_i \sigma _i^2+q_i (1-q_i )\mu_i^2 \right) = \sum_{i=1}^{300} \left( q_i (1-q_i) \mu_i^2 \right) \\ &= 100 \left\{(0,05) (1-0,05) 400^2\right\} + 200 \left\{(0,06) (1-0,06)300^2\right\} \\ &= 1.775.200 \end{aligned}\]


El modelo de riesgo individual también puede utilizarse para la frecuencia de los siniestros. Si \(X_i\) representa el número de siniestros para el \(i\)-ésimo contrato, entonces \(S_n\) se interpreta como el número total de siniestros de la cartera. En este caso, la construcción de la distribución en dos partes se sigue aplicando, ya que continua existiendo masa de probabilidad en cero para las pólizas que no experimentan ningún siniestro. Supongamos que \(X_i\) pertenece a la clase \((a,b,0)\) con pmf definida como \(p_{ik} = \Pr(X_i=k)\) para \(k=0,1,\ldots\) (véase Sección 2.3). Así mismo, \(X_i^{T}\) indica la distribución truncada en cero asociada de la clase \((a,b,1)\) con pmf \(p_{ik}^T=p_{ik}/(1-p_{i0})\) para \(k=1,2,\ldots\) (véase Sección 2.5.1). Usando la relación entre sus funciones generadoras de probabilidad (véase Suplemento Técnico 5.A.2 para más detalles): \[\begin{aligned} P_{X_i}(z) = p_{i0} +(1-p_{i0}) P_{X_i^{T}}(z), \end{aligned}\] se puede escribir \(X_i=I_i\times B_i\) con \(q_i={\rm Pr}(I_i=1)={\rm Pr}(X_i>0)=1-p_{i0}\) y \(B_i=X_i^T\). Como se puede observar, en este caso, se obtiene una distribución modificada en cero, ya que la variable \(I_i\) recoge la masa de probabilidad modificada en cero con \(q_i = \Pr(I_i=1)\), mientras que \(B_i=X_i^T\) cubre la parte de frecuencia discreta que no es cero. Véase Sección 2.5.1 para la relación entre las distribuciones truncadas en cero y modificadas en cero.


Ejemplo 5.2.2.

Una compañía aseguradora ha vendido una cartera de 100 pólizas de seguro de hogar independientes entre si, en cada una de las cuales la frecuencia de siniestros sigue una distribución de Poisson modificada en cero, como se indica a continuación:

\[ {\small \begin{matrix} \begin{array}{cccc} \hline \text{Tipo de} & \text{Número de} & \text{Probabilidad of} & \lambda \\ \text{Póliza} & \text{Pólizas} & \text{Al menos un siniestro} & \\ \hline \text{Riesgo bajo} & 40 & 0,03 & 1 \\ \text{Riesgo alto} & 60 & 0,05 & 2 \\ \hline \end{array} \end{matrix} } \] Calcular el valor esperado y varianza de la frecuencia de siniestros para el conjunto de la cartera.

Mostrar Solución de Ejemplo

Para entender la distribución de la pérdida agregada se puede utilizar el teorema central del límite para aproximar la distribución de \(S_n\) para valores grandes de \(n\). Si se denota \(\mu_{S_n}={\rm E}(S_n)\) y \(\sigma^2_{S_n}={\rm Var}(S_n)\) y se considera \(Z\sim N(0,1)\), una variable aleatoria normal estándar con cdf \(\Phi\). Entonces, la cdf de \(S_n\) se puede aproximar como:

\[\begin{aligned} F_{S_n}(s) &= {\rm Pr}({S_n}\leq s) = \Pr \left( \frac{S_n - \mu_{S_n}}{\sigma_{S_n}} \leq \frac{s-\mu_{S_n}}{\sigma_{S_n}} \right) \\ &\approx \Pr\left( Z \leq \frac{s-\mu_{S_n}}{\sigma_{S_n}} \right) = \Phi \left(\frac{s-\mu_S}{\sigma_S}\right). \end{aligned}\]


Ejemplo 5.2.3. Pregunta Examen Actuarial - Continuación.

Como en el Ejemplo 5.2.1, una compañía de seguros ha vendido 300 pólizas de seguro contra incendios, donde el coste del siniestro \(X_i\) se distribuye uniformemente entre 0 y el máximo de la póliza \(M_i\). Utilizando la aproximación normal, se pide calcular la probabilidad de que el importe total de los siniestros \(S_{300}\) supere los \(3.500\$\).

Mostrar Solución de Ejemplo

En el caso que \(n\) sea un valor pequeño, la distribución de \(S_n\) será probablemente sesgada, y la aproximación normal no sería una buena elección. Para analizar la distribución de pérdidas agregada, se debe volver a los métodos básicos iniciales. En concreto, la distribución puede derivarse recursivamente. Si se define \(S_k=X_1 + \cdots + X_k, k=1,\ldots,n\).

Para \(k=1\): \[F_{S_1}(s) = {\rm Pr}(S_1\leq s) = {\rm Pr}(X_1\leq s) = F_{X_1}(s).\] Para \(k=2,\ldots,n\): \[\begin{aligned} F_{S_k}(s)&={\Pr}(X_1+\cdots+X_k\leq s) ={\Pr}(S_{k-1}+X_k\leq s) \\ &={\rm E}_{X_k}\left[{\rm Pr}(S_{k-1}\leq s-X_k|X_k)\right]= {\rm E}_{X_k}\left[F_{S_{k-1}}(s-X_k)\right]. \end{aligned}\]

Un caso particular es cuando las \(X_i\) se distribuyen igual. Supongamos que \(F_X(x)={\Pr}(X\leq x)\) es la distribución común de \(X_i, ~i=1,\ldots,n\). Se define \[F^{*n}_X(x)={\Pr}(X_1+\cdots+X_n\leq x)\] la convolución \(n\)-ésima de \(F_X\). En general, \(F_X^{\ast n}\) puede calcularse recursivamente. Se inicia la recursión en \(k=1\) mediante \(F_X^{\ast 1} \left(x \right) =F_X(x)\). Posteriormente, para \(k=2\), se tiene

\[\begin{eqnarray*} F_X^{\ast 2} \left(x \right) &=& \Pr(X_1 + X_2 \le x) = \mathrm{E}_{X_2} \left[ \Pr(X_1 \le x - X_2|X_2) \right] \\ &=& \mathrm{E}_{X_2} \left[ F(x - X_2) \right] \\ &=&\left\{\begin{array}{ll} \int_{0}^{x} F(x-y) f(y) dy & \text{para } X_i \text{ continuas } \\ \sum_{y \le x} F(x-y) f(y) & \text{para } X_i \text{ discretas }\\ \end{array}\right. \end{eqnarray*}\]

Recuerde que \(F(0) = 0\).

Del mismo modo, para \(k=n\), se cumple que \(S_n = X_1 + X_2 + \cdots + X_n\) y

\[\begin{eqnarray*} F^{\ast n}\left(x\right) &=& \Pr(S_n \le x) = \Pr(S_{n-1} + X_n \le x)\\ &=&\mathrm{E}_{X_n} \left[ \Pr(S_{n-1} \le x - X_n|X_n) \right] \\ &=&\mathrm{E}_X \left[ F^{\ast(n-1)}(x - X) \right] \\ &=& \left\{\begin{array}{ll} \int_{0}^{x} F^{\ast(n-1)}(x-y)f(y)dy & \text{para } X_i \text{ continuas } \\ \sum_{y \le x} F^{\ast(n-1)}(x-y)f(y) & \text{para } X_i \text{ discretas } \\ \end{array}\right. \end{eqnarray*}\]

Cuando las \(X_i\) son independientes y pertenecen a la misma familia de distribuciones, en algunos casos \(S_n\) tiene una forma cerrada simple. Esto hace que sea fácil calcular \(\Pr(S_n \le x)\). Esta propiedad se conoce como cerrado bajo convolución, es decir, la distribución de la suma de variables aleatorias independientes pertenece a la misma familia de distribuciones que la de las variables que la componen, pero con distintos parámetros. Algunos ejemplos son:

\[ {\small \begin{matrix} \text{Tabla de formas cerrada para la suma parcial de distribuciones}\\ \begin{array}{l|l|l} \hline \text{Distribución de } X_i & \text{Abreviatura} & \text{Distribución de } S_n \\ \hline \text{Normal con media } \mu_i \text{ y varianza } \sigma_i^2 & N(\mu_i,\sigma_i^2) & N\left(\sum_{i=1}^{n}\mu_i,~\sum_{i=1}^{n}\sigma_i^2\right) \\ \text{Exponencial con media } \theta & Exp(\theta) & Gam(n,\theta)\\ \text{Gamma con parámetros de forma } \alpha_i \text{ y escala } \theta & Gam(\alpha_i,\theta) & Gam\left(\sum_{i=1}^n\alpha_i,\theta\right) \\ \text{Poisson con media (y varianza) } \lambda_i & Poi(\lambda_i)& Poi\left(\sum_{i=1}^{n}\lambda_i\right)\\ \text{Binomial con } m_i \text{ intentos y probabilidad de éxito } q & Bin(m_i, q)& Bin\left(\sum_{i=1}^n m_i, q\right)\\ \text{Geométrica con media } \beta & Geo(\beta) & NB(\beta,n)\\ \text{Binomial Negativa con media } r_i \beta~ \text{ y varianza } ~r_i \beta (1+\beta) & NB(\beta,r_i)& NB\left(\beta,\sum_{i=1}^n r_i\right)\\ \hline \end{array} \end{matrix} } \]


Ejemplo 5.2.4. Distribución Gamma. Supongamos que \(X_1,\ldots,X_n\) son variables aleatorias independientes con \(X_i \sim Gam(\alpha_i, \theta)\). La mgf de \(X_i\) es \(M_{X_i}(t) = (1 - \theta t)^{- \alpha_i}\). Por tanto, la mgf de la suma \(S_n = X_1 + \cdots + X_n\) es \[\begin{aligned} M_{S_n}(t) &= \prod_{i=1}^n M_{X_i}(t) ~~~~ \text{por la independencia de las } X_i \\ &= \prod_{i=1}^n (1 - \theta t)^{- \alpha_i} = (1-\theta t)^{-\sum_{i=1}^n \alpha_i }~ , \end{aligned}\]

que es la mgf de una variable aleatoria gamma con parámetros \((\sum_{i=1}^n \alpha_i, \theta)\). Es decir, \(S_n \sim Gam(\sum_{i=1}^n \alpha_i, \theta)\).


Ejemplo 5.2.5. Distribución Negativa Binomial. Supongamos que \(X_1,\ldots, X_n\) son variables aleatorias independientes con \(X_i \sim NB(\beta, r_i)\). La pgf de \(X_i\) is \(P_{X_i}(z) = \left[1-\beta(z-1) \right]^{-r_i}\). Por lo tanto, la pgf de la suma \(S_n =X_1+\cdots+X_n\) es

\[\begin{aligned} P_{S_n}(z) &= \mathrm{E~}\left[ z^{S_n} \right] = \mathrm{E~}\left[ z^{X_1+\cdots+X_n} \right] = \mathrm{E~}\left[ z^{X_1} z^{X_2} \cdots z^{X_n} \right] \\ &= \mathrm{E~}\left[z^{X_1}\right] \cdots \mathrm{E~}\left[z^{X_n}\right] ~~~~ \text{bajo independencia de las } X_i \\ &= \prod_{i=1}^n P_{X_i}(z) = \prod_{i=1}^n \left[1-\beta(z-1) \right]^{-r_i} = \left[1-\beta(z-1) \right]^{-\sum_{i=1}^n r_i} ~, \end{aligned}\]

que es la pgf de una variable aleatoria negativa binomial con parámetros \((\beta, \sum_{i=1}^n r_i)\). Es decir, \(S_n \sim NB(\beta, \sum_{i=1}^n r_i)\).


Ejemplo 5.2.6. Pregunta Examen Actuarial (modificada). El número anual de visitas al médico para cada miembro de una familia de 4 tiene una distribución geométrica con una media de 1,5. El número anual de visitas de los miembros de la familia es independiente entre sí. Un seguro paga 100 por visita al médico a partir de la cuarta visita de la familia. Calcula la probabilidad de que la familia cobre del seguro este año.

Mostrar Solución de Ejemplo

5.3 Modelo de Riesgo Colectivo

5.3.1 Momentos y distribución

Bajo el modelo de riesgo colectivo \(S_N=X_1+\cdots+X_N\), las \(\{X_i\}\) son iid, e independientes de \(N\). Supongamos que \(\mu = {\rm E}\left( X_{i}\right)\) y \(\sigma ^{2} = {\rm Var}\left(X_{i}\right)\) para todo \(i\). Utilizando la ley de esperanza iterada, la media de la pérdida agregada es

\[\begin{eqnarray*} {\rm E}(S_N)={\rm E}_N[{\rm E}_S(S|N)] = {\rm E}_N(N\mu) = \mu {\rm E}(N). \end{eqnarray*}\] Utilizando la ley de varianza total, la varianza de la pérdida agregada es \[\begin{aligned} {\rm Var}(S_N) &= {\rm E}_N[{\rm Var}(S_N|N)] + {\rm Var}_N[{\rm E}(S_N|N)] \\ &= \mathrm{E}_N \left[ \mathrm{Var}(X_1+\cdots+X_N) \right] + \mathrm{Var}_N\left[ \mathrm{E}(X_1+\cdots+X_N) \right] \\ &= \mathrm{E}_N \left[ \mathrm{Var}(X_1)+\cdots+ \mathrm{Var}(X_N) + 2\mathrm{Cov}(X_1, X_2) + \cdots + \mathrm{Cov}(X_{N-1}, X_N) \right] + \mathrm{Var}_N\left[ \mathrm{E}(X_1) + \cdots + \mathrm{E}(X_N) \right] \\ &={\rm E}_N[N\sigma^2] + {\rm Var}_N[N\mu] ~~~~ \text{dado que } \mathrm{Cov}(X_i, X_j)=0 \text{ para todo } i\neq j \text{ debido a la independencia} \\ &=\sigma^2{\rm E}[N] + \mu^2{\rm Var}[N] \end{aligned}\]

Caso particular: Frecuencia distribuida según una Poisson. Si \(N \sim Poi (\lambda)\), entonces \[\begin{aligned} \mathrm{E}(N) &= \mathrm{Var}(N) = \lambda\\ \mathrm{E}(S) &= \lambda \mathrm{E}(X)\\ \mathrm{Var}(S) &= \lambda (\sigma^2 + \mu^2) = \lambda ~\mathrm{E} (X^2) . \end{aligned}\]


Ejemplo 5.3.1. Pregunta de Examen Actuarial.

El número de accidentes sigue una distribución de Poisson con media 12. Cada accidente genera 1, 2 ó 3 reclamantes con probabilidades 1/2, 1/3 y 1/6, respectivamente.

Calcular la varianza en el número total de reclamantes.

Mostrar Solución de Ejemplo

En general, los momentos de \(S_N\) pueden derivarse de su función generadora de momentos (mgf). Como las \(X_i\) son iid, denotaremos la mgf de \(X\) como \(M_{X}(t) = \mathrm{E~}(e^{tX})\). Usando la ley de esperanza iterada, la mgf de \(S_N\) es

\[\begin{aligned} M_{S_N}(t) &= \mathrm{E}(e^{t S_N})=\mathrm{E}_N[~\mathrm{E}(e^{tS_N}|N)~]\\ &= \mathrm{E}_N \left[ ~\mathrm{E}\left( e^{t(X_1+\cdots+X_N)}\right) ~\right] = \mathrm{E}_N \left[ \mathrm{E}(e^{tX_1})\cdots\mathrm{E}(e^{tX_N}) \right] ~~~~ \text{dado que las } X_i \text{ son independientes} \\ &= \mathrm{E}_N[~(M_{X}(t))^N~] \end{aligned}\]

Ahora, recuerde que la función generadora de probabilidad (pgf) de \(N\) es \(P_N(z) = \mathrm{E}(z^N)\). Denotemos \(M_{X}(t)=z\). Sustituyendo en la expresión de la mgf de \(S_N\) anterior, se demuestra

\[\begin{aligned} M_{S_N}(t) = \mathrm{E~}(z^N) = P_{N}(z) = P_{N}[M_{X}(t)]. \end{aligned}\]

Del mismo modo, si \(S_N\) es discreta, se obtiene que la pgf de \(S_N\) es: \[\begin{aligned} P_{S_N}(z) = P_{N}[P_{X}(z)]. \end{aligned}\]

Para obtener \(\mathrm{E}(S_N) = M_{S_N}'(0)\), se usa la regla de la cadena \[ M_{S_N}'(t) = \frac{\partial}{\partial t} P_{N}(M_{X}(t)) = P_{N}'(M_{X}(t)) M_{X}'(t)\\ \] y recuerde que \(M_{X}(0) = 1, M_{X}'(0) = \mathrm{E}(X) = \mu, P_{N}'(1) = \mathrm{E}(N)\). Por lo tanto, \[\begin{aligned} \mathrm{E}(S_N) = M_{S_N}'(0) = P_{N}'(M_{X}(0)) M_{X}'(0) = \mu {\rm E}(N) \end{aligned}\]

De forma similar, se puede utilizar la relación \(\mathrm{E}(S_N^2) = M_{S_N}''(0)\) para obtener \[\mathrm{Var}(S_N) = \sigma^2 \mathrm{E}(N) + \mu^2 \mathrm{Var}(N).\]

Caso particular. Frecuencia según una Poisson. Supongamos que \(N \sim Poi (\lambda)\). Entonces, la pgf de \(N\) es \(P_N (z) = e^{\lambda(z-1)}\) y la mgf de \(S_N\) es \[\begin{aligned} M_{S_N}(t) &= P_N[M_X(t)] = e^{\lambda(M_{X}(t) - 1)}. \end{aligned}\]

Derivando se obtiene \[\begin{aligned} M_{S_N}'(t) &= e^{\lambda(M_{X}(t) - 1)}~ \lambda~ M_{X}'(t) = M_{S_N}(t) ~\lambda ~M_{X}'(t)\\ M_{S_N}''(t) &= M_{S}(t) ~\lambda~ M_{X}''(t) + [~M_{S}(t)~\lambda~ M_{X}'(t)~] ~\lambda~ M_{X}'(t) \end{aligned}\]

Si se evalúan en \(t=0\) se tiene \[\begin{aligned} \mathrm{E}(S_N) &= M_{S_N}'(0) = \lambda \mathrm{E}(X) = \lambda \mu \end{aligned}\] y

\[\begin{aligned} M_{S_N}''(0) &= \lambda \mathrm{E}(X^2) + \lambda^2 \mu^2\\ \Rightarrow \mathrm{Var}(S_N) &= \lambda \mathrm{E}(X^2) + \lambda^2 \mu^2 - (\lambda \mu)^2 = \lambda~ \mathrm{E}(X^2). \end{aligned}\]


Ejemplo 5.3.2. Pregunta de Examen Actuarial. El productor de un concurso de televisión otorga premios en efectivo. El número de premios, \(N\), y la cuantía de cada premio, \(X\), tienen las siguientes distribuciones:

\[ {\small \begin{matrix} \begin{array}{ccccc}\hline n & \Pr(N=n) & & x & \Pr(X=x)\\ \hline 1 & 0,8 & & 0 & 0,2 \\ 2 & 0,2 & & 100 & 0,7 \\ & & & 1000 & 0,1\\\hline \end{array} \end{matrix} } \]

El presupuesto para premios es igual al valor esperado del total de los premios más la desviación estándar del valor total de los premios. Calcular el presupuesto.

Mostrar Solución de Ejemplo

La distribución de \(S_N\) se denomina distribución compuesta, y puede derivarse a partir de la convolución de \(F_X\) como sigue: \[\begin{aligned} F_{S_N}(s) &= \Pr \left(X_1 + \cdots + X_N \le s \right) \\ &= \mathrm{E} \left[ \Pr \left(X_1 + \cdots + X_N \le s|N=n \right) \right]\\ &= \mathrm{E} \left[ F_{X}^{\ast N}(s) \right] \\ &= p_0 + \sum_{n=1}^{\infty }p_n F_{X}^{\ast n}(s) \end{aligned}\]


Ejemplo 5.3.3. Pregunta de examen actuarial. El número de siniestros en un determinado período sigue una distribución geométrica de media \(4\). La cauantía de cada siniestro \(X\) tiene la siguiente distribución \(\Pr(X=x) = 0,25, \ x=1,2,3,4\), es decir, discreta uniforme en \(\{1,2,3,4\}\). El número de siniestros y los importes de los mismos son independientes. Si \(S_N\) denota la cuantía total de la siniestralidad durante el período, calcular \(F_{S_N}(3)\).

Mostrar Solución de Ejemplo

Si se conocen \(\mathrm{E}(N)\) y \(\mathrm{Var}(N)\), también se puede utilizar el teorema central del límite para aproximar la distribución de \(S_N\) como en el modelo de riesgo individual. Es decir, \(\frac{S_N - \mathrm{E}(S_N)}{\sqrt{\mathrm{Var}(S_N)}}\) sigue aproximadamente la distribución normal estándar \(N(0,1)\).


Ejemplo 5.3.4. Pregunta Examen Actuarial. Se sabe lo siguiente:

\[ {\small \begin{matrix} \begin{array}{ c | c c } \hline & \text{Media} & \text{Desviación estándar}\\ \hline \text{Número de siniestros} & 8 & 3\\ \text{Pérdidas individuales} & 10.000 & 3.937\\ \hline \end{array} \end{matrix} } \] Mediante la aproximación normal, determinar la probabilidad que la pérdida total supere el 150\(\%\) de la pérdida esperada.

Mostrar Solución de Ejemplo

Ejemplo 5.3.5. Pregunta Examen Actuarial. Para un individuo de más de \(65\):
(i) El número de reclamaciones por cobertura de medicinas es una variable aleatoria de Poisson con media \(25\).
(ii) La cuantía de cada reclamación por cobertura de medicinas se distribuye uniformemente entre \(5\) y \(95\).
iii) Las cuantías de las reclamaciones y el número de reclamaciones son independientes entre sí.

Estimar la probabilidad que el coste total de las reclamaciones del individuo supere los \(2000\) mediante la aproximación normal.

Mostrar Solución de Ejemplo

5.3.2 Seguro Stop-loss

Recuerde las modificaciones de cobertura a nivel de póliza individual en la Sección 3.4. El seguro sobre la pérdida total \(S_N\), sujeto a un deducible \(d\), se llama seguro neto stop-loss. El valor esperado de la cantidad de la pérdida total que excede al deducible,

\[\begin{eqnarray*} \mathrm{E}[(S-d)_+] \end{eqnarray*}\] Se denomina prima neta stop-loss.

La prima neta stop-loss se calcula como

\[\begin{eqnarray*} \mathrm{E}(S_N-d)_+ &=& \left\{\begin{array}{ll} \int_{d}^{\infty}(s-d) f_{S_N}(s) ds& \text{para } S_N\text{ continua }\\ \sum_{s>d}(s-d) f_{S_N}(s) & \text{para } S_N \text{ discreta }\\ \end{array}\right.\\ &=& \mathrm{E}(S_N) - \mathrm{E}(S_N\wedge d)\\ \end{eqnarray*}\]


Ejemplo 5.3.6. Pregunta Examen Actuarial.

En una determinada semana el número de proyectos en los que se requiere trabajar horas extras sigue una distribución geométrica con \(\beta=2\). En cada proyecto la distribución del número de horas extras en la semana, \(X\), es la siguiente:

\[ {\small \begin{matrix} \begin{array}{ccc} \hline x & & f(x)\\ \hline 5 & & 0,2 \\ 10 & & 0,3 \\ 20 & & 0,5\\ \hline \end{array} \end{matrix} } \]

El número de proyectos y el número de horas extras son independientes. Se pagan las horas extras cuando exceden las 15 horas semanales. Calcular el número esperado de horas extras por las que se cobrará en la semana.

Mostrar Solución de Ejemplo

Cálculo recursivo de la prima neta Stop-Loss. En el caso discreto, se puede calcular recursivamente como \[\begin{aligned} \mathrm{E}\left[ \left( S_N-(j+1)h \right) _{+} \right]=\mathrm{E}\left[ ( S_N-jh )_{+} \right] -h \left( 1-F_{S_N}(jh) \right) . \end{aligned}\]

Se asume que el soporte de \(S_N\) está igualmente espaciado en unidades de \(h\).

Para mostrar lo anterior, asumamos que \(h=1\). Se tiene que

\[\begin{aligned} \mathrm{E}\left[ \left( S_N-(j+1) \right) _{+} \right] &=\mathrm{E}(S_N) - \mathrm{E}[S_N\wedge (j+1)] \ ,\ \text{ y } \\ \mathrm{E}\left[ \left( S_N - j \right)_+ \right] &=\mathrm{E}(S_N) - \mathrm{E}[S_N\wedge j] \end{aligned}\]

Por lo tanto, \[\begin{aligned} \mathrm{E}\left[ \left(S_N-(j+1) \right) _{+}\right] - \mathrm{E}\left[ ( S_N-j )_{+} \right] &= \left\{\mathrm{E}(S_N) - \mathrm{E}(S_N\wedge (j+1)) \right\} - \left\{\mathrm{E}(S_N) - \mathrm{E}(S_N\wedge j) \right\} \\ &= \mathrm{E}\left(S_N \wedge j \right) - \mathrm{E}\left[ S \wedge (j+1) \right] \end{aligned}\]

Puede expresarse como \[\begin{aligned} \mathrm{E}\left[S_N\wedge (j+1)\right] &= \sum_{x=0}^{j}xf_{S_N}(x) + (j+1)~\Pr(S_N \ge j+1) \\ &= \sum_{x=0}^{j-1}x f_{S_N}(x) + j~\Pr(S_N=j) + (j+1)~\Pr(S_N \ge j+1) \end{aligned}\]

Del mismo modo, \[\begin{aligned} \mathrm{E}(S_N\wedge j) = \sum_{x=0}^{j-1}xf_{S_N}(x) + j~\Pr(S_N\ge j) \end{aligned}\]

Con estas expresiones se tiene que \[\begin{aligned} \mathrm{E}\left[ \left( S_N-(j+1) \right) _{+} \right] - \mathrm{E~}\left[ ( S_N-j )_{+} \right] &= \mathrm{E}\left(S_N \wedge j \right) - \mathrm{E}\left[ S \wedge (j+1) \right] \\ &= \left\{ \sum_{x=0}^{j-1}xf_{S_N}(x) + j~\Pr(S_N\ge j) \right\} - \left\{ \sum_{x=0}^{j-1}x f_{S_N}(x) + j~\Pr(S_N=j) + (j+1)~\Pr(S_N \ge j+1) \right\} \\ &= j~\left[\Pr(S_N \geq j) - \Pr(S_N=j) \right]- (j+1)~\Pr(S_N \ge j+1) \\ &= j~\Pr( S_N > j) - (j+1)~\Pr(S_N \ge j+1) ~~~~ \text{ (nótese que } \Pr(S_N > j) = \Pr(S_N \geq j+1) \text{)} \\ &= -\Pr(S_N\ge j+1) = -\left[1 - F_{S_N}(j)\right], \end{aligned}\] como se buscaba.


Ejemplo 5.3.7. Pregunta Examen Actuarial - Continuación. Recordemos que el objetivo de esta pregunta era calcular \(\mathrm{E~}(S_N-15)_+\). Tenga en cuenta que el soporte de \(S_N\) está igualmente espaciado en unidades de 5, por lo que esta pregunta también puede resolverse recursivamente mediante la expresión anterior con \(h=5\):

  • Paso 1:
    \[\begin{aligned} \mathrm{E~}(S_N-5)_+ &= \mathrm{E}(S_N) - 5 [1-\Pr(S_N \leq 0) ]\\ %\Pr (S_N\geq 5) \\ &= 28 - 5 \left(1 - \frac{1}{3}\right) = \frac{74}{3}=24,6667 \end{aligned}\]

  • Paso 2:
    \[\begin{aligned} \mathrm{E~}(S_N-10)_+ &= \mathrm{E~}(S_N-5)_+ - 5 [1-\Pr(S_N \leq 5)]\\ %\Pr (S_N\ge 10) \\ &= \frac{74}{3} - 5\left( 1 - \frac{1}{3} - \frac{0,4}{9}\right) = 21,555 \end{aligned}\]

  • Paso 3: \[\begin{aligned} \mathrm{E~}(S_N-15)_+ &= \mathrm{E~}(S_N-10)_+ - 5 [1-\Pr(S_N \leq 10)] \\ %\Pr (S_N\ge 15) \\ &= \mathrm{E~}(S_N-10)_+ - 5\Pr (S_N\ge 15) \\ &= 21,555 - 5 (0,5496) = 18,807 \end{aligned}\]


5.3.3 Resultados analíticos

Existen algunas combinaciones de distribuciones de frecuencia y severidad de los siniestros que generan una distribución fácil de utilizar para las pérdidas agregadas. Esta sección proporciona algunos ejemplos sencillos. Aunque estos ejemplos son convenientes desde el punto de vista computacional, por lo general son demasiado sencillos para ser utilizados en la práctica.


Ejemplo 5.3.8. Se obtiene una expresión cerrada para la distribución de la pérdida agregada cuando se considera una distribución geométrica para la frecuencia y una distribución exponencial para la severidad.

Supongamos que el número de siniestros \(N\) sigue una geométrica con media \(\mathrm{E}(N)=\beta\), y que la cuantía del siniestro \(X\) sigue una exponencial con \(\mathrm{E}(X)=\theta\). Recuerde que la pgf de \(N\) y la mgf de \(X\) son:

\[\begin{aligned} P_N (z) &=\frac{1}{1- \beta (z-1)}\\ M_{X}(t) &=\frac{1}{1-\theta t} \end{aligned}\] Por lo tanto, la mgf de la pérdida agregada \(S_N\) puede expresarse de dos formas (para más detalles, véase Suplemento Técnico 5.A.3) \[\begin{eqnarray} M_{S_N}(t) &=& P_N [M_{X}(t)] = \frac{1}{1 - \beta \left( \frac{1}{1-\theta t} - 1\right)} \nonumber\\ &=& 1+ \frac{\beta}{1+\beta} \left([1-\theta(1+\beta)t]^{-1}-1 \right)\\ &=& \frac{1}{1+\beta}(1) +\frac{\beta}{1+\beta} \left( \frac{1}{1-\theta (1+\beta)t}\right) \end{eqnarray}\]

A partir de (5.1), se aprecia que \(S_N\) es equivalente a una distribución compuesta de \(S_N=X^{*}_1+\cdots+X^{*}_{N^{*}}\), donde \(N^{*}\) es una Bernoulli con media \(\beta/(1+\beta)\) y \(X^{*}\) es una exponencial con media \(\theta(1+\beta)\). Para obtenerlo, se analiza la mgf de \(S\): \[\begin{aligned} M_{S_N}(t) = P_N [M_{X}(t)] = P_{N^{*}} [M_{X^{*}}(t)], \end{aligned}\] donde \[\begin{aligned} P_{N^*} (z) &=1+ \frac{\beta}{1+ \beta} (z-1),\\ M_{X^*} (t) &=\frac{1}{1- {{\theta(1+\beta)}} t}. \end{aligned}\]

A partir de (5.2), se aprecia que \(S_N\) es también equivalente a una mixtura de dos puntos en 0 y en \(X^{*}\). En concreto, \[\begin{eqnarray*} S_N &=& \left\{ \begin{array}{cl} 0 & {\rm con~ probabilidad ~Pr}(N^*=0) = 1/(1+\beta) \\ Y^{*} & {\rm con~ probabilidad ~Pr}(N^*=1) = \beta/(1+\beta) \end{array} \right.. \end{eqnarray*}\] La función de distribución de \(S_N\) es: \[\begin{eqnarray*} \Pr(S_N=0) &=& \frac{1}{1+\beta}\\ \Pr(S_N>s) &=& \Pr(X^*>s) =\frac{\beta}{1+\beta} \exp\left( -\frac{s}{ \theta (1+\beta)}\right) \end{eqnarray*}\] con pdf \[\begin{eqnarray*} f_{S_N}(s) = \frac{\beta}{\theta (1+\beta)^2}\exp\left( -\frac{s}{ \theta (1+\beta)}\right). \end{eqnarray*}\]


Ejemplo 5.3.9. Supongamos un modelo de riesgo colectivo en el que la severidad sigue una exponencial y con una distribución de frecuencias arbitraria. Recordemos que si \(X_i\sim Exp(\theta)\), la suma de iid exponenciales, \(S_n=X_1+\cdots+X_n\), sigue una distribución gamma, es decir, \(S_n\sim Gam(n,\theta)\). Su cdf es:

\[\begin{eqnarray*} F_{X}^{\ast n}(s) &=& \Pr (S_n \le s) = \int_{0}^{s} \frac{1}{\Gamma(n)\theta^n}s^{n-1}\exp\left(-\frac{s}{\theta}\right) ds\\ &=& 1-\sum_{j=0}^{n-1}\frac{1}{j!}\left( \frac{s}{\theta}\right)^j e^{-s/\theta } . \end{eqnarray*}\] La última igualdad se deriva aplicando integración por partes \(n-1\) veces.

Para la distribución de pérdidas agregadas, se puede intercambiar el orden de las sumas en la segunda línea, obteniendo

\[\begin{eqnarray*} F_{S}\left(s\right) &=& p_{0}+\sum_{n=1}^{\infty }p_n F_{X}^{\ast n}\left(s\right)\\ &=& 1 - \sum_{n=1}^{\infty }p_n \sum_{j=0}^{n-1}\frac{1}{j!} \left( \frac{s}{\theta}\right)^j e^{-s/\theta }\\ &=& 1-e^{-s/\theta}\sum_{j=0}^{\infty} \frac{1}{j!} \left( \frac{s}{\theta} \right)^j \overline{P}_j \end{eqnarray*}\] donde \(\overline{P}_j =p_{j+1}+p_{j+2}+\cdots = \Pr (N>j)\) es la “función de supervivencia” de la distribución del número de siniestros.


5.3.4 Distribución Tweedie

En esta sección se analiza una distribución compuesta concreta en la que el número de siniestros sigue una distribución de Poisson y la cuantía del siniestro sigue una distribución gamma. Esta especificación genera lo que se conoce como distribución Tweedie. La distribución Tweedie tiene masa de probabilidad en cero y una componente continua para valores positivos. Esta característica hace que sea ampliamente utilizada en la modelización de la siniestralidad en seguros, donde la masa en cero se interpreta como ningún siniestro y la componente positiva como el coste de los siniestros.

Concretamente, consideremos el modelo de riesgo colectivo \(S_N=X_1+\cdots+X_N\). Supongamos que \(N\) sigue una distribución Poisson con media \(\lambda\), y cada \(X_i\) sigue una distribución gamma con parámetro de forma \(\alpha\) y parámetro de escala \(\gamma\). La distribución Tweedie se deriva como la suma de Poisson de variables gamma. Para comprender la distribución de \(S_N\), primero examinemos la masa de probabilidad en cero. La pérdida total es cero cuando no se producen siniestros, es decir, \[{\rm Pr}(S_N=0)= {\rm Pr}(N=0)=e^{-\lambda}.\] Además, cabe señalar que \(S_N\) condicionada a \(N=n\), denotada como \(S_n=X_1+\cdots+X_n\), sigue una distribución gamma con parámetro de forma \(n\alpha\) y escala \(\gamma\). Para \(s>0\) la densidad de la distribución Tweedie se calcula como \[\begin{aligned} f_{S_n}(s)&=\sum_{n=1}^{\infty} p_n f_{S_n}(s)\\ &=\sum_{n=1}^{\infty}e^{-\lambda}\frac{(\lambda)^n}{n!}\frac{\gamma^{na}}{\Gamma(n\alpha)}s^{n\alpha-1}e^{-s\gamma} \end{aligned}\]

Así, la distribución Tweedie se puede interpretar como una mixtura en cero y una distribución para valores positivos, lo que la convierte en una herramienta adecuada para la modelización de la siniestralidad y para el cálculo de las primas puras en seguros. La media y la varianza del modelo Tweedie-Poisson compuesto son: \[{\rm E} (S_N)=\lambda\frac{\alpha}{\gamma}~~~~{\rm y}~~~~{\rm Var} (S)=\lambda\frac{\alpha(1+\alpha)}{\gamma^2}.\] Otra característica importante es que la distribución Tweedie es un caso especial de los modelos de dispersión exponencial, una clase de modelos utilizados para describir la componente aleatoria en los modelos lineales generalizados. Para apreciarlo, consideremos la siguiente reparametrización:

\[\begin{equation*} \lambda=\frac{\mu^{2-p}}{\phi(2-p)},~~~~\alpha=\frac{2-p}{p-1},~~~~\frac{1}{\gamma}=\phi(p-1)\mu^{p-1} \end{equation*}\] A partir de estas relaciones se puede demostrar que la distribución de \(S_N\) es

\[f_{S_N}(s)=\exp\left[\frac{1}{\phi}\left(\frac{-s}{(p-1)\mu^{p-1}}-\frac{\mu^{2-p}}{2-p}\right)+C(s;\phi)\right]\] donde \[\begin{equation*} C(s;\phi/\omega_i)=\left\{\begin{array}{ll} \displaystyle 0 & {\rm if}~ y=0 \\ \displaystyle \ln \sum\limits_{n\ge 1} \left\{\frac{(1/\phi)^{1/(p-1)}y^{(2-p)/(p-1)}}{(2-p)(p-1)^{(2-p)/(p-1)}}\right\}^{n}\frac{1}{n!\Gamma(n(2-p)/(p-1))s} & {\rm if}~ y>0 \end{array}\right. \end{equation*}\]

Por tanto, la distribución de \(S_N\) pertenece a la familia exponencial con parámetros \(\mu\), \(\phi\), y \(1 < p < 2\), y se obtiene que \[{\rm E} (S_N)=\mu~~~~{\rm y}~~~~{\rm Var} (S_N)=\phi\mu^{p}.\]

Lo anterior permite utilizar la distribución Tweedie para modelizar los siniestros en los modelos lineales generalizados. Cabe mencionar los dos casos límite del modelo Tweedie: \(p\rightarrow 1\) conduce a la distribución Poisson y \(p\rightarrow 2\) conduce a la distribución gamma. De este modo, el modelo Tweedie se sitúa entre las distribuciones gamma y Poisson, lo que intuitivamente tiene sentido ya que es la suma de Poisson de variables aleatorias gamma.

5.4 Cálculo de la Distribución de Pérdidas Agregadas

El cálculo de la distribución de pérdidas agregadas es un problema difícil e importante. Como se ha visto, tanto para el modelo de riesgo individual como para el modelo de riesgo colectivo, el cálculo de la distribución frecuentemente implica la evaluación de una convolución de orden \(n\). Para hacer manejable el problema, una posible estrategia es considerar una distribución que sea fácil de evaluar para aproximar la distribución de pérdidas agregadas. Por ejemplo, la distribución normal es una elección natural basada en el teorema central del límite, en el que los parámetros de la distribución normal pueden estimarse calculando los momentos. Este enfoque tiene ventajas y limitaciones. La principal ventaja es la facilidad de cálculo. La desventaja es: primero, el tamaño y la dirección del error de aproximación son desconocidos; segundo, la aproximación puede fallar en capturar algunas características especiales de la pérdida agregada tales como la masa en el punto cero.

Esta sección describe dos enfoques prácticos para calcular la distribución de la pérdida agregada, el método recursivo y la simulación.

5.4.1 Método recursivo

El método recursivo se aplica a los modelos compuestos en los que la componente de la frecuencia \(N\) pertenece a la clase \((a,b,0)\) o \((a,b,1)\) (véanse las Secciones 2.3 y 2.5.1) y la componente de la severidad \(X\) sigue una distribución discreta. En caso que \(X\) sea continua, una práctica habitual es primero discretizar la distribución de la severidad y, posteriormente, aplicar el método recursivo.

Supongamos que \(N\) está en la clase \((a,b,1)\) tal que \(p_{k}=\left( a+\frac{b}{k} \right) p_{k-1}, k = 2,3,\ldots\). Supongamos además que el soporte de \(X\) es \(\{0,1,\ldots,m\}\), discreto y finito. Entonces, la función de probabilidad de \(S_N\) es:

\[\begin{aligned} f_{S_N}(s)&=\Pr (S=s) \\ &=\frac{1}{1-af_{X}(0)}\left\{ \left[ p_1 -(a+b)p_{0}\right] f_X (s)+\sum_{x=1}^{s\wedge m}\left( a+\frac{bx}{s} \right) f_X (x)f_{S_N}(s-x)\right\}. \end{aligned}\] Si \(N\) está en la clase \((a,b,0)\), entonces \(p_1=(a+b)p_0\) y, por tanto, \[ f_{S_N}(s)=\frac{1}{1-af_X (0)}\left\{ \sum_{x=1}^{s\wedge m}\left( a+\frac{bx }{s}\right) f_X (x)f_{S_N}(s-x)\right\}. \] Caso particular: Frecuencia según una Poisson. Si \(N \sim Poi(\lambda)\), entonces \(a=0\) y \(b=\lambda\), y, por tanto, \[ f_{S_N}(s)=\frac{\lambda }{s}\left\{ \sum_{x=1}^{s \wedge m} x f_X (x) f_{S_N} (s-x)\right\} . \]


Ejemplo 5.4.1. Pregunta Examen Actuarial. El número de siniestros en un determinado período \(N\) sigue una distribución geométrica de media 4. La cuantía de cada siniestro \(X\) tiene \({\rm Pr} (X = x) = 0,25\), para \(x = 1,2,3,4\). El número de siniestros y la cuantía de los mismos son independientes. \(S_N\) es el coste total de los siniestros en el período. Calcular \(F_{S_N}(3)\).

Mostrar Solución de Ejemplo

5.4.2 Simulación

La distribución de pérdidas agregadas puede evaluarse mediante simulación de Monte Carlo. La idea es que se puede calcular la distribución empírica de \(S_N\) utilizando una muestra aleatoria. El valor esperado y la varianza de la pérdida agregada también pueden estimarse a partir de la media muestral y varianza muestral de los valores simulados. A continuación se resumen los procedimientos de simulación para los modelos de pérdidas agregadas. Supongamos que \(m\) es el tamaño de la muestra aleatoria generada de pérdidas agregadas.

  1. Modelo de Riesgo Individual \(S_n=X_1+\cdots+X_n\)

    • Supongamos el contador \(j=1,\ldots,m\). Se fija \(j=1\).
    • Se genera cada realización de pérdida individual \(x_{ij}\) para \(i=1,\ldots,n\). Por ejemplo, se puede utilizar el método de transformación inversa (Sección 6.2).
    • Se calcula la pérdida total \(s_j = x_{1j} + \cdots + x_{nj}\).
    • Se repiten los dos pasos anteriores para \(j=2,\ldots,m\) hasta obtener una muestra de tamaño \(m\) de \(S_n\), es decir, \(\{s_1,\ldots,s_m\}\).
  2. Modelo de riesgo colectivo \(S_N=X_1+\cdots+X_N\)

    • Supongamos el contador \(j=1,\ldots,m\). Se fija \(j=1\).
    • Se genera el número de siniestros \(n_j\) de la distribución de frecuencias \(N\).
    • Dado \(n_j\), se genera a partir de la distribución de severidad \(X\) la cuantía de cada siniestro independiente, denotado por \(x_{1j},\ldots,x_{n_j j}\).
    • Se calcula la pérdida agregada \(s_j = x_{1j} + \cdots + x_{n_j j}\).
    • Se repiten los tres pasos anteriores para \(j=2,\ldots,m\) hasta obtener una muestra de tamaño \(m\) de \(S_N\), es decir, \(\{s_1,\ldots, s_m\}\).

A partir de la muestra aleatoria de \(S\), la distribución empírica se puede calcular como \[\hat{F}_S(s)=\frac{1}{m}\sum_{i=1}^{m}I(s_i\leq s),\] donde \(I(\cdot)\) es una función indicadora. La distribución empírica \(\hat{F}_S(s)\) convergerá casi seguramente a \({F}_S(s)\) a medida que el tamaño muestral \(m\rightarrow \infty\).

El procedimiento anterior asume que se conocen las distribuciones de probabilidad, incluidos los valores de los parámetros, de las distribuciones de frecuencia y severidad. En la práctica, primero habría que seleccionar estas distribuciones, estimar sus parámetros a partir de los datos, y luego evaluar la calidad del ajuste del modelo utilizando diferentes herramientas de validación del modelo (véase el capítulo 4). Por ejemplo, los supuestos del modelo de riesgo colectivo sugieren una estimación en dos etapas, en la que se construye un modelo para el número de siniestros \(N\) a partir de los datos de conteo de siniestros, y otro modelo para la severidad de los siniestros \(X\) a partir de los datos del importe de los siniestros. ***

Ejemplo 5.4.2. Consideremos el ejemplo 5.3.5 con la frecuencia de siniestros del individuo \(N \sim Poi(\lambda=25)\) y severidad de los siniestros \(X \sim U(5,95)\). A partir de una muestra simulada de 10.000 observaciones, estimar la media y la varianza de la pérdida agregada \(S_N\). Además, utilizar la muestra simulada para estimar la probabilidad que el coste total de la siniestralidad para esta persona será superior a 2000 y compararla con la estimación basada en la aproximación normal del ejemplo 5.3.5.

Mostrar Solución de Ejemplo

5.5 Efectos de la Modificación de las Coberturas

5.5.1 Impacto de la exposición en la frecuencia

Esta sección se centra en un modelo de riesgo individual para el número de siniestros. Recordemos que el modelo de riesgo individual implica un número fijo de contratos \(n\) y variables aleatorias de pérdidas independientes \(X_i\). Considere el número de siniestros de un grupo de pólizas \(n\):

\[S=X_1+\cdots+X_n\] donde se asume que las \(X_i\) son iid que representan el número de siniestros de cada póliza \(i\). En este caso, la exposición de la cartera es \(n\), utilizando la póliza como base de exposición. La pgf de \(S\) es \[\begin{aligned} P_{S}(z)&={\rm E}(z^S)={\rm E}\left(z^{\sum_{i=1}^nX_i}\right)\\ &=\prod_{i=1}^n{\rm E}(z^{X_i})=[P_X(z)]^n \end{aligned}\]

Caso particular: Poisson. Si \(X_i\sim Poi(\lambda)\), su pgf es \(P_X(z)=e^{\lambda(z-1)}\). Entonces la pgf de \(S\) es \[P_{S}(z)=[e^{\lambda(z-1)}]^n=e^{n\lambda(z-1)}.\] Por tanto \(S\sim Poi(n\lambda)\). Es decir, la suma de \(n\) variables aleatorias de Poisson independientes, cada una de media \(\lambda\), sigue una distribución de Poisson de media \(n\lambda\).


Caso particular: Binomial Negativa. Si \(X_i\sim NB(\beta,r)\), su pgf es \(P_X(z)=[1-\beta(z-1)]^{-r}\). Entonces la pgf de \(S\) es \[P_{S}(z)=[[1-\beta(z-1)]^{-r}]^n=[1-\beta(z-1)]^{-nr}.\] Por tanto \(S\sim NB(\beta,nr)\).


Ejemplo 5.5.1. Supongamos que el número de siniestros por vehículo sigue una Poisson con media \(\lambda\). Dados los siguientes datos sobre el número observado de siniestros para cada hogar, estima \(\lambda\) por máxima verosimilitud.

\[ {\small \begin{matrix} \begin{array}{c|c|c} \hline \text{Hogar ID} & \text{Número de vehículos} & \text{Número de siniestros} \\ \hline 1 & 2 & 0 \\ 2 & 1 & 2 \\ 3 & 3 & 2 \\ 4 & 1 & 0 \\ 5 & 1 & 1 \\ \hline \end{array} \end{matrix} } \]

Mostrar Solución de Ejemplo

Si la exposición de la cartera cambia de \(n_1\) a \(n_2\), se puede establecer la siguiente relación entre el número total de siniestros: \[P_{S_{n_2}}(z)=[P_X(z)]^{n_2}=[P_X(z)^{n_1}]^{n_2/n_1}=P_{S_{n_1}}(z)^{n_2/n_1}.\]

5.5.2 Impacto de los deducibles en la frecuencia de siniestros

Esta sección examina el efecto de los deducibles en la frecuencia de los siniestros. Intuitivamente, si se introduce un deducible en la póliza, disminuirán los siniestros reclamados ya que no se reclamará si la cuantía reclamada es inferior al deducible. Incluso si el asegurado realiza la reclamación, puede que no se realice ningún pago en la póliza, ya que puede denegarse el siniestro o que la cuantía del mismo se determine finalmente por debajo del deducible. Denotemos \(N^L\) el número de pérdidas (es decir, el número de siniestros sin deducible), y \(N^P\) el número de pagos cuando se establece un deducible \(d\). El objetivo es identificar la distribución de \(N^P\) dada la distribución de \(N^L\). A continuación se demuestra que la relación entre \(N^L\) y \(N^P\) puede establecerse en el marco del modelo de riesgo agregado.

Cabe señalar que, en ocasiones, cambios en los deducibles podrían afectar al comportamiento de siniestralidad del asegurado. Suponemos aquí que esto no ocurre, es decir, que las distribuciones subyacentes de pérdidas, tanto para la frecuencia como para la severidad, se mantienen sin cambios cuando varía el deducible.

Dado que ocurren \(N^L\) pérdidas, suponemos que \(X_1,X_2\ldots,X_{N^L}\) son las cuantías asociadas de las pérdidas. Para \(j=1,\ldots,N^L\), se define \[\begin{eqnarray*} I_j&=& \left \{ \begin{array}{cc} 1 & \text{si} ~X_j>d\\ 0 & \text{el resto de casos}\\ \end{array} \right.. \end{eqnarray*}\]

Por tanto, se establece \[N^P=I_1+I_2+\cdots+I_{N_L},\]

Es decir, el número total de pagos es igual al número de pérdidas por encima del valor del deducible. Dado que las \(I_j\) son variables aleatorias de Bernoulli independientes con probabilidad de éxito \(v=\Pr(X>d)\), la suma de un número fijo de estas variables es una variable aleatoria binomial. Condicionado a \(N^L\), \(N^P\) sigue una distribución binomial, es decir, \(N^P | N^L \sim Bin(N^L, v)\), donde \(v=\Pr(X>d)\). Lo anterior implica que \[\begin{aligned} \mathrm{E}\left(z^{N^P}|N^L\right)&= \left[ 1+v(z-1)\right]^{N^L} \end{aligned}\]

Por tanto, la pgf de \(N^P\) es \[\begin{aligned} P_{N^P}(z)&= \mathrm{E}_{N^P}\left(z^{N^P}\right)=\mathrm{E}_{N^L}\left[\mathrm{E}_{N^P}\left(z^{N^P}|N^L\right)\right]\\ &= \mathrm{E}_{N^L}\left[(1+v(z-1))^{N^L}\right]\\ &= P_{N^L}\left(1+v(z-1)\right) \end{aligned}\]

Así, se puede definir la pgf de \(N^P\) como la pgf de \(N^L\), evaluada en un nuevo argumento \(z^* = 1+v(z-1)\). Esto es, \(P_{N^P}(z)=P_{N^L}(z^*)\).

Casos particulares:

  • \(N^L\sim Poi (\lambda)\). La pgf de \(N^L\) es \(P_{N^L}=e^{\lambda(z-1)}\). De este modo, la pgf de \(N^P\) es \[\begin{aligned} P_{N^P}(z) &= e^{ \lambda(1+v(z-1)-1)} \\ &= e^{\lambda v(z-1)} , \end{aligned}\]
    Por tanto, \(N^P \sim Poi(\lambda v)\). Esto significa que el número de pagos tiene la misma distribución que el número de pérdidas, pero con un número esperado de pagos igual a \(\lambda v = \lambda \Pr(X>d)\).

  • \(N^L \sim NB(\beta, r)\). La pgf de \(N^L\) es \(P_{N^{L}}\left( z\right) =\left[ 1-\beta \left( z-1\right)\right]^{-r}\). De este modo, la pgf de \(N^P\) es \[\begin{aligned} P_{N^P}(z)&= \left( 1-\beta (1+v(z-1)-1)\right)^{-r}\\ &= \left( 1-\beta v(z-1)\right)^{-r}, \end{aligned}\] Por tanto, \(N^P \sim NB(\beta v, r)\). Esto significa que el número de pagos tiene la misma distribución que el número de pérdidas, pero con parámetros \(\beta v\) y \(r\).


Ejemplo 5.5.2. Supongamos que las pérdidas \(X_i\sim Pareto(\alpha=4,\ \theta=150)\). Sabemos que la frecuencia de pérdidas es \(N^L\sim Poi(\lambda)\) y la frecuencia de pagos es \(N^{P}_1\sim Poi(0,4)\) con un deducible de valor igual a \(d_1=30\). Encontrar la distribución de la frecuencia de pagos \(N^{P}_2\) cuando el valor del deducible es \(d_2=100\).

Mostrar Solución de Ejemplo

Ejemplo 5.5.3. Continuación. Ahora supongamos que la frecuencia de pérdidas es \(N^L \sim NB(\beta,\ r)\) y para el deducible \(d_1=30\), la frecuencia de pagos \(N^{P}_1\) es negativa binomial con media \(0,4\). Encontrar la media de la frecuencia de pagos \(N^{P}_2\) para el deducible \(d_2=100\).

Mostrar Solución de Ejemplo

A continuación, se examina el caso más general en el que \(N^L\) es una distribución cero modificada. Recordemos que una distribución cero modificada puede definirse en términos de una distribución no modificada (como se señala en la Sección 2.5.1). Es decir, \[\begin{aligned} p_k^M = c~p_k^0, {~\rm para~} k=1,2,3,\ldots, {~\rm con~}c = \frac{1-p_0^M}{1-p_0^0}, \end{aligned}\] donde \(p^0_k\) es la pmf de una distribución no modificada. En el caso que \(p_0^M=0\), se denomina una distribución cero truncada, o \(ZT\). Para otros valores arbitrarios de \(p_0^M\), es una distribución cero modificada, o \(ZM\). La pgf de la distribución modificada se obtiene como \[\begin{aligned} P^M(z) &= 1-c+c~P^0(z), \end{aligned}\] expresada en términos de la pgf de la distribución no modificada, \(P^0(z)\). Cuando \(N^L\) sigue una distribución cero modificada, la distribución de \(N^P\) se establece usando la misma relación anterior, \(P_{N^P}(z)=P_{N^L}\left(1+v(z-1)\right)\).

Casos particulares:

  • \(N^{L}\) es una variable aleatoria ZM-Poisson con parámetros \(\lambda\) y \(p_0^{M}\). La pgf de \(N^L\) es \[P_{N^{L}}(z)=1-\cfrac{1-p_0^{M}}{1-e^{-\lambda}}+\cfrac{1-p_0^{M}}{1-e^{-\lambda}}\left( e^{\lambda(z-1)} \right).\] Por tanto, la pgf de \(N^P\) es \[P_{N^{P}}(z)=1-\cfrac{1-p_0^{M}}{1-e^{-\lambda}}+\cfrac{1-p_0^{M}}{1-e^{-\lambda}}\left( e^{\lambda v(z-1)} \right).\] Así el número de pagos sigue también una distribución ZM-Poisson con parámetros \(\lambda v\) y \(p_0^{M}\). La probabilidad en cero se puede evaluar mediante \({\rm Pr}(N^P=0) = P_{N^P}(0)\).

  • \(N^{L}\) es una variable aleatoria ZM-binomial negativa con parámetros \(\beta\), \(r\), y \(p_0^{M}\). La pgf de \(N^L\) es \[P_{N^{L}}(z)=1-\cfrac{1-p_0^{M}}{1-(1+\beta)^{-r}}+\cfrac{1-p_0^{M}}{1-(1+\beta)^{-r}}\left[ 1-\beta \left( z-1\right)\right]^{-r}.\] Por tanto, la pgf de \(N^P\) es \[P_{N^{P}}(z)=1-\cfrac{1-p_0^{M}}{1-(1+\beta)^{-r}}+\cfrac{1-p_0^{M}}{1-(1+\beta)^{-r}}\left[ 1-\beta v\left( z-1\right)\right]^{-r}.\] Así, el número de pagos sigue también una distribución ZM-binomial negativa con parámetros \(\beta v\), \(r\), y \(p_0^{M}\). Del mismo modo, la probabilidad en cero se puede evaluar mediante \({\rm Pr}(N^P=0) = P_{N^P}(0)\).


Ejemplo 5.5.4. Las pérdidas agregadas se modelizan de la siguiente manera:
(i) El número de pérdidas sigue una distribución Poisson modificada en cero con \(\lambda=3\) y \(p_0^M = 0,5\).
(ii) La cuantía de la pérdida sigue una distribución Burr con \(\alpha=3, \theta=50, \gamma=1\).
(iii) Se introduce un deducible \(d=30\) para cada pérdida.
(iv) El número de pérdidas y su cuantía son independientes entre sí.

Calcular \(\mathrm{E}(N^P)\) y \(\mathrm{Var}(N^P)\).

Mostrar Solución de Ejemplo

5.5.3 Impacto de las modificaciones de la póliza en la siniestralidad agregada

En esta sección, se examina el efecto de un cambio en el deducible sobre los pagos agregados de una cartera de seguros. Se asume que la presencia de límites en la póliza (\(u\)), coaseguro (\(\alpha\)) e inflación (\(r\)) no tienen ningún efecto en la distribución subyacente de la frecuencia de pagos realizados por la aseguradora. Al igual que en la sección anterior, asumimos que cambios en los deducibles tampoco afectan las distribuciones subyacentes de pérdidas, ni la de frecuencia ni la de severidad.

Recordar la notación \(N^L\) para el número de pérdidas. Con la cuantía de la pérdida inicial \(X\) y el deducible de la póliza \(d\), se usa \(N^P\) para el número de pagos (como se definió en la sección anterior 5.5.2). Asimismo, se define el importe en base a las pérdidas

\[\begin{eqnarray*} X^{L}&=\left\{ \begin{array}{ll} 0 ~, & \text{si } ~X<\cfrac{d}{1+r} \\ \alpha[(1+r)X-d]~, & \text{si } ~\cfrac{d}{1+r}\leq X<\cfrac{u}{1+r} \\ \alpha(u-d)~, & \text{si } ~X \ge \cfrac{u}{1+r}\\ \end{array} \right., \end{eqnarray*}\] y la cuantía en base a los pagos \[\begin{eqnarray*} X^{P}&=\left\{ \begin{array}{ll} {\rm indeterminado} ~, & \text{si }~ X<\cfrac{d}{1+r} \\ \alpha[(1+r)X-d]~, & \text{si }~ \cfrac{d}{1+r}\leq X<\cfrac{u}{1+r} \\ \alpha(u-d)~, & \text{si } ~ X \ge \cfrac{u}{1+r}\\ \end{array} \right.. \end{eqnarray*}\] Aquí, \(r\), \(u\), y \(\alpha\) representan la tasa de inflación, el límite de la póliza y el coseguro, respectivamente. Por lo tanto, los costes agregados (cuantías de los pagos) pueden expresarse ya sea en base a pérdidas o a pagos:

\[\begin{aligned} S &= X^L_1 + \cdots + X^L_{N^L} \\ &=X^P_1 + \cdots + X^P_{N^P} ~. \end{aligned}\]

Los fundamentos del modelo de riesgo colectivo pueden aplicarse. Por ejemplo, se tiene que: \[\begin{aligned} {\rm E}(S) &= {\rm E}\left(N^L\right) {\rm E}\left(X^L\right) = {\rm E}\left(N^P\right) {\rm E}\left(X^P\right)\\ {\rm Var}(S) &= {\rm E}\left(N^L\right) {\rm Var}\left(X^L\right) + \left[{\rm E}\left(X^L\right)\right]^2 {\rm Var}(N^L) \\ &= {\rm E}\left(N^P\right) {\rm Var}\left(X^P\right) + \left[{\rm E}\left(X^P\right)\right]^2 {\rm Var}(N^P)\\ M_S(z)&=P_{N^L}\left[M_{X^L}(z)\right]=P_{N^P}\left[M_{X^P}(z)\right] \end{aligned}\]


Ejemplo 5.5.5. Pregunta Examen Actuarial. Una póliza dental colectiva sigue una distribución binomial negativa en el número de siniestros con media 300 y varianza 800. La severidad inicial se indica en la siguiente tabla:

\[ {\small \begin{matrix} \begin{array}{ c | c } \hline \text{Severidad} & \text{Probabilidad}\\ \hline 40 & 0.25\\ 80 & 0.25\\ 120 & 0.25\\ 200 & 0.25\\ \hline \end{array} \end{matrix} } \]

Se espera que la severidad aumente un 50% sin cambiar de frecuencia. Se introduce un deducible de 100 por siniestro. Calcular el valor esperado de la pérdida agregada \(S\) después de estos cambios.

Mostrar Solución de Ejemplo

Ejemplo 5.5.6. Continuación. ¿Cuál es la varianza de la pérdida agregada, \(\mathrm{Var~}(S)\)?

Mostrar Solución de Ejemplo

Método alternativo: en base a los pagos. Anteriormente, se ha calculado el coste total esperado de siniestralidad multiplicando el número esperado de pérdidas por el coste esperado por pérdida. Recuerde que también podemos multiplicar el número esperado de pagos por el coste esperado por pago. En este caso, tenemos

\[S=X_1^P + \cdots + X_{N_P}^P \] La probabilidad de un pago es \[\Pr(1,5X \ge 100)=\Pr(X \ge 66,\bar{6})=\frac{3}{4} .\]

Por tanto, el número de pagos, \(N^P\) tiene una distribución binomial negativa (véase el caso particular de la binomial negativa en Sección 5.5.2) con media \[\mathrm{E}(N^P) = \mathrm{E}(N^L)~\Pr(1,5X \geq 100) = 300 \left(\frac{3}{4} \right)=225\] El coste por pago es \[\begin{eqnarray*} X^P &=& \left\{ \begin{array}{ll} \text{indeterminado}~, & \text{si }~ 1,5x<100 \\ 1,5x-100~, & \text{si } ~ 1,5x\ge 100\\ \end{array} \right. \end{eqnarray*}\] Su esperanza es \[\mathrm{E}(X^P)=\frac{\mathrm{E}(X^L)}{\Pr(1,5X > 100)}=\frac{75}{(3/4)}=100\] Por lo tanto, al igual que antes, la pérdida esperada agregada es \[\mathrm{E}(S)=\mathrm{E}(X^P) ~ \mathrm{E}(N^P) = 100(225)=22.500\]


Ejemplo 5.5.7. Pregunta Examen Actuarial. Una compañía asegura una flota de vehículos. Las pérdidas agregadas siguen una distribución compuesta de Poisson. El número esperado de pérdidas es 20. Las pérdidas, independientemente del tipo de vehículo, siguen una distribución exponencial con \(\theta=200\). Para reducir el coste del seguro, se introducen dos modificaciones:
(i) No se asegurará a un cierto tipo de vehículos. Se estima que reducirá la frecuencia de pérdidas en un 20\(\%\).
(ii) Se incluirá un deducible de 100 por pérdida.

Calcular la cantidad total esperada que pagará la compañía después de las modificaciones.

Mostrar Solución de Ejemplo

Método alternativo: en base a los pagos. La cantidad total esperada que pagará después de las modificaciones también se puede calcular en base a los pagos. Con el deducible de 100, la probabilidad que ocurra un pago es \(\Pr(X > 100) = e^{-100/200}\). Para la severidad por pago, tomando la expresión \(\mathrm{E}(X^L)\) del ejemplo original, se tiene \[\begin{aligned} \mathrm{E} (X^P) = \frac{\mathrm{E} (X^L)}{\Pr(X > 100)} = \frac{200 - 200(1-e^{-100/200})}{e^{-100/200}} = 200 \end{aligned}\]

Este resultado es esperable—cabe recordar que la distribución exponencial no tiene memoria, por lo que el coste esperado de los siniestros por encima de 100 sigue distribuyéndose según una exponencial de media 200.

Ahora, tomemos la fecuencia de pagos

\[\mathrm{E} (N^P) = \mathrm{E}(N^L)~\Pr(X>100) = 16 ~e^{-100/200} = 9,7\] Combinando ambos resultados, se obtiene la misma respuesta en base a los pagos que la obtenida anteriormente en base a las pérdidas \[\mathrm{E}(S) = \mathrm{E} (X^P)~ \mathrm{E} (N^P)= 200(9,7) = 1.941\]


5.6 Otros Recursos y Colaboradores

5.6.0.1 Ejercicios

Aquí se ofrece un conjunto de ejercicios que guían al lector a través de algunos de los fundamentos teóricos de Loss Data Analytics. Cada tutorial se basa en una o más preguntas de los exámenes actuariales profesionales, normalmente el Examen C de la Society of Acturies.

Aggregate Loss Guided Tutorials

Colaboradores

  • Peng Shi y Lisa Gao, Universidad de Wisconsin-Madison, son los principales autores de la version inicial de este capítulo. Email: para comentarios sobre los capítulos y posibles mejoras.
  • Revisores de los capítulos, entre otros: Vytaras Brazauska, Mark Maxwell, Jiadong Ren, Di (Cindy) Xu.
  • Traducción al español: Miguel Santolino (Universitat de Barcelona)

###TS 5.A.1. Propiedades del Modelo de Riesgo Individual {-}

El valor esperado de la pérdida agregada en el modelo de riesgo individual,

\[\begin{aligned} \mathrm{E}(S_n) &=\sum_{i=1}^n ~ \mathrm{E}(X_i) = \sum_{i=1}^n ~ \mathrm{E}(I_i \times B_i) = \sum_{i=1}^n ~ \mathrm{E}(I_i) ~~ \mathrm{E}(B_i) ~~~~ \text{dada la independencia entre las } I_i \text{ y las } B_i \\ &= \sum_{i=1}^n \Pr(I_i=1) ~ \mu_i ~~~~ \text{ya que el valor esperado de la variable indicadora es igual a la probabilidad que sea } 1 \\ &= \sum_{i=1}^n ~ q_i ~ \mu_i \end{aligned}\]

La varianza de la pérdida agregada en el modelo de riesgo individual,

\[\begin{aligned} \mathrm{Var}(S_n) &= \sum_{i=1}^n \mathrm{Var}(X_i) ~~~~ \text{ dada la independencia entre las } X_i \\ &= \sum_{i=1}^n ~ \left( ~ \mathrm{E}\left[ \mathrm{Var}(X_i | I_i) \right] + \mathrm{Var}\left[ \mathrm{E}(X_i|I_i) \right] ~ \right) ~~~~ \text{a partir de las formulas de varianza condicionada} \\ &= \sum_{i=1}^n \left( q_i ~ \sigma_i^2 ~ + ~ q_i ~ (1-q_i) ~ \mu_i^2 \right) \end{aligned}\]

Para verlo, tenga en cuenta que \[\begin{aligned} \mathrm{E}\left[ \mathrm{Var}(X_i | I_i) \right] &= \mathrm{Var}(X_i|I_i=0) ~ \Pr(I_i=0) + \mathrm{Var}(X_i|I_i=1) ~ \Pr(I_i=1) \\ &= q_i ~ \sigma_i^2 + (1-q_i) ~ (0) = q_i ~ \sigma_i^2, \end{aligned}\]

y \[\begin{aligned} \mathrm{Var}\left[ \mathrm{E}(X_i|I_i) \right] &= q_i ~ (1-q_i) ~ \mu_i^2~, \end{aligned}\]

en base a la varianza de la Bernoulli ya que \(\mathrm{E}(X_i|I_i) = 0\) cuando \(I_i=0\) (probabilidad \(\Pr(I_i=0) = 1-q_i\)) y \(\mathrm{E}(X_i|I_i) = \mu_i\) cuando \(I_i=1\) (probabilidad \(\Pr(I_i=1)= q_i\)).

La función generadora de probabilidad de la pérdida agregada en el modelo de riesgo individual,

\[\begin{aligned} P_{S_n}(z) &= \prod_{i=1}^n ~ P_{X_i}(z) ~~~~ \text{dada la independencia de las } X_i \\ &= \prod_{i=1}^n ~ \mathrm{E}(z^{~X_i}) = \prod_{i=1}^n ~ \mathrm{E}(z^{~I_i \times B_i}) = \mathrm{E} \left[ \mathrm{E}(z^{~I_i \times B_i} | I_i) \right] ~~~~ \text{por la ley de esperanza iterada} \\ &= \prod_{i=1}^n \left[ ~ E\left(z^{~I_i \times B_i} | I_i=0\right) ~ \Pr(I_i=0) + E\left(z^{~I_i \times B_i} | I_i=1\right) ~ \Pr(I_i=1) ~ \right] \\ &= \prod_{i=1}^n ~ \left[ ~ (1) ~ (1-q_i) + P_{B_i}(z) ~ q_i ~ \right] = \prod_{i=1}^n \left(~ 1-q_i + q_i ~ P_{B_i}(z) ~\right) \end{aligned}\]

Por último, la función generadora de momentos de la pérdida agregada en el modelo de riesgo individual,

\[\begin{aligned} M_{S_n}(t) &= \prod_{i=1}^n ~ M_{X_i}(t) ~~~~ \text{dada la independencia de las } X_i \\ &= \prod_{i=1}^n ~ \mathrm{E}(e^{t~X_i}) = \prod_{i=1}^n ~ \mathrm{E}\left(e^{~t~(I_i \times B_i)} \right) = \prod_{i=1}^n ~ \mathrm{E} \left[ \mathrm{E} \left( e^{~t~(I_i \times B_i)} | I_i \right) \right] ~~~~ \text{por la ley de esperanza iterada} \\ &= \prod_{i=1}^n ~ \left[~ \mathrm{E}\left(e^{~t~(I_i \times B_i)} | I_i=0 \right) ~ \Pr(I_i=0) + \mathrm{E}\left( e^{~t~(I_i \times B_i)} | I_i=1 \right) ~ \Pr(I_i=1) ~\right] \\ &= \prod_{i=1}^n ~ \left[ ~ (1) ~ (1-q_i) + M_{B_i}(t) ~ q_i ~ \right] = \prod_{i=1}^n \left(~ 1-q_i + q_i ~ M_{B_i}(t) ~\right) \end{aligned}\]


###TS 5.A.2. Relación entre las funciones generadoras de probabilidad de \(X_i\) y \(X_i^T\) {-}

Supongamos que \(X_i\) pertenece a la clase \((a,b,0)\) con pmf \(p_{ik} = \Pr(X_i = k)\) para \(k=0,1,\ldots\) y \(X_i^T\) es la distribución asociada truncada en cero de la clase \((a,b,1)\) con pmf \(p_{ik}^T = p_{ik}/(1-p_{i0})\) para \(k=1,2,\ldots\). La relación entre la pgf de \(X_i\) y la pgf de \(X_i^T\) es la siguiente

\[\begin{aligned} P_{X_i}(z) &= \mathrm{E~}(z^{X_i}) = \mathrm{E}\left[ \mathrm{E}\left( z^{X_i} | X_i \right) \right] ~~~~ \text{por la ley de esperanza iterada} \\ &= \mathrm{E}\left( z^{X_i} | X_i=0 \right)~ \Pr(X_i=0) + \mathrm{E}\left( z^{X_i} | X_i>0 \right) ~ \Pr(X_i>0) \\ &= (1)~ p_{i0} + \mathrm{E}(z^{X_i^T}) ~ (1-p_{i0}) ~~~~ \text{dado que } (X_i | X_i>0) \text{ es la variable aleatoria truncada en cero } X_i^T \\ &= p_{i0} +(1-p_{i0}) P_{X_i^{T}}(z) \end{aligned}\]


###TS 5.A.3. Ejemplo 5.3.8 Función generadora de momentos de la pérdida agregada \(S_N\) {-}

En el caso que \(N\sim Geo(\beta)\) y \(X\sim Exp(\theta)\), se obtiene

\[\begin{aligned} P_N (z) &=\frac{1}{1- \beta (z-1)}\\ M_{X}(t) &=\frac{1}{1-\theta t} \end{aligned}\]

Por tanto, la mgf de la pérdida agregada \(S_N\) es \[\begin{aligned} M_{S_N}(t) &= P_N [M_{X}(t)] = \frac{1}{1 - \beta \left( \frac{1}{1-\theta t} - 1\right)} \\ &= \frac{1}{1 - \beta \left( \frac{\theta t}{1-\theta t} \right)} + 1 - 1 = 1+ \frac{\beta \left( \frac{\theta t}{1-\theta t} \right)}{1 - \beta \left( \frac{\theta t}{1-\theta t} \right)} \\ &= 1 + \frac{\beta \theta t}{(1-\theta t) - \beta \theta t} = 1+ \frac{\beta \theta t}{1-\theta t (1+\beta)} \cdot \frac{1+\beta}{1+\beta} \\ &= 1 + \frac{\beta}{1+\beta} \left[ \frac{\theta (1+\beta) t}{1-\theta(1+\beta)t} \right] \\ &= 1 + \frac{\beta}{1+\beta} \left[ \frac{1}{1-\theta(1+\beta)t} - 1 \right], \\ \end{aligned}\] que coincide con la expresión (5.1). Para la expresión alternativa de la mgf (5.2), se puede continuar a partir de aquí:

\[\begin{aligned} M_{S_N}(t) &= 1 + \frac{\beta}{1+\beta} \left[ \frac{\theta (1+\beta) t}{1-\theta(1+\beta)t} \right] \\ &= \frac{1+\beta}{1+\beta} + \frac{\beta}{1+\beta} \left[ \frac{\theta (1+\beta) t}{1-\theta(1+\beta)t} \right] \\ &= \frac{1}{1+\beta} + \frac{\beta}{1+\beta} + \frac{\beta}{1+\beta} \left[ \frac{\theta (1+\beta) t}{1-\theta(1+\beta)t} \right] \\ &= \frac{1}{1+\beta} + \frac{\beta}{1+\beta}\left[1 + \frac{\theta (1+\beta) t}{1-\theta (1+\beta)t} \right] \\ &= \frac{1}{1+\beta} +\frac{\beta}{1+\beta} \left[ \frac{1}{1-\theta (1+\beta)t}\right] \end{aligned}\]