Abstract

Although before the 1990s there was already participation of large retail companies in Mexico, the arrival of transnational companies, such as Wal-Mart, generated a reconfiguration in food distribution and, with this, an expectation of the direct impact on some sector variables. Our objective is to establish if Wal-Mart´s presence involves a higher productivity per worker. To achieve this goal, an ordinal logistic probability model was constructed and its results at municipal level show a positive and statistically significant relationship, that is, the probability of finding a higher level of productivity increases with a higher presence of the above company.

Keywords: productivity by worker; competitiveness; Wal-Mart; commerce
JEL Classification: D21; E23; L1

1. Introducción

Hasta la década de los años 1990 en México existían dos patrones de distribución de alimentos: a) el Dendrítico y b) el Solar (Torres Torres, 2011[21]; Torres Torres y Rojas Martínez, 2016[22]). No obstante, durante las últimas tres décadas, dicho esquema de distribución se reconfiguró notablemente al amparo de las políticas de ajuste estructural, sobre todo con la participación de nuevos grupos empresariales, particularmente Wal-Mart Stores Inc. Entre las implicaciones para el sector, destacan las mejoras tecnológicas y organizacionales (Gasca y Torres, 2014[10]) el aprovechamiento de la red global de proveedores de las nuevas empresas participantes (Álvarez Galván y Tilly, 2006[1]; Gasca y Torres, 2014[1]; Minei y Matusitz, 2013[17]) y las oportunidades de financiamiento para las filiales mexicanas (Moreno-Lázaro, 2012[18]). En consecuencia, el patrón de distribución de alimentos se modificó sustancialmente. Así, por ejemplo, la llegada de Wal-Mart modificó la gestión de los inventarios de las tiendas toda vez que se implementó “una especie de justo a tiempo aplicado al comercio” (Álvarez Galván y Tilly, 2006[1], p. 947) que permite generar economías de escala en la cadena de abasto (Gasca y Torres, 2014[10]; Minei y Matusitz, 2013[17]) y, por tanto, una transformación radical de los patrones clásicos de búsqueda de alimentos de los hogares (Atkin, Faber, y Gonzalez-Navarro, 2018[2]). En otras palabras, se generó un tercer patrón de distribución, el del comercio moderno.

Si bien no se ha profundizado en las características de este moderno patrón de acopio y distribución de alimentos (Castillo Girón, Ayala Ramírez, López Jiménez, y Vargas Portillo, 2014[3]), algunos autores (Lagakos, 2009[15]) han planteado que la participación de las grandes cadenas de distribución de alimentos, como es el caso de Wal Mart, puede impactar algunas variables, como es la productividad por trabajador.

En el presente trabajo cuestionamos tal consideración y nos planteamos la siguiente pregunta ¿Wal-Mart es un factor significativo de las diferencias de productividad por trabajador del comercio al por menor mexicano?.

Para dar respuesta a esta pregunta, el texto se integra de tres apartados: el primero contiene los conceptos que vinculan al comercio moderno con la productividad por trabajador del sector; el segundo define la relación que existe entre la productividad por trabajador y la presencia de Wal-Mart en México y, en consecuencia, se plantea un modelo de probabilidad ordinal con tres categorías de respuesta; en el tercer apartado se presenta la estadística descriptiva, las estimaciones y el análisis de los resultados. Al final se presentan las conclusiones del trabajo.

2. Marco teórico: comercio moderno y productividad por trabajador

Si bien antes de la década de los años 1990 ya había participación de algunas grandes empresas de comercio minorista en México (empresas del sector retail), la distribución de alimentos seguía dos patrones: a) el Dendrítico identificado por operar un centro o mercado regional que acopia los productos y los hace llegar a las ciudades a un centro mayorista de primer orden que a su vez los llevará a un mercado secundario o a las tiendas minoristas; y, b) el Solar, donde los productores distribuyen sus alimentos directamente a un mercado central, es decir, no existe la presencia de mercados regionales (Torres Torres, 2011[21]; Torres Torres y Rojas Martínez, 2016[22]).

No obstante, durante las últimas tres décadas, al amparo de las políticas de ajuste estructural y, particularmente, con la participación de grandes empresas distribuidoras de alimentos, el patrón de distribución de alimentos de México se modificó sustancialmente. En esa reconfiguración sobresale la influencia de Wal-Mart, entre cuyas innovaciones más destacadas están los Centros de Distribución (CEDIS) (Álvarez Galván y Tilly, 2006[1]; Castillo Girón et al., 2014[3]; Gasca y Torres, 2014[10]; Minei y Matusitz, 2013[17]). Con un alto contenido tecnológico, la puesta en operación de un CEDIS impactó la gestión de los inventarios de las tiendas, es decir, se implementó “una especie de justo a tiempo aplicado al comercio” (Álvarez Galván y Tilly, 2006[1], p. 947) que propició economías de escala en la cadena de abasto (Gasca y Torres, 2014[10]; Minei y Matusitz, 2013[17]).

En este nuevo patrón de distribución, llamado del comercio moderno, los CEDIS fungen como un centro de acopio para las tiendas de autoservicio, con lo que se busca eliminar a los intermediarios y generar relaciones directas con los proveedores en sus lugares de origen para abaratar costos (Castillo Girón et al., 2014[3]; Gasca y Torres, 2014[10]; Gereffi y Christian, 2009[11]; Lugo Morín, 2013[16]; Torres Torres, 2011[21]). Ello, en consecuencia, representa una transformación radical de los patrones clásicos de búsqueda de alimentos de los hogares (Atkin et al., 2018[2])1, toda vez que “el abasto y distribución de alimentos se encamina hacia una transición del patrón típico de economías abiertas y mercados globalizados, controlado por un esquema de competencia entre firmas internacionales y locales” (Torres Torres, 2011[21], p. 67).

Por tanto, derivado de todos estos cambios, actualmente pueden distinguirse cinco canales de distribución de alimentos: los mercados públicos, los mercados sobre ruedas o tianguis, los abarrotes o tiendas de la esquina, los establecimientos de las grandes cadenas de distribución y las tiendas de conveniencia. Particularmente, debido a las innovaciones logísticas, organizacionales y tecnológicas que los caracterizan (esto en el contexto mencionado) los dos últimos suelen incluirse en el denominado comercio moderno mientras que el resto constituyen el comercio tradicional (Castillo Girón et al., 2014[3]).

No obstante, a pesar de su importancia no se ha profundizado en las características de este moderno patrón de acopio y distribución de alimentos (Castillo Girón et al., 2014[3]). Los estudios que modelan los impactos de estos cambios en el contexto mexicano son escasos y comprenden diversas temáticas: el trabajo de Atkin et al. (2018[2]) analiza mediante microdatos el impacto de la llegada de cadenas globales del sector retail sobre el bienestar de los hogares, el ingreso, el empleo y el número de tiendas del sector; Varela (2011[23], 2018[24]) analiza los costos de entrada y salida a partir del arribo de Wal-Mart a la industria de supermercados; Iacovone, Javorcik, Keller, y Tybout (2015[12]) examinan el efecto de la entrada de Wal-Mart sobre los productores de bienes de consumo; Rodríguez, Chasco, y García (2014[20]) cuantifican el efecto de la entrada de Wal-Mart sobre el promedio de los salarios por hora trabajada en los municipios de México; Lagakos (2009[15]) aborda las diferencias de productividad del sector retail entre Estados Unidos y algunos países en vías de desarrollo (como México) argumentando que se explican por la existencia de un menor número de tiendas de comercio moderno dada la menor proporción de hogares con automóviles y Dove (2006[8]) mide el impacto de la entrada de Wal-Mart sobre un índice de empleo del sector retail a nivel estatal.

Puede notarse en general, que persiste la idea de que la llegada de Wal-Mart a México ha generado impactos en diversas variables, entre las que sobresale la productividad por trabajador. Lagakos (2009[15]), sugiere que una posible explicación para la alta productividad por trabajador del canal del comercio moderno en los países en desarrollo (respecto al comercio tradicional de los mismos países) puede ser que algunas de estas tiendas son operadas por cadenas europeas o norteamericanas (por ejemplo, Carrefour en Brasil o Wal-Mart en México); sin embargo, él mismo menciona que “como los datos de los censos no permiten diferenciar el estatus de propiedad doméstica (de los comercios), permanece como una cuestión abierta si la alta productividad de las tiendas modernas es liderada por los participantes extranjeros” (p. 7).

Bajo esa lógica, el presente trabajo se propone indagar acerca de la relación que existe entre la presencia de Wal-Mart y las diferencias observadas en el Censo Económico de 2014 de la productividad por trabajador del comercio al por menor mexicano.

Es un hecho que existen marcadas diferencias en la productividad por trabajador (Y/L) del sector retail en México. Si se consideran a nivel municipal los datos del Censo Económico de 2014 (INEGI, 2017[14]) para el sector número 46 “comercio al por menor” del Sistema de Clasificación Industrial de América del Norte (INEGI, 2013[13]), se puede constatar que el rango en la productividad por trabajador (véase la Figure 1)2 va de los 4.500 pesos a cerca de 350.000 pesos con una media de 70.600 pesos y una desviación estándar de 56.000 pesos.

Figure 1.

Densidad de la productividad por trabajador (Y/L) a nivel municipal (miles $)

Fuente: elaboración propia con base en el Censo Económico de 2014 (INEGI, 2017 [14] )

Además, en la Table 1 se pueden apreciar los diez municipios con mayor y menor productividad por trabajador. Destaca que la Ciudad de México tiene tres demarcaciones dentro del top ten en tanto que prácticamente todos los municipios menos productivos (nueve de los diez considerados) son del estado de Oaxaca.

Table 1.

Diez municipios con mayor y con menor productividad por trabajador (miles $)

Municipios con mayor productividad Municipios con menor productividad
Estado Municipio Y/L Estado Municipio Y/L
Coahuila Guerrero 349.98 Oaxaca San Jerónimo Sosola 4.50
CDMX Coyoacán 348.62 Puebla Totoltepec de Guerrero 4.64
CDMX Benito Juárez 342.65 Oaxaca Santa María Yolotepec 4.71
Veracruz Rafael Lucio 329.10 Oaxaca Santa Catarina Zapoquila 5.00
Nuevo León San Pedro Garza García 325.48 Oaxaca Santo Domingo Tonaltepec 5.00
Sonora Benjamín Hill 322.97 Oaxaca San Miguel Piedras 5.17
CDMX Cuajimalpa de Morelos 307.21 Oaxaca Santa María Yavesía 5.17
Oaxaca San Martín Huamelúlpam 303.33 Oaxaca Santiago Laxopa 5.18
Puebla San Andrés Cholula 302.01 Oaxaca Santa Ana Ateixtlahuaca 5.39
Quintana Roo Benito Juárez 297.84 Oaxaca Santa Catalina Quierí 5.59
Fuente: elaboración propia con base en el Censo Económico de 2014 (INEGI, 2017 [14] )

Además, si se clasifican los municipios como de baja, media o alta productividad por trabajador, es decir, si se divide el rango de dicha variable en tercios y con base en ello se les categoriza ordinalmente, se tiene que municipios de baja productividad (categoría 1) son 2.032 municipios con una productividad promedio de 50.863 pesos por trabajador, los de productividad media (categoría 2) son 353 con un promedio de 160.650 pesos, y los de alta productividad (categoría 3) son los restantes 42 con un promedio de 272.900 pesos por trabajador (véase la Table 2).

Table 2.

Estadística descriptiva de la productividad por trabajador por categorías de municipios en México (Y/L en miles de pesos)

Variable:
Y/L
N Min Max Media SD Skewness Kurtosis Jarque-
Bera
Categoría 1 2.032 0,0045 0,1193 0,0509 0,0307 0,4512 2,0665 142,7281
Categoría 2 353 0,1200 0,2339 0,1607 0,0293 0,5433 2,3158 24,2484
Categoría 3 42 0,2348 0,3500 0,2730 0,0335 0,8428 2,6845 5,1462
Total 2.427 0,0045 0,3500 0,0707 0,0561 1,4434 5,3932 1.421,9227
Fuente: elaboración propia con base en el Censo Económico de 2014 (INEGI, 2017 [14] )

Bajo este contexto, surge el interés de conocer si estas diferencias en la productividad por trabajador se deben a la presencia de Wal-Mart o de otros factores. Intuitivamente, una primera variable proxie es considerar una variable dicotómica que toma los valores de 1 y 0 cuando en un determinado municipio exista o no la presencia de dicha empresa. Sin embargo, para este trabajo se considerá como proxie de dicha presencia a los metros cuadrados de piso de venta que la minorista posee en un determinado municipio (W), lo que, desde nuestra perspectiva, no sólo permite captar la presencia sino también el nivel (la intensidad) de las operaciones que la empresa posee en el municipio en cuestión3.

De tal manera, la presencia de Wal-Mart en los municipios va de cero (es decir, no tiene sucursales) a 153.360 m2 con una media de 2.391 m2 y una desviación estándar de 10.215 m2. Si comparamos esos datos con las productividades de la Figure 1, es posible encontrar una relación positiva entre ambas variables, es decir, a mayor cantidad de metros cuadrados de piso de ventas de Wal-Mart existe, en promedio, una mayor productividad por trabajador (véase Figure 2).

Figure 2.

Relación entre los metros cuadrados de piso de venta de Wal-Mart (en miles) y la productividad por trabajador a nivel municipal (en miles de pesos)

Fuente: elaboración propia con base en el Censo Económico de 2014 (INEGI, 2017 [14] ) y la información de la página de Relación con Inversionistas de Wal-Mart (2017 [25] )

Por otro lado, si se considera esta variable (W) con relación a las tres categorías asignadas a los municipios según se mencionó anteriormente, se tiene que en municipios con una baja productividad (categoría 1) se encuentra sólo el 11,92% del piso de ventas total de Wal-Mart, en aquellos con productividad media (categoría 2) está el 67,3%, y el 20,77% restante se encuentra en municipios de alta productividad (categoría 3). La estadística descriptiva de esta variable para todos los municipios y por categoría se puede ver en la Table 3.

Table 3.

Estadística descriptiva de los metros cuadrados de piso de venta de Wal-Mart por categorías de municipios en México (W en miles)

Variable:
W
N Min Max Media SD Skewness Kurtosis Jarque-
Bera
Categoría 1 2.032 0,0000 33,1700 0,3415 1,6617 10,8695 156,4219 2.032.919,9253
Categoría 2 353 0,0000 153,3600 11,0961 20,1502 2,9274 13,7503 2.204,0231
Categoría 3 42 0,0000 119,5300 28,7793 31,5125 1,0886 3,4169 8,6002
Total 2.427 0,0000 153,3600 2,3978 10,2278 6,8605 61,3554 363.404,6148
Fuente: elaboración propia con base en la información de la página de Relación con Inversionistas de Wal-Mart (2017)

Bajo este contexto y siguiendo la idea propuesta por Lagakos (2009) se puede plantear la siguiente conjunto de hipótesis de trabajo:

Ho: la intensidad de la presencia de Wal-Mart en los municipios mexicanos impacta significativamente y de manera positiva sobre el nivel de productividad por trabajador del sector del comercio al por menor.

Ha: la intensidad de la presencia de Wal-Mart en los municipios mexicanos no tiene impacto estadísticamente significativo sobre el nivel de productividad por trabajador del sector del comercio al por menor.

3. Metodología: un modelo de probabilidad ordinal para la productividad por trabajador y presencia municipal de Wal-Mart en México

Para hacer el análisis formal de la relación entre las variables descritas en el apartado anterior y contrastar la hipótesis de trabajo, se plantea un modelo de probabilidad ordinal. Siguiendo a Escobar, Bernardi y Macías (2012[9]), se tiene que para este modelo la relación entre la variable latente y las independientes que se introduzcan, dentro de las que están los metros cuadrados de piso de ventas que Wal-Mart posee en un determinado municipio (W), está dada por la siguiente ecuación:

\(y^*_i = x_i\beta+e_i\)

En la expresión anterior, los puntos de corte de la variable dependiente ordinal observada están expresados por la siguiente relación:

\(y^*_i = m\:\:si\:\:\mu_{m-1}\leqslant y^*_i\leqslant \mu_m\)

La relación anterior correspondiente al planteamiento del apartado anterior en la descripción de las Tablas 2 y 3, es decir, un caso con tres categorías de la variable ordinal y dos puntos de corte es:

\(y_i = \left\{\begin{matrix}1\:(baja\:productividad) & si\:\:-\infty< y^*_i\leqslant\mu_1 \\2\:\:(productividad\:media) & si\:\:\mu_1< y^*_i\leqslant \mu_2 \\3\:\:(alta\:productividad) & si\:\:\mu_2< y^*_i\leqslant \infty\end{matrix}\right.\)

Si se hace referencia a un modelo logit ordinal, la probabilidad predicha esta dada por:

\(\Pr(y=m|x)=\Pr(\varepsilon<\mu_m-x\beta)-(\varepsilon\leqslant\mu_{m-1}-x\beta)\)

Modelo en el que el término de error tiene una media de cero y una varianza de \(\pi^2/3\)

Es de mencionar que en el modelo logit ordinal, cada categoría de la variable dependiente se puede transformar en un cociente de razones, dividiendo la probabilidad de obtener esa categoría o una inferior entre la probabilidad de obtener una categoría mayor, lo que lleva a la siguiente ecuación:

\(\Omega_{\leqslant{m|>m}}(x)=\frac{\Pr(y\leqslant{m|x})}{\Pr(y>m|x)}\)

Que puede derivar, si le aplicamos logaritmo natural, en:

\(\ln(\Omega_{\leqslant{m|>m}}(x))=\mu_m-x\beta\)

Es sobre esta variable dependiente, el logaritmo natural de una razón de probabilidades, que se hace la estimación del modelo logístico ordinal, motivo por el que la interpretación de los coeficentes es mucho más complicada que la de la regresión lineal, en otras palabras, los coeficientes de la regresión logística no expresan de manera directa la relación de la variable independiente y la dependiente; no se trata de un modelo lineal en su planteamiento base (Escobar et al., 2012[9]; Wooldridge, 2009[26]). Para realizar la interpretación hay dos formas elementales: eliminando los logaritmos de la ecuación logística original de tal modo que la ecuación se exprese en razones; o, transformando la ecuación para que exprese directamente las probabilidades de ocurrencia del suceso estudiado (Escobar et al., 2012[9])4.

4. Resultados: Estimaciones del modelo de probabilidad ordinal y análisis

El modelo de probabilidad logística ordinal con tres categorías para la variable latente según se planteó anteriormente, cuenta con un vector x de variables explicativas que está compuesto por la variable independiente W, los m2 de piso de ventas que Wal-Mart posee en un determinado municipio, además de un set de variables de control dentro de las que se consideran:

  1. Variables del sector en estudio: el origen de estas variables es el Censo Económico 2014 del INEGI (2017[14]). Se consideran: el personal ocupado total (variable H001A del censo), el acervo total de activos fijos (variable Q000A del censo) y el salario promedio por trabajador (S_prom), o sea, las remuneraciones totales (variable J000A del censo) entre el total del personal ocupado total (variable H001A del censo). El origen de estas variables es el planteamiento de la función de producción de tipo Cobb-Douglas cuyas variables independientes típicas son Capital y Tabajo y lo planteado por Rodríguez et al. (2014[20]) en su trabajo.
  2. Variables de ubicación de los municipios: el origen de estás variables es el marco geoestadístico nacional (INEGI, 2017[14]) y son las mismas que Rodríguez et al. (2014[20]) plantean en su trabajo. Se incluyen la latitud (Lat) y longitud (Long) de la cabecera municipal, así como la distancia (Dist) en Km que hay de cada cabecera municipal a la delegación Azcapotzalco que es en donde se encuentra la dirección fiscal de Wal-Mart (véase Wal-Mart, 2017[25])5.
  3. De acceso al sistema financiero: el origen de estás variables es la Base de Datos de Inclusión Financiera que publica la Comisión Nacional de Seguros y Fianzas (CNSF, 2018[4]). En este caso se utilizó el reporte de diciembre de 2013, último del año previo al Censo Económico de 20146, y se utilizan el número total de sucursales de la banca comercial (Sucursales), el total de cajeros automáticos (Cajeros) y el número de establecimientos con terminal punto de venta (TPV). Se consideró importante incluirlas dado que una mejora asociada con el tercer patrón de distribución de alimentos fueron las referentes a la tecnología y la organización (Álvarez Galván y Tilly, 2006[1]; Gasca y Torres, 2014[10]; Minei y Matusitz, 2013[17]).
  4. Variables de las características socioeconómicas de la población: la desición de incluir este tipo de variables es con base en el trabajo de Rodríguez et al. (2014[20]) que incluye en su estudio un set de 11 variables de este tipo. Es así que en este trabajo se parte de la disponibilidad de información a nivel municipal por lo que en principio se utiliza el número de habitantes del municipio (Pob); esta variable se obtuvo directamente de la CONAPO (2017[5]) y corresponde al año 2010. Un segundo grupo de variables hace relación a la medición de la pobreza en los distintos municipios, dentro de los componentes o dimensiones que se utilizan están:
    • El coeficiente de Gini (Gini), que es parte de los indicadores para medir el grado de cohesión social y mide el nivel de concentración que existe en la distribución de los ingresos entre la población.
    • Una serie de medidas de incidencia que refieren el porcentaje de la población que padece algún tipo de carencia económica o social como: la carencia por rezago educativo (r_educ), por acceso a los servicios de salud (r_salud), por acceso a la seguridad social (r_segs), por calidad y espacios de vivienda (r_viv), por acceso a la alimentación (r_alim) y; el porcentaje de la población con ingreso inferior a la línea de bienestar (l_bien).

Estas variables se tomaron del CONEVAL (2018[7]) y una definición amplia de las mismas se puede obtener a partir de la publicación que el mismo CONEVAL hace con respecto a la metodología para la medición de la pobreza en México (CONEVAL, 2014[6]). Hay que apuntar que se consideraron las variables relativas a 2010, es decir, se buscó el indicador disponible previo al censo económico de 2014, lo que aun así es pertinente ya que sólo se trata de aproximar con ellas las condiciones socioeconómicas de los municipios.

Por lo que respecta a la estadística descriptiva de las variables, además de la presentada en las Table 2 y Table 3 para las variables dependiente e independiente respectivamente, se presenta la Table 4 que incluye el análisis para las variables de control. Nótese que el número de municipios del que se cuenta con información, varía de 2.427 a 2.433 toda vez que en la recolección de la información, ésta no se encontró para todas las variables y todos los municipios del país a la vez. Por tanto, el número total de municipios para los que se cuenta con información de todas las variables es de 2.422, lo que representa el 98,34% de los 2.463 municipios que el INEGI considera actualmente en su marco geoestadístico (INEGI, 2017[14])7.

Table 4.

Estadística descriptiva de las variables de control

Variable N Min Max Media SD Skewness Kurtosis Jarque-
Bera
H001A 2.433 6,0000 240.828,0000 4.194,6910 15.337,8800 7,8733 82,3903 664.084,8559
Q000A 2.433 0,0000 37.549,2900 466,2518 1.997,1470 8,4150 97,8281 940.315,6837
S_Prom 2.433 0,0000 0,0790 0,0081 0,0082 1,5516 7,2614 2.817,0914
Lat 2.433 14,6795 32,6412 20,0467 3,3394 1,4385 4,8542 1.187,5837
Long 2.433 -117,0545 -86,7461 -98,7703 4,3714 -0,3794 4,3929 255,0547
Dist 2.433 0,0000 2.292,6050 457,5767 372,9575 1,5365 5,4086 1.545,4150
Sucursales 2.433 0,0000 385,0000 5,3818 22,9595 8,4779 95,0952 888.959,8767
Cajeros 2.433 0,0000 1.265,0000 17,0440 79,3617 8,1583 85,9268 724.131,2657
TPV 2.433 0,0000 19.657,0000 196,6556 1.121,2340 10,0267 126,4964 1.586.873,6098
Pob 2.433 0,0940 1.836,5820 46,9436 135,7163 7,1096 66,4665 428.834,8294
Gini 2.430 0,3072 0,5908 0,4125 0,0389 0,6319 3,7512 218,8331
r_educ 2.432 2,6315 65,3795 31,3876 10,6544 0,0713 2,5421 23,3122
r_salud 2.432 1,2483 98,2301 34,5768 18,3252 1,0624 4,0968 579,3960
r_segs 2.432 3,3287 98,6825 75,5408 15,6260 -1,0445 3,6838 489,5927
r_viv 2.430 1,1173 85,5342 25,5988 16,5752 0,8159 3,1467 271,7992
r_alim 2.430 1,5900 99,2662 30,3299 18,1974 0,9974 3,7652 462,2140
l_bien 2.432 4,1513 99,3980 69,9651 18,0704 -0,4748 2,6132 106,5419
Fuente: elaboración propia con base en los datos recabados

En la Table 5 se presentan los resultados de las estimaciones del modelo de probabilidad ordinal planteado. Las estimaciones se hicieron mediante el software Stata 14 y en ellas se utilizaron errores robustos a la heteroscedasticidad. Nótese que se plantea un primer modelo sin restricciones, es decir, tal cual se planteo con todas las variables de control. Sin embargo, en este primer modelo no todas las variables son estadísticamente significativas en lo individual por lo que estas se fueron eliminando una a una hasta obtener una significancia de todas las variables de cuando menos el 90% de confianza. Para verificar la pertinencia de lo realizado se hicieron los siguientes análisis:

  1. En ambos modelos la prueba de no significancia conjunta de todas las variables (prueba de Wald Chi2 en la ) se rechazó con un nivel de significancia del 99%, es decir, en ambos modelos al menos una variable independiente es estadísticamente significativa.
  2. De acuerdo con Escobar et al. (2012[9]) el Criterio de Información Bayesiana (Bayesian information Criterion, BIC en la ) es una medida útil para comparar entre dos modelos logísticos. En el caso del no restringido, BICNR=1381,339, en tanto que para el restringido, BICN=1338,057, según se puede ver en la tabla de las estimaciones. Si se calcula la diferencia entre ambos estadísticos (BICNR- BICR) se llega a un valor de 43,282 lo cual ofrece un fuerte soporte de que el modelo restringido es mejor.
  3. Se contrastó la prueba de razón de verosimilitudes (LR Test Chi2 en la tabla) planteada por Wooldridge (2009[26]) que contrasta la Ho. de que el modelo restringido es mejor. El resultado del estadístico es de 3,470 por lo que no es posible rechazar la Ho con al menos un 95% de confianza, es decir, las variables eliminadas del primer modelo no son estadísticamente distintas de cero.

Table 5.

Resultados de las estimaciones del modelo de probabilidad ordinal, sin restringir (modelo 1) y restringido (modelo 2)

Variable Modelo 1 (sin restringir) Modelo 2 (restringido)
Coef. P>|z| e^b e^bStdX Coef. P>|z| e^b e^bStdX
W 0,055*** 0,003 1,057 1,764 0,054*** 0,000 1,056 1,744
H001A 0,00005*** 0,003 1,000 0,462 0,0001*** 0,000 1,000 0,412
Q000A 0,000 0,325 1,000 1,272
S_Prom 159,650*** 0,000 2,20E+69 3,687 161,432*** 0,000 1,30E+70 3,741
Lat 0,046 0,310 1,047 1,165
Long 0,047** 0,041 1,048 1,227 0,032* 0,071 1,032 1,149
Dist 0,001** 0,016 1,001 1,275 0,001*** 0,000 1,001 1,394
Sucursales 0,039** 0,031 1,040 2,480 0,044*** 0,001 1,045 2,778
Cajeros -0,001 0,772 0,999 0,914
TPV 0,0003* 0,062 1,000 0,700 0,0003* 0,052 1,000 0,732
Pob -0,001 0,596 0,999 0,889
Gini 5,506** 0,011 246,072 1,237 4,959** 0,016 142,512 1,211
r_educ -0,046*** 0.001 0,955 0,615 -0,047*** 0,000 0,954 0,608
r_salud -0,004 0,571 0,996 0,934
r_segs -0,009 0,173 0,991 0,866 -0,011* 0,099 0,989 0,842
r_viv -0,002 0,864 0,998 0,975
r_alim 0,009 0,119 1,009 1,187 0,010* 0,064 1,010 1,209
l_bien -0,031*** 0,000 0,969 0,569 -0,033*** 0,000 0,968 0,555
\cut 1 -1,112 -0,742
\cut 2 3,846 4,212
N 2.422,000 2.422,000
Log pseudolikeliehood -612,746 -614,482
Pseudo R 2 0,490 0,489
Count R 2 0,910 0,908
Count R 2 (Adjusted) 0,440 0,430
Wald chi 2 457,850*** 439,360***
Prob>chi 2 Wald 0,000 0.000
BIC 1.381,339 1.338,057
LR Test Chi 2 3,470
Prob>chi 2 LR Test 0,748
P-Values entre paréntesis: * Sig. Al 90% de conf.; ** Sig. Al 95% de conf.; *** Sig al 99% de conf.
Pruebas de Hipótesis:
Wald Chi 2 . Prueba de significancia conjunta. Asume la Ho. de que todas las variables independientes conjuntamente son iguales a cero.
LR Test Chi 2 . Prueba para contrastar un modelo son restricciones de un modelo restringido. Asume la Ho. en la que se prefiere el modelo restringido sobre el modelo no restringido, es decir, estadísticamente las variables omitidas no son distintas de cero.

Por lo tanto, se tiene para este trabajo como preferido el modelo restringido cuyos valores de bondad de ajuste son: -614,482 de Log pseudolikeliehood8; un pseudo-R2 (la medida de ajuste del modelo) de 48,9%; un porcentaje de casos en que la predicción derivada del modelo de regresión logística ordinal acierta (Count-R2) de 90,8%; y un 43.0% de capacidad de prediccón si sólo se consideran los aciertos del modelo con respecto a aquellos que se tendrían simplemente prediciendo para todos los casos el valor más común, (Count-R2, Adjusted). Es con base en este modelo que se hará el análisis e interpretación de los resultados.

Según se ha dicho, interpretar los coeficientes asociados a cada unas de las variables de un modelo logístico ordinal puede ser muy complicado. De los coeficientes estimados lo que en primera instancia se puede asegurar es que el impacto sobre el logaritmo de la razón de probabilidades es negativo para el caso de las variables que hacen referencia a la carencia educativa (r_educ), la carencia de seguridad social (r_segs) y la que considera el porcentaje de la población con ingreso inferior a la línea de bienestar (l_bien).

Hacer comparaciones entre la magnitud de los coeficientes directamente es complicado. Una forma es eliminar los logaritmos de la ecuación logística original de tal modo que la ecuación se exprese en razones. Esto se hace en la columna e^b de la Table 5 que expresa cuanto varia la razón de ocurrencia del suceso en función del cambio unitario de las variables independientes. En este caso la variable que posee el mayor impacto es el salario promedio por trabajador del sector (Coef. Odds Ratio = 1,30E+70) , en tanto que la que menos impacta es la carencia educativa (Coef. Odds Ratio = 0,954). Por su parte la variable W impacta en 1,056 a la razón de probabilidades por cada 1000 m2 de incremento en el piso de venta de un municipio.

No obstante, esta forma de comparar los coeficientes tiene una limitante: no considera el rango de variación de las variables independientes. Para superar este problema se analizará cuánto impacta el cambio de una desviación estandar la razón de ocurrencia del suceso, columna e^bStdX. Bajo este enfoque la variable con mayor impacto es el salario promedio por trabajador (S_Prom), seguida del número de sucursales de la banca comercial en el municipio (Sucursales) y en tercer lugar tenemos a la variable de interés de este trabajo, W, con un impacto de 1,774 por cada desviación estándar de incremento. Recuérdese de la Tabla 3 que la desviación estándar de W es 10,2278, por que un incremento de alrededor de 10.200 m2 incrementará la razón de probabilidades en 1,77 veces.

Por otro lado, una segunda forma de interpretar los resultados del modelo estimado es transformando la ecuación para que exprese directamente las probabilidades de ocurrencia del suceso estudiado. Para ello se estimaron las probabilidades de observar cada una de las categorías de la variable latente dado un determinado número de metros cuadrados de la variable W, que para el caso de este análisis se considero a cada 1000 m2 en el intervalo de cero a 160.000 m2. No obstante, lo arbitrario de este ejercicio es definir los valores de las demás variables dado que las probabilidades de cada categoría están asociadas a todas las variables en conjunto y no sólo a la variable W.

Un primer ejercicio para esta forma de interpretar los datos se puede apreciar en la Figure 3. Cada una de estas imágenes presenta en el eje X los valores de W según lo descrito en el párrafo anterior y en el eje Y las probabilidades de observar cada categoría: en azul la categoría 1, en negro la categoría 2 y en rojo la categoría 3. La diferencia entre las cuatro gráficas está en los valores que se consideran para el resto de las variables: en la imagen a) se utilizaron todas las variables en su valor mínimo; en la b) en sus valores promedio; en la c) en sus valores medianos; y en la d) en sus valores máximos.

Figure 3.

Cálculo de las probabilidades con valores mínimos, medios, medianos y máximos para las variables del modelo

Fuente: elaboración propia con base en los datos recabados

No obstante las diferencias, lo importante de estas imágenes es observar la evolución de la probabilidad de observar cada una de las categorías. Es posible apreciar, en las tres primeras imágenes, que cuando el valor de W es cero, la probabilidad de observar la primera categoría es mayor que la de las otras dos; a medida que W aumenta, esta categoría se vuelve menos probable, incluso hasta niveles cercanos a cero. Por lo que respecta a la categoría número dos, en las mismas tres imágenes ésta describe la forma de una U-invertida, incrementa, llega a un máximo máximo y decrece dejando a la categoría tres como las más probable de ser observada, esto en niveles altos de W. Por lo tanto, a medida que incrementa W, la probabilidad de observar un mayor nivel de productividad por trabajador incrementa.

Por lo que respecta a la imágen d), ésta tiene un comportamiento un tanto diferente al de las otras tres. Desde un inicio, la probabilidad de observar la primera y segunda categorías tiende a cero por lo que existe un total predominio de la categoría tres, es decir, en este caso prácticamente desde valores bajos de W se observará una alta productividad por trabajador (Table 6).

Table 6.

Valores de las variables de los municipios seleccionados

Municipio San Baltazar Loxitla Acayucan San Nicolás de los Garza
Estado Oaxaca Veracruz Nuevo León
Categoría 1 2 3
Y/L 0,045 0,156 0,268
W 0,000 0,000 44,990
H001A 286,000 8.132,000 48.124,000
S_Prom 0,001 0,023 0,030
Long -96,790 -94,914 -100,290
Dist 456,279 481,164 706,673
Sucursales 0,000 14,000 104,000
TPV 0,000 288,000 2.929,000
Gini 0,339 0,431 0,410
r_educ 42,275 27,685 8,231
r_segs 42,060 74,154 33,323
r_alim 16,223 36,626 5,993
l_bien 88,400 73,524 13,999
Fuente: elaboración propia con base en los datos recabados

A pesar de lo dicho, y considerando que la selección de las variables de control del modelo pudiera diferir un tanto de la realidad observada, se hizo un segundo ejercicio en el que para determinar dichas variables se utilizaron los valores del municipio que posee la productividad mediana de cada categoría. Los municipios que cumplen con esto son respectivamente de la categoría uno a la tres: San Baltazar Loxitla en Oaxaca, Acayucan en Veracruz y San Nicolás de los Garza en Nuevo León. Los valores observados para cada una de las variables se presentan en la Table 6.

El cálculo de las probabilidades con las características de los municipios seleccionados se puede ver en la Figure 4. El comportamiento de las probabilidades de los municipios de los incisos a) y b) de la gráfica (San Baltazar Loxitla y Acayucan, respectivamente) es parecido al descrito para los incisos a), b) y c) de la Gráfica 3, en tanto que para el caso del inciso c) de la gráfica en estudio (el municipio de San Nicolás de los Garza) el comportamiento de las probabilidades es semejante al presentado para el inciso d) de la Gráfica 3. Sólo resta decir que en términos generales, a mayor cantidad de m2 es posible observar una categoría de mayor productividad por trabajador respectivamente.

Figure 4.

Cálculo de las probabilidades con valores de los municipios seleccionados para las variables del modelo

Fuente: elaboración propia con base en los datos recabados

5. Conclusiones

En este trabajo se análiza el impacto de Wal-Mart sobre la probabilidad de observar un nivel superior de productividad por trabajador a nivel municipal. Los resultados muestran un impacto positivo y estadísticamente significativo en los coeficientes estimados del modelo de probabilidad ordinal. Esta relación, también es posible constatarla con base en lo mostrado por los diversos escenarios de probabilidad descritos en el análisis subsecuente. Por consiguiente, no es posible rechazar la hipótesis nula de trabajo planteada.

Este hallazgo es congruente con el planteamiento de Lagakos (2009[15]) ya que, en un país en vías de desarrollo como México, la alta productividad por trabajador del canal del comercio moderno estaría ligada a la operación de tiendas extranjeras, en este caso de Wal-Mart, empresa de origen norteamericano. Y nótese que la explicación a este fenómeno se debería, según lo planteado en la revisión de la literatura, a la generación de economías de escala cuyo origen serían las mejoras en tecnología y organización, innovación (con los CEDIS como principal estrategia), uso de una red global de proveedores y financiamiento que Wal-Mart introdujo en el país, aspectos que enfatizan principalmente Álvarez Galván y Tilly (2006[1]), Gasca y Torres (2014[10]), Minei y Matusitz (2013[17]) y Moreno Lázaro (2012[18]).

Por otro lado, si bien se abona al análisis incipiente sobre el comercio al por menor, de amplia importancia y poco estudiado (Castillo Girón, et al., 2014[3]), en futuros trabajos se deberían verificar diversos aspectos en tres sentidos: en primer lugar, con relación a una función de producción neoclásica, como la Cobb-Douglas, sería pertinente hablar de los impactos de Wal-Mart sobre las elasticidades de los factores de producción, capital y trabajo, o sobre como contribuye a la eficiencia del sector; en segundo lugar, no sólo se debería quedar el análisis a nivel de la producción del sector, es posible llevar el análisis a otras variables relacionadas con la cadena de abasto como la seguridad alimentaria, estrechamente relacionada con el nivel de pobreza; y, en tercer lugar, puesto que el modelo contrastado es de corte transversal, se sugiere también incorporar la temporalidad en los análisis a fin analizar cómo han sido en el tiempo los impactos de la evolución de la presencia territorial de la empresa en el país.

______________________________

1 Destaca que recientemente han emergido algunas manifestaciones que podrían derivar en un nuevo patrón de distribución de alimentos ligado al comercio electrónico. Esta nueva expresión cuya base es la tecnología, tiende a simplificar más aún la cadena de abasto con relación al número de intermediarios que se requieren para que los productos lleguen al consumidor final. Aunque con altas expectativas de crecimiento en México, aún existe la incógnita respecto a si las grandes cadenas minoristas serán actores principales en él en un futuro (Torres Torres y Rojas Martínez, 2016[22]).

2 La productividad por trabajador (Y/L) corresponde al cociente de la producción bruta total (variable A111A del censo) sobre el personal ocupado total (variable H001A del censo).

3 Para determinar los m2 de piso de ventas de Wal-Mart, primero se ubicó el número de tiendas por formato (Wal-Mart, Bodegas Aurrerá, Superama, Sam´s Club y Suburbia) en cada municipio, esto con base en el directorio publicado por la empresa en sus diversos sitios web. Después, se calculó el piso de venta total con base en los metros cuadrados promedio que la misma empresa tiene pública en su página de relación con inversionistas (véase Wal-Mart, 2017[25]).

4 Otra forma de analizar e interpretar un modelo logístico es estudiando el efecto parcial en el promedio (EPeP) y el efecto parcial promedio (EPP) (Wooldridge, 2009[26]), sin embargo, el análisis de este trabajo se centrará en los dos mencionados.

5 Para el cálculo de dicha distancia se utilizó la fórmula de Haversine para calcular la distancia entre dos puntos geográficos.

6 Nótese que el Censo Económico de 2014 capta información correspondiente al periodo del 1 de enero de 2013 y el 31 de diciembre del mismo año (INEGI, 2017[14]).

7 La falta de información se debe a que hay municipios de nueva creación y por lo tanto la variable no fue calculada para el año observado; o simplemente porque en la descarga de la información la variable no fue proporcionada para algunos municipios por la dependencia responsable de los datos.

8 Se utiliza el Log pseudolikeliehood en ves del Log likelihood ya que se utilizaron errores robustos a la heteroscedasticidad.