Miguel Farah F.
2009-06-02 22:45:45 UTC
Como sabrán, tengo en mi sitio web un documento que lista los feriados
vigentes e históricos en Chile ( http://www.farah.cl/Feriados/ ).
Publiqué la primera versión el 19 de octubre de 2008, y he ido agregando
todo lo que he encontrado, que no es poco.
Este documento ha resultado ser un éxito desproporcionado (al menos
comparado con lo que estaba acostumbrado a ver en mi sitio web), y quise
hacer un análisis del tráfico que recibo mensualmente. Para ello, saqué
los logs de acceso desde octubre/2008 hasta mayo/2009 inclusive, filtré
solamente lo que correspondía a las páginas sobre feriados y obtuve
estadígrafos interesantes, que ahora comparto con todos.
TABLA 1: ARCHIVOS HTML
0810 0811 0812 0901 0902 0903 0904 0905 total creación
index.html 311 1279 4454 3925 3765 7156 5065 4347 30302 19/10/2008
1990-2000.html - 36 38 6 3 2 2 - 87 19/11/2008 [1]
anexos.html - - 195 50 50 240 275 325 1135 05/12/2008
FechasMoviles.zip - - 9 1 2 2 2 3 19 05/12/2008
1981-1990.html - - 23 41 34 59 60 65 282 18/12/2008
1991-2000.html - - 23 48 40 64 43 57 275 18/12/2008
2001-2010.html - 170 1046 1133 1403 3757 2745 2227 12481 18/12/2008
2011-2020.html - 19 55 57 263 91 76 86 647 18/12/2008
2021-2030.html - 16 28 28 23 34 24 38 191 18/12/2008
2031-2040.html - 15 28 30 26 35 17 25 176 18/12/2008
2041-2050.html - 14 30 26 23 34 18 31 176 18/12/2008
2051-2060.html - 15 35 31 25 28 19 25 178 18/12/2008
2061-2070.html - 14 33 25 21 26 15 24 158 18/12/2008
2071-2080.html - 15 31 30 28 30 12 25 171 18/12/2008
2081-2090.html - 17 36 32 24 27 16 27 179 18/12/2008
2091-2100.html - 18 49 48 62 140 92 90 499 18/12/2008
DiasNacionales.html - - - - - 187 181 204 572 06/03/2009
TOTAL PARA EL MES 311 1628 6113 5511 5792 11912 8662 7599
[1] Archivo eliminado el 18/12/2008 - lo reemplacé con los otros que
cubren una década cada uno.
Obviando los archivos *.png, *.css y *.ico, los archivos HTML (y un
.zip) contenidos en el directorio /Feriados/ son los indicados en la
tabla anterior. Como se puede ver, la cantidad de hits inicial era
paupérrima, pero después de un mes y medio (a partir de diciembre) puede
hablarse de un régimen permanente de tráfico. Es inmediato que las
páginas más requeridas son, por lejos, el índice y la página que
contiene el listado simple de feriados del año en curso. El resto de las
páginas tiene un tráfico marginal en comparación (entre todas llegan a
4726 hits, apenas un poco más de un tercio que los hits de
2001-2010.html).
Evidentemente, es esperable que la cantidad de hits a la página
2011-2020.html empiece a subir el año que viene, y el subsiguiente
reemplace a 2001-2010.html en el segundo lugar de la tabla.
Llama la atención la poca cantidad de hits de DiasNacionales.html, aun
cuando contiene mucha información y requirió incluso más trabajo de
recopilación que la lista de feriados (en index.html).
También llama la atención que hubo hits a 1990-2000.html durante enero a
abril de 2009, a pesar de que la página había desaparecido.
Una revisión de los hits *diarios* (que no se muestra en este análisis)
deja en evidencia que aumentan significativamente en los dos días
inmediatamente anteriores a un feriado, y más aún en aquellos cuya fecha
no es fácil de calcular (el tráfico de marzo fue casi el doble que el de
febrero, lo que se explica por las consultas acerca del Viernes Santo).
Bueno... ¿y cómo sabe la gente que tiene que mirar esta página?
Las siguientes tablas detallan los "referers", aglutinados por mes (y
por tipos).
TABLA 2a: REFERERS
0810 0811 0812 0901 0902 0903 0904 0905
(sin referer) 185 594 1235 1045 692 1493 1076 1671
www.farah.cl 10 258 1414 1360 1879 4507 3459 2608
Esta tabla indica la cantidad de:
- Hits mensuales en que NO había referer (esto puede ocurrir porque el
usuario escribió el URL a mano, porque recurrió a un bookmark... o
porque el agente no declaró el referer).
- Hits en que el referer era el mismo sitio web, lo que indica que el
usuario navegó por el sitio de una página a otra.
Descontando estas cifras, los porcentajes de acceso por conjuntos de
dominios son:
TABLA 2b: REFERERS AGLUTINADOS
0810 0811 0812 0901 0902 0903 0904 0905
Usenet por web 25,9% 2,2% 0,1% 0,0% 0,2% 0,0% 0,1% 0,9%
misceláneos 58,6% 11,2% 2,7% 1,8% 1,5% 2,8% 4,4% 6,1%
buscadores [2] 7,8% 4,3% 3,1% 1,4% 1,7% 2,0% 2,3% 3,3%
Yahoo! 5,2% 0,8% 0,5% 0,2% 0,3% 0,5% 1,3% 1,0%
google.com 0,9% 3,1% 3,7% 6,3% 6,1% 6,8% 4,9% 4,8%
Google Chile 1,7% 76,2% 85,2% 84,6% 85,1% 82,3% 81,4% 75,3%
Google * [3] 0,0% 2,3% 4,7% 5,7% 5,1% 5,5% 5,6% 8,5%
[2] Todos los buscadores excepto Yahoo! y Google (altavista.com,
answers.com, babylon.com, beedly.us, conduit.com, emol.com,
live.com, msn.com y terra.cl).
[3] Google para todos los países excepto Chile (Argentina, España,
Finlandia, Reino Unido, Uruguay, etcétera).
Es inmediato ver que Google tiene el dominio absoluto (más del 90% del
total de referers externos). Todos los demás buscadores *juntos*
(incluyendo a Yahoo!) son incapaces de superar ni siquiera a las
versiones extranjeras de Google.
El porcentaje para el mes de octubre de Yahoo! supera al de Google. Esto
se explica porque Yahoo! indexó inicialmente la página index.html mucho
antes que Google lo hiciera. Una vez que Google se puso al día (en los
últimos días de dicho mes), estableció su dominio inmediatamente: en
noviembre ya tiene más del 80% del total.
La categoría "Usenet por web" consiste casi solamente en groups.google.*.
El alto porcentaje en octubre se debe al anuncio en chile.soc.consumidor
de la publicación de la página. Otras discusiones en el mismo grupo
llevan a los aumentos en febrero y mayo (si bien ahora están eclipsados
por Google).
Finalmente, en la categoría misceláneos está presente la página
http://jms.caos.cl/cal/ , que contiene desde octubre un link al
documento de feriados, y que dio buena parte de los hits externos en
dicho mes. Si bien ahora los accesos desde Google lo eclipsan, este
tráfico se ha mantenido.
Cuando tenga tiempo, haré un análisis de los agentes utilizados.
vigentes e históricos en Chile ( http://www.farah.cl/Feriados/ ).
Publiqué la primera versión el 19 de octubre de 2008, y he ido agregando
todo lo que he encontrado, que no es poco.
Este documento ha resultado ser un éxito desproporcionado (al menos
comparado con lo que estaba acostumbrado a ver en mi sitio web), y quise
hacer un análisis del tráfico que recibo mensualmente. Para ello, saqué
los logs de acceso desde octubre/2008 hasta mayo/2009 inclusive, filtré
solamente lo que correspondía a las páginas sobre feriados y obtuve
estadígrafos interesantes, que ahora comparto con todos.
TABLA 1: ARCHIVOS HTML
0810 0811 0812 0901 0902 0903 0904 0905 total creación
index.html 311 1279 4454 3925 3765 7156 5065 4347 30302 19/10/2008
1990-2000.html - 36 38 6 3 2 2 - 87 19/11/2008 [1]
anexos.html - - 195 50 50 240 275 325 1135 05/12/2008
FechasMoviles.zip - - 9 1 2 2 2 3 19 05/12/2008
1981-1990.html - - 23 41 34 59 60 65 282 18/12/2008
1991-2000.html - - 23 48 40 64 43 57 275 18/12/2008
2001-2010.html - 170 1046 1133 1403 3757 2745 2227 12481 18/12/2008
2011-2020.html - 19 55 57 263 91 76 86 647 18/12/2008
2021-2030.html - 16 28 28 23 34 24 38 191 18/12/2008
2031-2040.html - 15 28 30 26 35 17 25 176 18/12/2008
2041-2050.html - 14 30 26 23 34 18 31 176 18/12/2008
2051-2060.html - 15 35 31 25 28 19 25 178 18/12/2008
2061-2070.html - 14 33 25 21 26 15 24 158 18/12/2008
2071-2080.html - 15 31 30 28 30 12 25 171 18/12/2008
2081-2090.html - 17 36 32 24 27 16 27 179 18/12/2008
2091-2100.html - 18 49 48 62 140 92 90 499 18/12/2008
DiasNacionales.html - - - - - 187 181 204 572 06/03/2009
TOTAL PARA EL MES 311 1628 6113 5511 5792 11912 8662 7599
[1] Archivo eliminado el 18/12/2008 - lo reemplacé con los otros que
cubren una década cada uno.
Obviando los archivos *.png, *.css y *.ico, los archivos HTML (y un
.zip) contenidos en el directorio /Feriados/ son los indicados en la
tabla anterior. Como se puede ver, la cantidad de hits inicial era
paupérrima, pero después de un mes y medio (a partir de diciembre) puede
hablarse de un régimen permanente de tráfico. Es inmediato que las
páginas más requeridas son, por lejos, el índice y la página que
contiene el listado simple de feriados del año en curso. El resto de las
páginas tiene un tráfico marginal en comparación (entre todas llegan a
4726 hits, apenas un poco más de un tercio que los hits de
2001-2010.html).
Evidentemente, es esperable que la cantidad de hits a la página
2011-2020.html empiece a subir el año que viene, y el subsiguiente
reemplace a 2001-2010.html en el segundo lugar de la tabla.
Llama la atención la poca cantidad de hits de DiasNacionales.html, aun
cuando contiene mucha información y requirió incluso más trabajo de
recopilación que la lista de feriados (en index.html).
También llama la atención que hubo hits a 1990-2000.html durante enero a
abril de 2009, a pesar de que la página había desaparecido.
Una revisión de los hits *diarios* (que no se muestra en este análisis)
deja en evidencia que aumentan significativamente en los dos días
inmediatamente anteriores a un feriado, y más aún en aquellos cuya fecha
no es fácil de calcular (el tráfico de marzo fue casi el doble que el de
febrero, lo que se explica por las consultas acerca del Viernes Santo).
Bueno... ¿y cómo sabe la gente que tiene que mirar esta página?
Las siguientes tablas detallan los "referers", aglutinados por mes (y
por tipos).
TABLA 2a: REFERERS
0810 0811 0812 0901 0902 0903 0904 0905
(sin referer) 185 594 1235 1045 692 1493 1076 1671
www.farah.cl 10 258 1414 1360 1879 4507 3459 2608
Esta tabla indica la cantidad de:
- Hits mensuales en que NO había referer (esto puede ocurrir porque el
usuario escribió el URL a mano, porque recurrió a un bookmark... o
porque el agente no declaró el referer).
- Hits en que el referer era el mismo sitio web, lo que indica que el
usuario navegó por el sitio de una página a otra.
Descontando estas cifras, los porcentajes de acceso por conjuntos de
dominios son:
TABLA 2b: REFERERS AGLUTINADOS
0810 0811 0812 0901 0902 0903 0904 0905
Usenet por web 25,9% 2,2% 0,1% 0,0% 0,2% 0,0% 0,1% 0,9%
misceláneos 58,6% 11,2% 2,7% 1,8% 1,5% 2,8% 4,4% 6,1%
buscadores [2] 7,8% 4,3% 3,1% 1,4% 1,7% 2,0% 2,3% 3,3%
Yahoo! 5,2% 0,8% 0,5% 0,2% 0,3% 0,5% 1,3% 1,0%
google.com 0,9% 3,1% 3,7% 6,3% 6,1% 6,8% 4,9% 4,8%
Google Chile 1,7% 76,2% 85,2% 84,6% 85,1% 82,3% 81,4% 75,3%
Google * [3] 0,0% 2,3% 4,7% 5,7% 5,1% 5,5% 5,6% 8,5%
[2] Todos los buscadores excepto Yahoo! y Google (altavista.com,
answers.com, babylon.com, beedly.us, conduit.com, emol.com,
live.com, msn.com y terra.cl).
[3] Google para todos los países excepto Chile (Argentina, España,
Finlandia, Reino Unido, Uruguay, etcétera).
Es inmediato ver que Google tiene el dominio absoluto (más del 90% del
total de referers externos). Todos los demás buscadores *juntos*
(incluyendo a Yahoo!) son incapaces de superar ni siquiera a las
versiones extranjeras de Google.
El porcentaje para el mes de octubre de Yahoo! supera al de Google. Esto
se explica porque Yahoo! indexó inicialmente la página index.html mucho
antes que Google lo hiciera. Una vez que Google se puso al día (en los
últimos días de dicho mes), estableció su dominio inmediatamente: en
noviembre ya tiene más del 80% del total.
La categoría "Usenet por web" consiste casi solamente en groups.google.*.
El alto porcentaje en octubre se debe al anuncio en chile.soc.consumidor
de la publicación de la página. Otras discusiones en el mismo grupo
llevan a los aumentos en febrero y mayo (si bien ahora están eclipsados
por Google).
Finalmente, en la categoría misceláneos está presente la página
http://jms.caos.cl/cal/ , que contiene desde octubre un link al
documento de feriados, y que dio buena parte de los hits externos en
dicho mes. Si bien ahora los accesos desde Google lo eclipsan, este
tráfico se ha mantenido.
Cuando tenga tiempo, haré un análisis de los agentes utilizados.
--
MIGUEL FARAH // ***@lj.cl
#include <disclaimer.h> // http://www.farah.cl
<*>
"UNIX was not designed to stop you from doing stupid things, because
that would also stop you from doing clever things."
- Doug Gwyn
MIGUEL FARAH // ***@lj.cl
#include <disclaimer.h> // http://www.farah.cl
<*>
"UNIX was not designed to stop you from doing stupid things, because
that would also stop you from doing clever things."
- Doug Gwyn