¡Ojo! Esta traducción está muy desactualizada, por favor, consulte el documento original.

Creación de una réplica de los archivos de Debian

Cuándo montar una réplica

Aunque apreciamos todas las réplicas nuevas, cada futuro mantenedor de una réplica debe estar seguro de poder responder las siguientes preguntas antes de montar una réplica:

A qué se le debe hacer una réplica

La página principal de réplicas contiene la lista de archivos disponibles para replicar.

Vea la página tamaño de réplica para obtener información más precisa acerca del tamaño de las réplicas.

El archivo debian-security/ contiene las actualizaciones de seguridad publicadas por el equipo de seguridad de Debian. Suena interesante replicar este archivo, pero dado que las actualizaciones de seguridad son efímeras, sería necesario replicar con mucha frecuencia para tenerlo actualizado (o usar replicación pasiva) por lo cual no se recomienda. Por el contrario Debian hace el mayor esfuerzo por mantener la alta disponibilidad de security.debian.org

Desde dónde hacer las réplicas

Muchas personas suelen creer que ftp.debian.org es la ubicación principal de los paquetes de Debian y que por lo tanto será mejor hacer la réplica de ese sitio. Esto no es cierto.

ftp.debian.org es apenas uno de los muchos servidores que son actualizados desde un servidor interno de Debian. Esa dirección apunta a un sólo servidor, y existe por cuestión de compatibilidad con versiones anteriores.

Las réplicas oficiales son un buen sitio de donde replicar. Cualquiera de los servidores en la lista completa de réplicas que tenga las etiquetas Type: Push-Primary o Type: Push-Secondary deben ser una buena fuente para replicar. Por favor use uno que esté cerca físicamente y que tenga una buena tasa de transferencia.

No hay diferencia real entre los distintos servidores réplica tipo Push-Primary en cuanto a su uso para replicar. Por el contrario, si muchas personas usan ftp.debian.org para replicar (y desafortunadamente, esto sucede), esto desperdicia innecesariamente el ancho de banda donado.

Los administradores de las réplicas en los Estados Unidos deben replicar de ftp.us.debian.org (la dirección oficial de réplicas para los Estados Unidos, la cual es una réplica tipo Push-Primary). Pero, dado que esa dirección es un alias para un grupo de servidores, es mejor determinar cual de ellos es el mejor y replicar de este.
La ventaja de hacer esto es que evita el riesgo de error cuando cuando se ejecuta rsync en dos pasos (los diferentes pasos pueden ejecutarse en servidores diferentes, esto puede suceder en un periodo de tiempo en el cual estos tienen ficheros diferentes, causando una condición de carrera). La desventaja de esto es que concentra la carga en un solo servidor, lo cual puede variar el rendimiento, aunque esto es inherente a nuestra red de réplicas en realidad.

Cómo replicar

El método recomendado para replicar es con el conjunto de scripts llamado ftpsync, el cual está disponible en dos formas:

El protocolo para replicar y el cual recomendamos ampliamente es rsync.

Por favor no haga réplicas de Debian usando wget y otras herramientas basadas en FTP. Estas pueden parecer tener un buen funcionamiento, pero tienen bastantes problemas (no pueden detectar enlaces no simbólicos, es más dificil hacer réplicas parciales, etc).

Configuración de rsync

Recomendamos el uso de el conjunto de scripts de ftpsync. para replicar el archivo. Siga las instrucciones en el fichero README para replicar.

Si usted usa sus propios scripts, la funcionalidad mínima que deben tener es la siguiente:

Replicación parcial

Considerando el gran tamaño del archivo de Debian, algunas personas prefieren replicar sólo algunas partes de él si las necesitan. Si desea excluir algo, debería excluir la parte de las arquitecturas adicionales.

Con el conjunto de scripts recomendados ftpsync, esto puede ser realizado editando la variable ARCH_EXCLUDE.

Sugerimos no excluir los directorios project/, doc/ y otros subdirectorios. Estos por lo general no ocupan mucho espacio en disco y son útiles para los usuarios. En especial el directorio project/trace es de mucha ayuda cuando hay problemas en la réplica.

Aunque es posible usar otros scripts para replicar de esta forma, estos no son necesarios y no se recomienda su uso en réplicas oficiales.

En qué momento hacer réplicas

El archivo principal se actualiza cuatro veces en el día. Las réplicas usualmente empiezan a actualizarse cerca de las 3:00, 9:00, 15:00 y 21:00 (todas las horas en UTC), pero estas horas nunca son fijas y no se deben fijar sus horas de sincronización basándose en ellas.

Su réplica debe actualizarse unas pocas horas después de que alguna de las réplicas del archivo principal se actualicen. Se debe verificar si el sitio que se está replicando tiene un fichero con una marca de tiempo en el subdirectorio project/trace/. El fichero con la marca de tiempo debe ser nombrado con el nombre de ese servidor, y debe contener la fecha y hora de finalización de la actualización de su réplica. Añada un par de horas a esa fecha y hora (para estar más seguros) y haga la réplica.

Es esencial que su réplica se mantenga sincronizada con el archivo principal. Un mínimo de 4 actualizaciones en un periodo de 24 horas garantizarán que su réplica refleja el estado actual de el archivo. Es necesario aclarar que las réplicas que no están actualizadas con respecto al archivo principal no serán listadas en la lista oficial de réplicas.

La forma más sencilla de que la réplica se actualice todos los días es usando cron. Ejecute man crontab para más detalles.

Tenga en cuenta que si su réplica usa replicación pasiva, entonces no será necesario preocuparse por lo descrito en esta sección.

Replicación pasiva

Replicación pasiva es una forma de replicar que hemos desarrollado para reducir el tiempo que los cambios al archivo se ven reflejados en las réplicas. Una réplica maestra usa una notificación por SSH para informar a una réplica cliente que se actualice. La notificación se hace mediante un mecanismo seguro que no tiene información variable, por lo cual el resto del proceso de replicación es igual al hecho mediante cron.

La replicación pasiva es necesaria para mantener grupos de servidores sincronizados (como los servidores usados con balanceo de carga mediante DNS como ftp.us.debian.org), es usada para los servidores de primer y segundo nivel. Dado que este método requiere más trabajo para configurar los servidores, su uso no es común en réplicas privadas.

Para una descripción más detallada acerca del funcionamiento de la replicación pasiva, del por qué es segura y cómo montar una réplica pasiva, por favor vea la explicación completa .

Ajustes adicionales recomendados

Si la réplica va a estar disponible a través de HTTP, por favor añada las siguientes líneas a su configuración de Apache (asumiendo, que usará Apache), en la directiva <Directory /ruta/a/su/réplica>, donde /ruta/a/su/réplica debe ser la ruta real del directorio donde se almacena la réplica:

   Options +Indexes +SymlinksIfOwnerMatch
   IndexOptions NameWidth=* +SuppressDescription

Esto activa la generación de índices y asegura que se pueda acceder a contenido a través de enlaces simbólicos. Los nombres de los ficheros en los directorios no serán acortados y las (casi inexistentes) descripciones no se mostrarán.

En Apache 1.3.x, la siguiente opción puede ser añadida:

   DirectoryIndex .

No añada esta opción en Apache 2.x.

Cómo añadir una réplica a la lista de réplicas

Si desea que su réplica sea listada en la lista oficial de réplicas por favor asegurese que:

Una vez la réplica se ha montado, debe ser registrada con el fin de que sea incluida en la lista oficial de réplicas. Los registros pueden realizarse usando este simple formulario.

Cualquier problema o pregunta puede ser comunicado a mirrors@debian.org.