Cómo contratar diseño web sin hacer el ridículo

Capítulo 6

Qué es un servidor y cómo funciona internet.

En este capítulo aprenderás…

  1. Qué es una dirección IP y tipos de direcciones IP
  2. Qué es un router
  3. Qué es una red local y qué es en realidad una intranet
  4. Cómo funciona internet
  5. Por qué un servidor no es lo que crees
  6. Qué es el HTTP y el FTP
  7. Qué es el hosting y tipos de hosting
  8. Qué es el cloud computing
  9. Qué es un log
  10. Cómo saber quién visita tu sitio web o abre tus emails

¿Qué es internet?

Internet es una red de nodos interconectados entre sí. Estos nodos son computadores y también los llamamos máquinas o dispositivos. Ejemplos de algunos de estos dispositivos son: PCs, teléfonos móviles, televisiones, reproductores de música y en la actualidad, casi cualquier cosa: coches, neveras, libros electrónicos, despertadores…

¿Qué es una dirección IP?

Cada dispositivo conectado a internet cuenta con una dirección IP, que es un código numérico a modo de matrícula única.

IP son las siglas de “Internet Protocol” que significa Protocolo de Internet.

En la versión 4 del protocolo de internet (IPv4) las direcciones IP consisten en una sucesión de cuatro cifras separadas por el carácter del punto. Cada cifra de la sucesión tiene un valor entre el 0 y el 255. Por ejemplo, 192.168.1.1 es una dirección IPv4.

Sitios web como Cual es mi IP o Ver Mi IP te muestran cuál es tu dirección IP pública.

Dado que el IPv4 “sólo” permite que existan unas cuatro mil millones de direcciones IP en una red, ya se usa la versión 6 del protocolo IP (IPv6), que permite la existencia de más de 3.4 × 1038 direcciones IP.

Una red de redes

Internet también se define como la red de redes porque cuando te conectas a internet lo haces formando una subred con todos los demás dispositivos que se conectan a través del mismo router que tú.

Fotografía del frontal de un router de la marca kyocera, fabricado por la empresa D-Link. Se observa la antena del Wi-Fi en la parte trasera.


Imagen 6.1. Un router es un dispositivo que gestiona el envío y recepción de datos en una subred y entre subredes. Router se traduce como enrutador, pues su trabajo es crear y gestionar las rutas por las que viajan los datos.
(Imagen bajo licencia CC BY-SA 2.0 cortesía de Synthesis Studios.)

¿Qué es una red local?

Los ordenadores, móviles y tablets de los miembros de tu familia forman una red local, y como nodos de esa red cada uno de esos dispositivos cuenta con una dirección IP local (o interna). Toda esa red se conecta a internet a través de un router con una dirección IP pública (o externa).

Es posible determinar la localización geográfica de un dispositivo a partir de su dirección IP pública (con bastante poca precisión).

Una red puede estar formada por un sólo dispositivo. También, una red puede estar constituida por varias subredes que a su vez pueden contener más subredes.

Esquema en el que un smartphone, un portátil, y un ordenador de sobremesa aparecen conectados a un router a través de una dirección IP local, y el router, a su vez, aparece conectado a una nube como metáfora del resto de internet, a través de una dirección IP pública.

Imagen 6.2. Subred formada por dispositivos conectados a un router y conectada al resto de internet.
Las direcciones IP locales corresponden a cada uno de los dispositivos (smartphone, ordenador de sobremesa y ordenador portátil) y aunque no aparezca en el esquema, el router también tendría su propia dirección IP local, que suele ser 192.168.1.1.
Es habitual representar internet como una nube. De ahí proviene la expresión cloud computing, que significa computación en la nube.
(Iconos de la imagen bajo licencia CC BY-SA 3.0 cortesía de WPZOOM.)

Una intranet es una red local, no una aplicación web con acceso restringido a los usuarios de una organización, que es una acepción común (y errónea). A una intranet también se le llama LAN, siglas de “Local Area Network”, lo que se traduce como “Red de Área Local”.

Arquitectura cliente-servidor

Internet es una red con arquitectura cliente-servidor. Lo que significa que cada dispositivos que forman parte de la red tiene el rol de cliente o de servidor.

¿Qué es un servidor?

Un servidor es el nodo de la red que presta servicios. Un servicio es, por ejemplo, el envío o recepción de correo electrónico o el envío de una página web a un navegador.

Existen servidores para todo tipo de servicios: impresión, fax, telefonía, almacenamiento, bases de datos, páginas web, publicidad… Un servidor de correo, por ejemplo, almacena, envía y recibe correo electrónico para otros usuarios de la red.

No imagines un servidor como un gran ordenador, sin pantalla y guardado en un cuarto con refrigeración. Puede ser así (y suele serlo cuando el dispositivo debe soportar alta carga de trabajo), pero no tiene por qué. Lo que convierte a un dispositivo en servidor es el software que tiene instalado.

Foto de varios smartphones.

Imagen 6.3. Haciendo algo tan fácil como instalar un software cualquier dispositivo se puede convertir en un servidor. Un portátil, e incluso un teléfono móvil, pueden ser servidores.
(Imagen bajo licencia CC BY 2.0 cortesía de Phil Roeder.)

En el portátil desde donde escribo estas palabras tengo instalados varios servidores que utilizo para probar sitios web en un ámbito local (privado) antes de publicarlos en internet.

¿Qué es un cliente?

El cliente es el que los consume los servicios que proporciona el servidor.

El software que usas para leer correo electrónico es un cliente de correo electrónico. Los clientes de correo electrónico más conocidos son Microsoft Outlook, Mozilla Thunderbird, Apple Mail, IBM Notes (antes conocido como Lotus Notes) o Gmail.com (que a diferencia del resto de los mencionados en esta lista, funciona vía web).

Las páginas web son parte de internet porque existen servidores web que envían archivos HTML a nuestros ordenadores y clientes web, llamados navegadores, que solicitan ese archivo HTML y lo interpretan para que veamos una bonita página web en lugar de un código HTML como el que creamos en el Capítulo 3. ¿Qué es el HTML y CSS?.

Los servidores web más populares son Apache, Nginx y Microsoft IIS, y como ya vimos, los navegadores más conocidos: Microsoft Edge, Google Chrome, Mozilla Firefox, Apple Safari y Opera.

Captura de pantalla del navegador web Opera en Mac OS X mostrando el artículo

Imagen 6.4. Navegador web Opera, instalado sobre el sistema operativo Mac OS X, visitando el artículo “Navegador web” de la Wikipedia.

Además del servidor web la carga de una página web puede requerir de otros servidores, como un servidor de PHP, que interpreta código PHP para acabar construyendo un archivo HTML, o un servidor MySQL, que permite que el servidor PHP acceda a datos almacenados en una base de datos MySQL cuando el código PHP así lo solicita.

Las distintas funcionalidades y contenidos de un sitio web pueden estar repartidas entre varios alojamientos y servidores. Por ejemplo, Apache es más eficiente comunicándose con bases de datos, mientras que Nginx lo es enviando imágenes. Un sitio web puede contar con un servidor Apache que hable con una base de datos MySQL y un servidor Nginx que envíe las imágenes. Este es un ejemplo de las responsabilidades de la administración de sistemas (que es la rama de la informática que se dedica a la gestión y optimización de redes y servidores).

Obviamente, todos los servidores funcionan sobre un sistema operativo. En desarrollo web es habitual el entorno LAMP, que significa “Linux Apache MySQL PHP“. Seguro puedes deducir lo que significa WAMP y MAMP.

navegador ≠ buscador

No debes confundir un navegador con un buscador. Un navegador es un programa informático instalado en tu ordenador que te permite visitar páginas web. Internet Edge, Mozilla Firefox, Google Chrome, Safari y Opera son ejemplos de navegadores.

Captura de pantalla en Mac OS X en la que aparecen iconos de varias aplicaciones, y en el centro, enfocado, el icono de Google Chrome.

Imagen 6.5. En el centro de la imagen, icono del navegador Google Chrome. Al hacer doble clic en él se abrirá la aplicación Google Chrome.

Un buscador es una página web que visitas con tu navegador y te permite encontrar páginas web que contienen cierto texto. Los buscadores son aplicaciones web. Google, Yahoo!, Bing y Ask son ejemplos de buscadores.

Google Chrome es una aplicación de escritorio, concretamente un navegador. google.com es una aplicación web, concretamente un buscador. Ambas aplicaciones han sido creadas por la empresa Google, Inc. De manera similar, la empresa Microsoft Corporation, entre otros muchos productos, cuenta con un navegador, Internet Edge (antiguo Internet Explorer), y bing.com (un buscador).

Para acceder a un buscador tienes que hacer lo mismo que para acceder a cualquier otra página web de internet: escribir su dirección web dentro de la barra de direcciones del navegador. Si, por ejemplo, abres Google Chrome y escribes “google.es” en la barra de direcciones, verás algo similar a la imagen a continuación:

Captura de pantalla en Mac OS X del navegador Google Chrome visitando la página web google.es.

Imagen 6.6. Navegador Google Chrome mostrando la página web google.es.

Captura de pantalla en Mac OS X del navegador Google Chrome visitando la página web google.es. En la imagen se destaca la barra del navegador (barra superior), y la barra del buscador (barra inferior).

Imagen 6.7. La barra de direcciones es un elemento del navegador (por ejemplo, Google Chrome), y sirve para introducir las direcciones de las páginas web que deseas visitar. La barra de búsqueda es un elemento del buscador (por ejemplo google.es), y sirve para introducir el texto que deseas encontrar en otras páginas web.
Para comodidad de los usuarios, la mayoría de los navegadores hacen que cuando el texto que se introduce en su barra de direcciones no es una dirección web, dicho texto pase a ser buscado en un buscador. De esta forma, la barra de direcciones hace las veces de barra de búsqueda.

El nombre Google proviene de googol, término inglés que se traduce como gúgol y que es el nombre de un número, un 1 seguido de 100 ceros, es decir, 10100. El nombre hace alusión a la cantidad de información que gestiona el buscador.

Además, la sede de Google, ubicada en Santa Clara (California), se llama Googleplex. Un gúgolplex (googolplex en inglés) es otro número, 10gúgol. Necesitarías más espacio del existente en el universo conocido y más tiempo que la edad del universo para escribir todos los ceros que tiene ese número.

Esqueleto de un Tiranosaurus Rex con un flamingo rosa en la cabeza, sobre el césped de Googleplex

Imagen 6.8. Googleplex no se queda atrás respecto a otras empresas tecnológicas de Silicon Valley en lo que a excentricidad se refiere.

El número gúgol fue propuesto en 1938 por el matemático estadounidense Edward Kasner (1878—1955) y para su nombre se inspiró en un balbuceo de su sobrino de 9 años. El número no es especialmente relevante en matemáticas.

Firefox, un navegador libre

La fundación mozilla, una organización sin ánimo de lucro, desarrolla el navegador Firefox, de código libre. Desde 1998 mozilla trabaja por crear una web abierta, accesible y colaborativa que beneficie a todo el mundo.

Algunos buscadores pagan a mozilla a cambio de que el suyo sea el buscador por defecto en Firefox.

Fotografía de panda rojo. Un pequeño animal peludo, del tamaño de un zorro, de pelo rojo con manchas blancas, con cola larga y gorda, caminando por la nieve.

Imagen 6.9. Al contrario de lo que creen muchos, el icono de Firefox no está inspirado en un zorro, sino en un panda rojo.

Dos fotografías: a la izquierda, la fotografía tomada por el equipo de Firefox, en sus instalaciones, de una tarta blanca con el logotipo de Internet Explorer y un mensaje que dice

Imagen 6.10. Los equipos de desarrollo de Firefox e Internet Explorer tienen la dulce costumbre de regalar una tarta a sus respectivos rivales tras el lanzamiento de una versión importante.
(Imágenes bajo licencia CC BY 2.0, cortesía de Jennifer Morrow (izquierda) y Matt Brubeck (derecha).)

¿Qué es eso del HTTP? Protocolos de comunicación

Un protocolo es el conjunto de reglas y mensajes que utilizan servidores y clientes para comunicarse. Cada servicio necesita de uno o varios protocolos para que cliente y servidor se comuniquen. HTTP es el protocolo a través del cual se comunican servidor web (como por ejemplo Apache o Nginx) y navegador (como por ejemplo Internet Edge o Google Chrome).

HTTP son las siglas de “HyperText Transfer Protocol“, lo que se traduce como “Protocolo de Transferencia de HiperTexto”.

La versión más extendida del HTTP es la 1.1 (es decir, HTTP 1.1) pero poco a poco se va extendiendo la versión 2 (o HTTP/2), más segura y eficiente. La implantación del HTTP/2 no implica ningún cambio para usuarios o sitios web existentes, pues es compatible con las versiones anteriores. No obstante, desarrolladores y administradores de sistemas podemos utilizarlo para crear sitios web más seguros y eficientes.

Algunos otros protocolos que probablemente has oído son:

  • El servidor de correo se comunica con un cliente de correo, como Microsoft Outlook o Gmail.com, a través de protocolos como el POP3 (siglas de “Post Office Protocol“, que se traduce como “Protocolo de Oficina de Correos”), el IMAP (siglas de “Internet Message Access Protocol“, que se traduce como “Protocolo de Acceso a Mensajes de Internet”) o el SMTP (siglas de “Simple Mail Transfer Protocol“, que se traduce como “Protocolo de Transferencia de Correo Simple”).
  • FTP, que son las siglas de “File Transfer Protocol“, que significa “Protocolo de Transferencia de Ficheros”, y sirve para transmitir archivos entre un servidor y un cliente de intercambio de archivos, como Filezilla, SmartFTP o Transmit.

Aunque vulgarmente hablamos de servidor FTP, siendo rigurosos deberíamos hablar de servidor de intercambio de archivos, pues FTP es el nombre del protocolo con el que se comunican cliente y servidor, no el nombre del servidor.

Captura de pantalla de Filezilla en Mac OS X. En la parte superior los tres campos necesarios para conectarse a un servidor a través de FTP: nombre del servidor (llamado

Imagen 6.11. Un cliente de FTP conectado a un servidor de alojamiento. Para ello, el usuario antes ha introducido en dicho cliente la dirección del servidor, un nombre de usuario y una contraseña, datos de los que le había provisto su proveedor de alojamiento. Una vez conectado, el usuario ve los directorios y archivos almacenados en su servidor de alojamiento y puede operar con ellos: borrar, cambiar nombre, descargar… También puede transferir archivos desde su ordenador al servidor, arrastrándolos desde el explorador de archivos de la columna izquierda al explorador de archivos de la columna derecha.

Son muchos los protocolos necesarios para el funcionamiento de internet. Al conjunto de dichos protocolos se les denomina TCP/IP, que son las siglas de Transfer Control Protocol/Internet Protocol, que significa “Protocolo de Control de Transferencia/Protocolo de Internet”, puesto que fueron los primeros protocolos que se definieron.

Sabiendo lo que es un protocolo podemos mejorar la definición de internet:

Internet es una red de nodos interconectados entre sí que se comunican usando un conjunto de protocolos de comunicación abiertos.

Que los protocolos con los que se comunican los nodos que forman internet sean abiertos significa que su funcionamiento es público y cualquiera puede conocerlos, estudiarlos y usarlos de manera libre y gratuita. Por contra, Google, Facebook o twitter, entre otras plataformas, pese a que también nos ofrecen canales de comunicación, son empresas privadas, propietarias de la mayoría de las tecnologías empleadas en sus productos. Aunque obvia, esta puntualización es necesaria para entender por qué twitter no es ni será una alternativa al correo electrónico, de la misma forma que Facebook no lo es a las páginas web. Facebook y twitter, como empresas que son, pueden desaparecer en cualquier momento, descontinuar o alterar sus productos o servicios, utilizar los datos de sus usuarios con propósitos comerciales o responder a intereses que no tienen por qué coincidir con los de sus usuarios.

Un poco de historia de internet

Las primeras redes de intercambio de datos datan de inicios de los años 60. Una de ellas, ARPANET, llevó al desarrollo de los primeros protocolos de comunicación que permitían la comunicación entre redes, lo que dio lugar a la formación de una red de redes.

ARPANET fue la primera red en usar los protocolos TCP/IP, convirtiéndose así en el progenitor del actual internet.

Mapa de Estados Unidos que muestra todas las conexiones de la red de ARPANET a fecha de junio de 1977, siendo éstas unas pequeñas decenas que cruzan el territorio continental de este a oeste.

Imagen 6.12. Mapa de ARPANET, 1977. Poco se imaginaban sus creadores que en unos pocos años este mapa iba a ser imposible de representar en un póster.
(Imagen bajo licencia CC BY 2.0 cortesía de Rory Finneren.)

Fotografía del frontal de un router de la marca kyocera, fabricado por la empresa D-Link. Se observa la antena del Wi-Fi en la parte trasera.

Imagen 6.13. El tamaño de los routers ha disminuido un poquito desde este primero que se creó para ARPANET.
(Imagen bajo licencia CC BY-SA 2.0 cortesía de Magnus Manske.)

ARPANET son las siglas de “Advanced Research Projects Agency Network“, que significa “Red de la Agencia de Proyectos de Investigación Avanzada” y se trataba de un proyecto del Departamento de Defensa de Estados Unidos para su uso en universidades y laboratorios estadounidenses.

Tim Berners-Lee (1955— ) es considerado el padre de la Web por crear, en 1990, el HTML, el HTTP y el primer cliente y servidor web. Además, es el fundador del W3C, organización que, como contaba en el capítulo 3, se encarga del mantenimiento del HTML, del XML y de otros lenguajes y estándares. Dato curioso: cuando era estudiante le pillaron accediendo sin permiso al ordenador de la universidad y desde entonces tuvo prohibido usar las instalaciones de informática.

De pie sobre un escenaro, Tim Berners-Lee en camiseta negra a la derecha de Vinto Cerf con parecida camiseta.

Imagen 6.14. Tim Berners-Lee (izquierda) con una camiseta en la que pone “I didn’t invent the Internet” (“Yo no inventé Internet”), junto a Vinton Cerf (1943— ), uno de los padres de internet (que no de la web), vistiendo una camiseta que dice “I did not invent the Web” (“Yo no inventé la Web”).
(Imagen bajo licencia CC BY-NC-SA 2.0 cortesía de statusq.org.)

Proveedores de hosting o alojamento

Cuando contratas un servicio de hosting (o alojamiento, que es lo mismo) estás alquilando un trocito de disco duro y recursos de computación (memoria, procesador, etc.) en uno o varios ordenadores de la compañía proveedora de dicho servicio de hosting.

Ese disco duro o trocito de disco duro tiene instalado un servidor web, un servidor de intercambio de archivos, un servidor de bases de datos y un servidor de correo, entre otros. Esos servidores te permitirán almacenar archivos en el hosting contratado, publicar un sitio web y crear unas cuentas de correo electrónico.

El alojamiento puede ser dedicado o compartido. Si el alojamiento es compartido estás contratando una porción de disco duro y una porción de los recursos (memoria, procesador, etc.) de una máquina. Si el alojamiento es dedicado contratas es el ordenador entero, con todo su disco duro y recursos.

El alojamiento que contrates debe tener unas características técnicas (como memoria o espacio de almacenamiento) suficientes para ejecutar tu sitio web y debe contar o permitirte instalar las tecnologías necesarias para que tu sitio web funcione (ej.: PHP, MySQL, etc.)

Dominio y alojamiento son servicios distintos que no tienen por qué estar contratados con el mismo proveedor. Es habitual contratar distintos proveedores para distintos servicios, por ejemplo, contratar el dominio con un proveedor, almacenar el sitio web con otro y que sea un tercer proveedor el que proporcione el correo electrónico corporativo.

Las características y configuración del servidor de alojamiento tendrán repercusión en el tiempo de carga y funcionamiento del sitio web, y por tanto, en el posicionamiento natural en buscadores de dicho sitio web.

Una CDN, siglas de “Content Delivery Network“, lo que significa “Red de Distribución de Contenido”, es un sistema de servidores de alojamiento distribuidos a lo largo del mundo y cuya utilidad es la de servir contenido a los visitantes de una página web desde el servidor con mayor disponibilidad y rendimiento, lo que reducirá el tiempo de carga de la página web visitada. Es habitual usar un servicio de CDN para almacenar recursos de un sitio web, como por ejemplo sus imágenes.

Dos personas en camise gris de manga corta, una de ellas con un portátil en la mano, caminan en fila por un estrecho pasillo con dos armarios a los lados llenos de cables colgando, lo servidores.

Imagen 6.15. Centro de procesamiento de datos (CPD) de Bing Maps. En él la información de los mapas de Bing es almacenada, procesada y enviada.
(Imagen bajo licencia CC BY 2.0 cortesía de Robert Scoble.)

Empresas de sistemas

Para tener un sitio web no sólo necesitas a una empresa de diseño y desarrollo web, también necesitas a una empresa de sistemas.

Las empresas de sistemas o, más correctamente, de mantenimiento de sistemas, son empresas que, entre otras cosas, mantienen tu sitio web protegido, en funcionamiento y en buen estado de salud. Protegido porque evitarán que personas malintencionadas se apoderen de tu sitio web o lo destruyan. En funcionamiento porque en caso de ataque informático, caída u otra incidencia, actuarán rápido para restituir el sitio web. En buen estado de salud porque pueden optimizar tus bases de datos para que el sitio web funcione más rápido.

En un mundo ideal cualquier sitio web estaría mantenido por una empresa de sistemas. En la realidad, la mayoría no contratan a una empresa de sistemas hasta tener mucho tráfico o que se presenten los primeros problemas, una filosofía que no me parece mal, aunque un ingeniero de sistemas no opinará igual.

Cloud computing

 

En su acepción más genérica, cloud computing (traducible como “computación en la nube”), se refiere a cualquier servicio prestado a través de internet, aunque gana popularidad utilizar esta expresión para referirse a un alojamiento elástico o flexible, es decir, un alojamiento que permite aumentar sus características técnicas sin necesidad de cambiar hardware ni complejas operaciones técnicas.

 

No existe ninguna nube (cloud), sólo los ordenadores de otros.

Esto es posible porque muchas máquinas físicas conectadas entre sí son combinadas y gestionadas por un software que las divide en unidades lógicas, llamadas servidores virtuales, de las características técnicas que se desee. Este proceso se denomina virtualización.

Amazon, a través de su amazon web services (AWS) es el mayor proveedor de este tipo de alojamiento. Los sitios web con más tráfico del mundo, como Reddit, twitter o la Wikipedia, emplean los servicios de alojamiento de AmazonAmazon creó esta tecnología para utilizarla internamente y dada su utilidad acabó comercializándola. DigitalOcean es uno de los principales competidores de Amazon.

Rackspace es otra empresa proveedora de servicios de alojamiento que desarrolló OpenStack, un software libre que permite a cualquiera con un conjunto de servidores (también llamado rack de servidores o, simplemente, rack) contar con un sistema similar al de amazon web services. Otras herramientas populares de virtualización son las ofertadas por la empresa vmware.

 

Direcciones IP dedicadas y compartidas

Como ya sabes, todo lo conectado a internet, como tu ordenador o el servidor donde se aloja tu sitio web, tiene asignada una dirección IP. Esas direcciones IP pueden ser dedicadas o compartidas.

Si la dirección IP de un alojamiento es compartida, varios sitios web alojados con el mismo proveedor de hosting tendrán la misma dirección IP. Si la dirección IP es dedicada, tu sitio web contará con una dirección IP única en todo internet, lo que es beneficioso para el posicionamiento en buscadores de dicho sitio web.

La asignación de direcciones IP sigue unas reglas. Aunque no voy a entrar en ello, debes saber que no todas las direcciones IP tienen la misma repercusión en el posicionamiento natural en buscadores de los sitios web.

Direcciones IP estáticas y dinámicas

Una dirección IP es dinámica si es susceptible de cambiar con el tiempo, y estática si es inalterable a lo largo del tiempo.

Puede que cada vez que te conectes a internet tu proveedor de servicios de internet (ISP, del inglés “Internet Service Provider“) te asigne una dirección IP pública diferente, en cuyo caso cuentas con una dirección IP dinámica, o que siempre te conectes a internet con la misma dirección IP pública, lo que significa que tienes contratada una dirección IP fija o estática.

DNS

DNS son las siglas de “Domain Name System“, que se traduce como “Sistema de Nombres de Dominios”, y sirve para traducir nombres de dominios fácilmente recordables a direcciones IP, lo que permite que podamos visitar la Wikipedia escribiendo wikipedia.org en lugar de la dirección IP 208.80.154.224.

El DNS está formado por servidores repartidos por todo el mundo llamados “Name Servers“, “NS” o “Servidores de Nombres”. Los Servidores de Nombres están conectados entre sí y comparten la información de sus bases de datos, que consisten en las direcciones IP equivalentes a cada nombre de dominio de internet.

Parte de esta red de Servidores de Nombres está formada por los registradores o registrars, que son las empresas que venden nombres de dominios.

Cuando abres tu navegador y escribes la dirección wikipedia.org, tu navegador y sistema operativo consultan con los Servidores de Nombres hasta obtener la dirección IP 208.80.154.224. Se trata de un complejo proceso de unos milisegundos de duración.

En sus bases de datos, los Servidores de Nombres tienen almacenadas las direcciones IP de cada servicio para cada dominio. Esto permite que aunque funcionen con el mismo dominio, un sitio web pueda estar alojado con un proveedor y el correo electrónico con otro.

DNS Perf muestra el tiempo de respuesta de los Servidores de Nombres (NS) de los principales proveedores de alojamiento.

Gráfica con un listado de proveedores de *DNS* y el tiempo que sus servidores tardan en responder. El más rápido de la gráfica es CloudFlare, con 17,09 milisegundos; seguido de WordPress.com, con 22,51 milisegundos; y Edgecast con 25,01 milisegundos.

Imagen 6.16. En la gráfica de la captura superior se muestra el tiempo, en milisegundos, que los servidores de distintos proveedores de DNS tardan en responder. A menor tiempo de respuesta, mayor su velocidad.

Los datos de cada uno de los servicios de cada dominio se almacenan en los llamados registros. Existen, por ejemplo, los registros MX, que contienen la dirección IP de la máquina que proporciona los servicios de correo electrónico (de ahí su nombre, pues MX proviene de “Mail eXchange“, que significa “Intercambio de Correo”).

Cuando modificas el valor de un registro DNS los Servidores de Nombres se comunican entre sí para que el cambio se propague entre todos ellos. Por eso, si cambias de proveedor de servidor web o de servidor de correo el funcionamiento de tu web o correo puede no funcionar correctamente hasta pasadas 48 horas.

Aunque el registrador de tu dominio forma parte del sistema DNS y puedes usar sus Servidores de Nombres, también puedes contratar un servicio externo de gestión de DNS como DNS Made Easy, que promete mayor velocidad de respuesta.

Logs

Los logs (término traducible como “bitácoras”) son archivos de texto que crean los servidores. En ellos recogen la actividad del propio servidor, lo que ayuda en la resolución de fallos en el software o en el servidor, pues permiten saber qué ha ocurrido antes de producirse un fallo.

El análisis de los logs también sirve para detectar ataques de seguridad y conocer datos del tráfico de un sitio web tales como número de visitas, tiempo medio de las visitas, páginas vistas por visitante, etc.

La información que recogida en los logs es el resultado de “escuchar” la información que cliente y servidor intercambian usando los protocolos de comunicación (como el HTTP).

Existen herramientas que representan la información de logs de una manera agradable de leer. AWStats, Logaholic y Webalizer son algunas de esas herramientas.

Gráfica y tabla que muestran el número de visitas, páginas vistas, hits, y bandwidth de un sitio web para cada día de mayo. En la izquiera de la pantalla aparece un menú lateral en el que aparecen enlaces para acceder a otras muchas estadísticas como: visitas diarias, visitas semanales, o países de origen de las visitas, entre otras.

Imagen 6.17. Captura de AWStats de un sitio web. En la gráfica y tabla de la imagen se muestran las visitas, páginas vistas, hits (cantidad de archivos descargados) y bandwidth (cantidad de datos transferida) para cada día del mes de mayo de cierto año. Haciendo clic en los enlaces del menú lateral de la izquierda el administrador del sitio web puede consultar otros datos del tráfico de su sitio web.

Cuando contrates un servicio de alojamiento compartido tu proveedor te facilitará los datos de acceso (dirección, usuario y contraseña) a un panel de control desde donde podrás acceder a los logs de tu servidor.

¡Ojo! no te emociones con los hits de tu sitio web. Los hits son archivos descargados, no visitas o páginas vistas. Una página web puede contener recursos como hojas de estilo, iconos, imágenes, vídeos o archivos de audio. Cada vez que un usuario visita una página se producen tantos hits como archivos tenga asociados dicha página web.

Cuando un usuario llega a tu sitio web se produce una visita (visit). Por cada página de tu sitio web que visita dicho usuario se produce una página vista (o pageview en inglés). Si ese mismo usuario vuelve a visitar tu sitio web pasadas unas horas o unos días se produce una segunda sesión (session) de ese usuario, pero dicha visita no aumentará la cantidad de usuarios únicos (unique visitors) o nuevos (new visitors), puesto que se trata de un usuario recurrente (returning o recurring visitor).

La tasa de rebote o bounce rate mide la porción de usuarios que aparentemente no están interesados en tu sitio web. Dependiendo de cómo funcione o cómo esté configurada tu aplicación de analítica web la tasa de rebote se determinará de una u otra manera, por ejemplo contabilizando a aquellos usuarios que pasan menos de 30 segundos en tu sitio web, pero también puede ser, o combinarse con, aquellos usuarios que sólo visitan una página web de todo tu sitio web, o aquellos que pasan un largo periodo de tiempo (como 15 o 30 minutos) visitando una sola página de todo el sitio web.

Analítica web y pixel tracking

Google Analytics, Piwik o Adobe Analytics (antigua Omniture) son algunas de las muchas herramientas que existen para recabar datos del tráfico en un sitio web.

Instalando, por ejemplo, Google Analytics en tu sitio web, tendrás otra forma aparte de los logs de conocer cuántos usuarios te visitan, desde qué lugares geográficos, cuál es la fuente del tráfico o por qué palabras te encuentran en los buscadores, entre otros datos.

Captura de parte de los resultados de Google Analytics. Una gráfica de líneas ocupa la mitad superior de la imagen, una gráfica de tarta se sitúa en la parte inferior derecha, y en la parte inferior izquierda aparecen 6 gráficas de línea con una cifra cada una.

Imagen 6.18. Captura de parte de parte de la información que proporciona Google Analytics. En la gráfica superior de la imagen se representan las páginas vistas cada día durante parte de mayo y junio de cierto año para un sitio web. La gráfica de tarta de la esquina inferior derecha muestra la relación entre usuarios nuevos (27%) y recurrentes (73%) para ese mismo periodo. Las cifras y gráficas de la parte inferior izquierda enseñan el número de sesiones (2.796), usuarios (2.150), páginas vistas (5.664), promedio de páginas vistas por sesión (2,03), duración media por sesión (1 minuto y 44 segundos) y tasa de rebote (68,45%).

Uno de los métodos utilizados por estas herramientas para obtener datos acerca de quién te visita consiste en introducir en todas las páginas de tu sitio web una imagen de un píxel transparente. Es lo que se llama pixel tracking o píxel de seguimiento.

Dicha imagen estará alojada en un servidor de quien proporciona el software de analítica (por ejemplo en los servidores de Google en caso de Google Analytics). Cada vez que se produce una visita esa imagen se descarga y los servidores de Google registran en un log la dirección IP desde la que se ha descargado la imagen (y por tanto la localización geográfica del visitante), y el día y la hora de la descarga (y por tanto el momento de la visita). Además, guardando un archivo de texto con cierta información (cookie) en el dispositivo del visitante sabremos cuando un usuario es recurrente.

Las cookies son archivos de texto que guardan los servidores web en el ordenador del visitante. Entre otras cosas las cookies sirven para mostrar a un usuario publicidad relacionada con sus intereses (basándose en las páginas web que ha visitado), recabar datos de tráfico de un sitio web o evitar tener que volver a pedirle al usuario su nombre de usuario y contraseña cada vez que visita un sitio web.

Avisar a los usuarios de que un sitio web usa cookies es tan ridículo como avisarles de que usa HTTP. —Anónimo.

El aviso de cookies de la web meneame.net dice así:

Imagen 6.19. En Europa existe la conocida como “Ley de cookies“, que obliga al dueño de un sitio web a informar a sus usuarios del uso de cookies y de cómo el usuario puede desactivar el almacenamiento de cookies en su dispositivo.
Algunos sitios, como el agregador de noticias meneame.net (imagen superior) se toman con humor el cumplimiento de esta –difícil de comprender– ley. La “Ley de Cookies” es en realidad una actualización de la Ley de Servicios de la Sociedad de la Información y el Comercio Electrónico (LSSICE), una normativa que todo propietario de un sitio web debe cumplir, al igual que ocurre con la Ley Orgánica de Protección de Datos (LOPD).

Los datos que proporcionan las herramientas de analítica web tienen un margen de error, y por tanto, los resultados difieren entre varias herramientas. Puede ocurrir, por ejemplo, que a veces el píxel de seguimiento no se descargue. Aún así, la precisión de los datos proporcionados por un software de analítica web es infinitamente mayor a la que podemos obtener en cualquier estudio de mercado tradicional.

Las plataformas de email marketing sirven para enviar masivamente mensajes de correo electrónico y también ellas introducen un píxel de seguimiento en cada email que envían. Así pueden decirnos, entre otros datos, qué receptores abren los emails, cuántas veces o desde dónde.

Captura de Campaign Monitor en la que aparece una gráfica con dos líneas en la mitad superior, un gráfico de tarta en la zona inferior izquierda, y 5 cifras en la parte inferior derecha.


Imagen 6.20. Captura de parte de la información que proporciona la herramienta de email marketing Campaign Monitor. En la gráfica superior, en verde, observamos el número de aperturas de cierto email a lo largo del tiempo, y en azul, el número de clics (clics en cualquiera de los enlaces que contuviera el email enviado).
En la zona inferior izquierda se ve un gráfico de tarta con la relación entre los usuarios que han abierto el email al menos una vez (Unique opens), los que todavía no lo han abierto (Not Opened) y los que no lo han recibido –les ha rebotado– (Bounced).
En la parte inferior derecha vemos que el 30,61% de los receptores han abierto el email hasta la fecha, que el 7,19% (69 personas) han clicado en un enlace de los que contenía el email, que el 0,7% de los receptores (22 personas) se dieron de baja para no seguir recibiendo más email marketing de este emisor, que dos personas (0,06%) marcaron el email como correo basura (spam) y que nadie compartió el email en Facebook, Twitter o lo reenvió por correo electrónico.


Resumen

Internet es una red formada por subredes, redes locales o intranets interconectadas entre sí que pueden contener a su vez más subredes. Cada nodo de cada red tiene una dirección IP que lo identifica.

Cada nodo en una red cumple el rol de cliente o de servidor. Cliente es el que solicita información al servidor, servidor el que proporciona información al cliente. Por ejemplo, Apache es un servidor de páginas web; y un navegador, como Mozilla Firefox, es un cliente de páginas web.

Existen servidores para cada tipo de servicio: correo electrónico, páginas web, bases de datos, telefonía, etc. Para cada servidor existen uno o varios protocolos, que son el conjunto de reglas con las que se comunican cliente y servidor. Ejemplos de protocolos son el HTTP para páginas web o el FTP para transferencia de archivos.

La contratación de alojamiento consiste en el alquiler de disco duro y recursos de computación de un ordenador. Podemos compartir los recursos de alojamiento con otros usuarios del servicio o contratar un alojamiento dedicado.

Los servicios de alojamiento de cloud computing son elásticos, es decir, sus recursos de computación son ajustables a los requisitos de cada momento.

El sistema DNS traduce nombres de dominios a direcciones IP. Los registros, que forman parte del DNS, permiten que sitio web, email y otros servicios funcionen bajo un mismo nombre de dominio pero estén contratados con proveedores distintos.

Los logs son archivos de texto que registran la actividad del servidor, algo útil para la detección de fallos, por seguridad y para recabar datos de uso del servidor, tráfico de un sitio web o envíos de email marketing.

Si has leído hasta aquí ya sabes cómo funciona un ordenador, qué es el HTML y el CSS, qué es la programación, qué es una base de datos y cómo funciona internet, que son todos los ingredientes necesarios para entender el Capítulo 7. Cómo funciona una página web.