PEDRO ROBLEDO

Apuntes profesionales


¿Qué es el tráfico no humano? o Non Human Traffic (NHT)

A raíz de la explosión de la IA generativa se ha vuelto a hablar más del tráfico no humano o Non Human Traffic (NHT). Se trata del tráfico artificial sin que exista una persona real detrás. Es decir, es tráfico generado por bots.

No paran de surgir soluciones de inteligencia artificial generativa. Además de las grandes que todos conocemos, están las que están creando algunas grandes empresas para poder ser independientes o poder comercializar su propia IA generativa gracias a una especialización. Y también, claro está, los modelos nuevos que surgen con cada startup que cree haber encontrado un segmento de mercado que transformar y al que aspira conquistar.

Obviamente, esos modelos tienen que ser entrenados y están utilizando bots para «leer» los contenidos online que se ofrecen públicamente en internet. Son usuarios que interactúan con los contenidos, como si fueran una persona real, pero detrás sólo hay un programa informático.

Este aumento del tráfico no humano es uno de los motivos por los que, por ejemplo, algunas tiendas online han decidido mostrar un captcha cuando detectan a un usuario que accede por primera vez. De esta forma, se aseguran de que el tráfico proviene de una persona real (tráfico humano), y además reducen la posibilidad de compras y pagos fraudulentos.

En BuitWith.com podemos ver un gráfico de la locura que está siendo el incremento exponencial de sites, que desde julio del año pasado (2025), han decidido denegar el acceso al bot de ChatGPT para impedir que acceda a sus contenidos.

Fuente: https://trends.builtwith.com/robots/GPTBot-Disallow

Es importante tener claro que hay dos grupos diferenciados de tráfico no humano, el legal y el fraudulento. El NHT existe desde que existe internet y los medidores como Comscore, Nielsen, etc. llevan muchísimos años identificándolo.

La parte legal son bots que son necesarios para que internet exista tal y como la conocemos, y podamos disfrutar de ciertos servicios: buscadores, medidores, rastreadores de contenidos, agregadores de contenidos, servicios de seguimiento de precios, etc.

Estos bots legales pueden ser lo que se denominan spiders o crawlers (arañas), que básicamente son bots que únicamente rastrean/leen el contenido, o pueden ser bots más avanzados que van más allá del mero rastreo.

Pero como decíamos, también hay una parte fraudulenta en el NHT. Tuve la suerte de empezar en la industria digital dentro de marketing de afiliados, donde es fundamental estar muy al día y tener bastantes conocimientos de las distintas técnicas fraudulentas utilizadas por los publishers que están al margen de la ley. Sus métodos más sofisticados, realizados con bots.

Aquí la lista es muy larga: spambots, astroturfing, cookied boots… todo para generar tendencias en redes sociales, impresiones y clics publicitarias, falsas atribuciones de ventas o registros en modelos last click wins, compras fraudulentas con cuentas y contraseñas robadas y un largo etcétera, que cualquier experto en ciberseguridad o en marketing digital con background en performance conoce perfectamente.

¿Cuánto es un nivel aceptable de NHT? Por encima del 5% sobre el tráfico medio hay que realizar una auditoría, ya que sería un nivel sospechoso de posible fraude. En sitios web de mucha calidad los niveles de NHT suelen estar por debajo del 1,5-2%.



Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Infraestructura y Trading (2) Medición y calidad (1)

Tags

adtech (1) auctiondelay (1) biddertimeout (1) bots (1) failsafetimeout (1) header bidding (1) latencia (1) NHT (1) Non Human Traffic (1) prebid (2) spambots (1) tam (1) timeout (1) tráfico no humano (1) uam (1) yield management (2)