Últimas actualizaciónes:
Escribir sin ser indexado por los motores de búsqueda

Escribir sin ser indexado por los motores de búsqueda

— O —
— O — Herramientas

En un ecosistema que fomenta la escritura para ser encontrada por sobre ser leída, hay muchos contenidos en Internet que son redactados pensando más en satisfacer el (¿o los?) algoritmo de indexado de Google que a los usuarios. 

Por ejemplo, el hecho de que estés leyendo esto, ya es (muy) raro. Posiblemente llegaste porque te topaste con el link del artículo dentro del sitio, o a través de una red social, pero es poco probable me hayas encontrado de forma orgánica, es decir, buscando en Google (o en Peekier, o en Right Dao).

Lo mencionado en el párrafo anterior se debe a que, para crear este post, no se utilizó ninguna de las N herramientas de SEO que andan en la vuelta. Utilidades que te dicen, con relativa exactitud, cuántas personas buscan un término determinado, que sitios son los que rankean mejor para esas palabras claves, y que se necesita para estar dentro del top 10 de los resultados ofrecidos por Google.

Al no considerar ese factor al momento de construir esto, es muy difícil que Google "entienda" de qué estamos hablando. Posiblemente lo meta como candidato para alguna palabra clave, pero el artículo no está "dirigido" específicamente para aparecer cuando buscas: "Cómo escribir para no ser detectado" o "Anti SEO"

Aún así, si fuéramos a quitar toda intención de hacer visible nuestro artículo (algo que podríamos lograr configurando el archivo robot.txt), quizás sea indexado por otros motores de búsqueda que ignoran las reglas definidas en el archivo robot.txt. Cómo sea el caso, la posibilidades de que encuentren tus contenidos son muy altas, incluso usando Google Drive tus documentos pueden llegar a ser ubicados con meta buscadores específicos, como ser Deddiger

Claro, en este punto te estarás preguntando ¿tiene sentido escribir para no ser encontrado? 

Quizás queres compartir lo escrito únicamente con un grupo de personas sin necesidad de poner un password y contraseña. Quizás escribir una especie de diario íntimo con el morbo de que algún día sea encontrado...

Bueno, no sé si nada de lo anterior tiene sentido, pero me interesa más la pregunta ¿es posible tener contenido en Internet que no sea encontrado por el ojo del Gran Hermano? 

En este artículo, vamos a responder esa pregunta.

Tabla de contenidos

¿Es posible tener un artículo en Internet que no sea encontrado por el ojo del Gran Hermano? 

Sí, es posible gracias a un ingenioso invento: itty.bitty

itty.bitty es una micro maravilla. Una pieza de ingeniosa factura desarrollada por Nicholas Jitkoff (ex Google, ¿ex ? Dropbox).

En palabras del propio creador:

"[itty.bitty] Comprime sitios diminutos en su propio enlace, permitiendo que contengan el cuerpo completo de un sitio. Se interpreta del lado del cliente sin que el servidor almacene el contenido."

Básicamente te permite tener contenido, aunque limitado su tamaño, que "vive" únicamente en la URL si necesidad de estar alojado en un servidor Web. 

No es la intención de este artículo entrar en los detalles técnicos de como y por qué funciona. Si estás interesado en profundizar en ese aspecto, te dejamos el vínculo al proyecto en Github acá y un issue muy particular, que contiene documentación que un usuario hizo sobre el proyecto: issue #54: Documentación.

Para crear un itty.bitty contenido ingresa a la siguiente página: https://itty.bitty.site/edit 

Escribir sin ser indexado por los motores de búsqueda

Vamos embeber en una URL el Poema conjetural (publicado en el año 1943, en el libro "El otro, el mismo") del escritor Jorge Luis Borges

El doctor Francisco Laprida, asesinado el día 23 de septiembre de 1829 por los montoneros de Aldao, piensa antes de morir:

Zumban las balas en la tarde última.
Hay viento y hay cenizas en el viento,
se dispersan el día y la batalla
deforme, y la victoria es de los otros.
Vencen los bárbaros, los gauchos vencen.
Yo, que estudié las leyes y los cánones,
yo, Francisco Narciso de Laprida,
cuya voz declaró la independencia
de estas crueles provincias, derrotado,
de sangre y de sudor manchado el rostro,
sin esperanza ni temor, perdido,
huyo hacia el Sur por arrabales últimos.

Como aquel capitán del Purgatorio
que, huyendo a pie y ensangrentando el llano,
fue cegado y tumbado por la muerte
donde un oscuro río pierde el nombre,
así habré de caer. Hoy es el término.
La noche lateral de los pantanos
me asecha y me demora. Oigo los cascos
de mi caliente muerte que me busca
con jinetes, con belfos y con lanzas.

Yo que anhelé ser otro, ser un hombre
de sentencias, de libros, de dictámenes,
a cielo abierto yaceré entre ciénagas;
pero me endiosa el pecho inexplicable
un júbilo secreto. Al fin me encuentro
con mi destino sudamericano.

A esta ruinosa tarde me llevaba
el laberinto múltiple de pasos
que mis días tejieron desde un día
de la niñez. Al fin he descubierto
la recóndita clave de mis años,
la suerte de Francisco de Laprida,
la letra que faltaba, la perfecta
forma que supo Dios desde el principio.
En el espejo de esta noche alcanzo
mi insospechado rostro eterno. El círculo
se va a cerrar. Yo aguardo que así sea.

Pisan mis pies la sombra de las lanzas
que me buscan. Las befas de mi muerte,
los jinetes, las crines, los caballos,
se ciernen sobre mí ... Ya el primer golpe,
ya el duro hierro que me raja el pecho,
el íntimo cuchillo en la garganta.

El poema tiene:

  • Caracteres: 1719
  • Palabras: 318
  • Sentencias: 18
  • Párrafos: 45
  • Espacios: 273

Que son: 1683 bytes 

Si en la página de itty.bitty seleccionas la opción menu -> copy link, obtienes el "poema conjetural" comprimido en la URL, que se ve de la siguiente manera:

Escribir sin ser indexado por los motores de búsqueda

Listo. El poema de Borges comprimido en el algoritmo conocido como "Lempel-Ziv-Markov" o por el acrónimo [algo que se agradece en este caso] LZMA. Este es el mismo algoritmo de compresión que se usa en el famoso formato 7z (del programa 7-Zip).

Luego de comprimido el poema, lo encodea en Base64.

Una vez que se accede a ese mensaje vía URL (abriéndola en el browser), hay un pequeño Javascript definido dentro del tag script de la página de itty.bitty, que se encarga de llevar el contenido a su formato inicial e incrustarlo en el documento HTML, en un iframe, para que pueda ser visualizado por el usuario:

Escribir sin ser indexado por los motores de búsqueda

Toda esta magia funciona gracias a una propiedad que tiene las URI llamada: fragmentos (podes leer más sobre los fragmentos en la URI en la siguiente pagina de la W3C), pero básicamente es contenido que los browser no envían al servidor, sino que lo utilizan para hacer scroll en una página. Es muy utilizada para crear vínculos internos (Anchors Tags) en el documento. Si te fijas en la tabla de contenido de este capitulo, vas a notar que los línks a las cabecera tiene un # con un id que identifica a cada tag H2, H3, Hn. Si lo presionas, automáticamente te lleva (scrollea) al tag H seleccionado.

La genialidad de Nicholas fue identificar un nuevo uso para esa propiedad de los fragmentos en la URI. Ojo, en honor a la verdad, parece no ser el primero en haber encontrado ese uso, aunque ahora no encuentro dentro de mis bookmarks el proyecto al cual hago referencia como para incluir link en este artículo. Las disculpas del caso.

Pero no importa quién "descubrió" primero este nuevo uso, esto no es un carrera. Lo importante es apreciar el ingenio de alguien que vio una nueva forma de utilizar una propiedad que se supone existe para resolver un tema especifico. Es un claro ejemplo claro de la frase hecha: "Pensar fuera de la caja".

¿Qué se puede hacer con ittby.bitty?

Un montón de cosas siempre que el contenido no supere los 2000 bytes (aunque hay unas excepciones respecto al tamaño soportado que podes ver acá).

En codepen.io se encuentran unos cuantos ejemplos de uso de itty.bitty. Podes verlos ingresado al siguiente vínculo.

Incluso hay algunas propuestas de encontrar todos los (micro) juegos que puedan ser embebidos en un URL: itty.bitty micro-games.

¿Es ittby.bitty seguro?

Bueno, depende. Es decir, en la URL se puede embeber no solo texto plano sino también JS (fíjate en este ejemplo). Las paginas embebidas se cargan dentro de un iframe, como se aprecia en la siguiente captura de pantalla:

Escribir sin ser indexado por los motores de búsqueda

El iframe utiliza los siguientes valores en el atributo sandbox:

  • allow-scripts
  • allow-forms
  • allow-top-navigation
  • allow-popups
  • allow-modals
  • allow-popups-to-escape-sandbox

Los nombres de los valores son auto explicativos. Digamos que te permite cierto "movimiento" para hacer algunas cosas con JS. El tema pasa por la naturaleza del contenido compartido. Al no haber involucrada una base de datos, o cuentas de usuarios en el contenido, se mitiga los riesgos de un posible ataque, aunque no conviene nunca desestimar el ingenio humano. Alguien podría encontrarle un uso no muy amable a esta técnica. 

A modo de conclusión que esto se está haciendo muy largo

La idea original de este artículo era mostrar una forma de compartir contenido que no pueda ser indexado por los motores de búsqueda. Y efectivamente itty.bitty no puede ser indexado porque el contenido no persiste en ningún lado. Solo en la URL, que es interpretada "al vuelo" por el browser y nunca enviada a un servidor. 

Si alguna vez tendrá algún escenario de uso masivo, no lo sé. Puede que no. Por ahora está más limitado a deslumbrar a aquellos que pueden darse cuenta del ingenio que hay en concebir algo como itty.bitty.

Como siempre, agradecer a los creadores: Nicholas Jitkoff y, porque no, a Borges, que nos prestó su hermoso "Poema conjetural" para ilustrar el funcionamiento de itty.bitty (y así confundimos un poco más a la IA de Google).

Escribir sin ser indexado por los motores de búsqueda

¡Nos vemos! Peace. ✌

 

Comentarios