Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Fernando Puente
Fernando PuenteCOO/IT Consultant à Embajador de marca de Raiola Networks
Protege a tu rey
Defiende tu contenido de amenazas,
scraping, IA o malos actores
FERNANDO PUENTE
Content is King
“El contenido es de donde espero que se
obtenga el dinero real en Internet”
Bill Gates (January 3, 1996)
Fernando Puente
Informático de vocación y de profesión, formador ocasional
y un enamorado de comer y beber.
● Embajador de marca de Raiola Networks
● Profesor Curso Superior de Periodismo Deportivo
● Consultor especializado en Web Performance
@fpuenteonline
linkedin.com/in/fpuente/
Protegiendo el contenido
Solución
Legal y sencilla
Detallar en los términos y
condiciones de uso las
Condiciones Generales y las
responsabilidades derivadas del
acceso y la utilización de sus
contenidos
Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos
son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de
explotación de los mismos en cualquier forma y en especial, los derechos de reproducción,
distribución, comunicación pública y transformación, de acuerdo con la legislación española y de
la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo
relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por
terceros), que habilita a un uso personal y no comercial de la propia información por parte de
los Usuarios.
TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su
caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros.
Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación
pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o
modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera
reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines
comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así
mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de
imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la
técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las
responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la
LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a
terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad
informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede
licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual
y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente,
con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o
modificación de los contenidos y de cualquier otro elemento.
Protege tu contenido de
visitantes
Humanos
Deshabilitar menú contextual (click derecho)
* Usuarios avanzados pueden acceder al contenido
* Posibilidad de usar plugins del repositorio
Deshabilitar selección de texto
* Usuarios avanzados pueden acceder al contenido
Estrategias de protección adicional
● Marcas de agua y/o copyright en contenido multimedia
● Metadatos en imágenes
● Muro de pago/Paywall
● Registro de usuario o modelo freemium
● Generar el contenido dinámicamente (Javascript)
● Acceso condicional al contenido (restringir por usuario,
zona geográfica o número de visitas/páginas)
* SEO y UX pueden verse afectados de manera importante
* Metadatos y marcas de agua pueden ser eliminadas
Protección ante traducciones de la página
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protección ante traducciones de elementos
* Existen herramientas/extensiones que no obedecen a estas etiquetas
Protege tu contenido de
visitantes
No solo SEOcotillas
Qué buscan las herramientas SEO
● Enlazado interno/externo
● Estructura web
● Palabras clave
● Datos sensibles o de negocio
● Contenido
Protección anti-competencia
● Eliminar feeds de contenido/Crear feeds incompletos
● Bloquear/moderar comentarios
● Marcas de agua en imágenes
● Habilitar la protección de hotlink
● Deshabilitar incrustado como iframe
* Hotlink puede afectar al contenido compartido en medios fuera de la web
Bloquear competencia (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Reforzar la seguridad de tu sitio
● Proveedor de hosting de confianza
● Certificado de seguridad
● WordPress y componentes actualizados
● Capas adicionales de seguridad (plugin, WAF, htaccess…)
● Política de roles, usuarios y contraseñas
● Entornos de test y producción (actualizaciones y cambios)
● En general, buenas prácticas
En último caso
● Publicar un aviso de eliminación DMCA (Digital
Millennium Copyright Act)
● Solicitar retirada de contenido por infracciones de derechos
de autor en buscadores
Protege tu contenido de
enlaces dañinos
Disavow links
Desautorizar enlaces
1. Identificar (fraudulentos, artificiales o de baja calidad)
2. Crear lista de enlaces a desautorizar
3. Subir lista por buscador:
https://search.google.com/search-console/disavow-links
Protege tu contenido de
visitantes
No humanos
Estrategias anti-scraping
● Reglas específicas en archivo robots.txt
● Filtrar user-agent
● Bloquear servidores por IP
● Añadir Completely Automated Public Turing test to
tell Computers and Humans Apart (aka CAPTCHA)
● Colocar «honeypots»
● Desativar feed
● Bloquear REST API
Proteger el sitio de scrapeadores (user-agent)
* Pueden realizar el rastreo usando el user agent de Google
Desactivar el feed
Proteger acceso a WordPress REST API
Protege tu contenido de
redes sociales
Difusión
Proteger cómo compartir el contenido
● Marcas de agua y/o copyright en contenido multimedia
● Metadata y etiquetas Open Graph falsas
● Bloqueo, contenido erróneo o redirección para bots
(facebookexternalhit, Twitterbot, TelegramBot,
LinkedInBot…)
* SEO puede verse afectado de manera importante
Protege tu contenido de
motores de búsqueda
Invisibilidad
Proteger el sitio de ser rastreado e indexado
* Cualquier contenido, no solo HTML
Proteger el sitio de ser indexado
* Solo HTML
Proteger cada página de ser almacenada
* Solo HTML
* Aplica a la caché de Google
Protege tu contenido de la
Inteligencia Artificial
Base de conocimiento
Proteger del entrenamiento
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
varios modelos LLM utilizando Common Crawl)
* Puede cambiar en el futuro
Proteger del entrenamiento (nuevo)
* No funciona en todos los modelos de entrenamiento (ejemplo basado en
OpenAI’s web crawler)
* https://platform.openai.com/docs/gptbot (agosto/2023)
Proteger del acceso
* Sólo usado por los plugins de ChatGPT para acceso (live query), no
entrenamiento
* Puede cambiar en el futuro
¿La mejor defensa es un
buen ataque?
Gracias
1 sur 38

Recommandé

Redes sociales nov. 2011 [tanoira cassagne] par
Redes sociales nov. 2011  [tanoira cassagne]Redes sociales nov. 2011  [tanoira cassagne]
Redes sociales nov. 2011 [tanoira cassagne]juanpozzo
517 vues36 diapositives
Contenidos creados por usuarios en Redes Sociales. Cuestiones Jurídicas par
Contenidos creados por usuarios en Redes Sociales. Cuestiones JurídicasContenidos creados por usuarios en Redes Sociales. Cuestiones Jurídicas
Contenidos creados por usuarios en Redes Sociales. Cuestiones JurídicasJesús Martín Calvo
336 vues12 diapositives
Derechos de los usuarios de redes sociales par
Derechos de los usuarios de redes socialesDerechos de los usuarios de redes sociales
Derechos de los usuarios de redes socialesAbanlex
504 vues12 diapositives
Privacidad en Internet par
Privacidad en InternetPrivacidad en Internet
Privacidad en InternetJose Manuel Ortega Candel
181 vues3 diapositives
Clase 4 tecno i- 2019 par
Clase 4  tecno i- 2019Clase 4  tecno i- 2019
Clase 4 tecno i- 2019Viviana Mercedes Ponce
845 vues60 diapositives
Clase 4 tecno i- 2018 par
Clase 4  tecno i- 2018Clase 4  tecno i- 2018
Clase 4 tecno i- 2018Viviana Mercedes Ponce
466 vues54 diapositives

Contenu connexe

Similaire à Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

Que es la ley sopa par
Que es la ley sopaQue es la ley sopa
Que es la ley sopagero31
85 vues1 diapositive
Aviso Legal par
Aviso LegalAviso Legal
Aviso Legalaurapark
172 vues8 diapositives
Comunicación Web y Social Media par
Comunicación Web y Social MediaComunicación Web y Social Media
Comunicación Web y Social MediaLucila Voces de Barro
160 vues22 diapositives
Terminos y condiciones de uso par
Terminos y condiciones de usoTerminos y condiciones de uso
Terminos y condiciones de usoPortal Educativo Colombia Aprende
214 vues6 diapositives
Banner par
BannerBanner
BannerLeiidy Siierra Torres
121 vues7 diapositives
Web 2.0 par
Web 2.0Web 2.0
Web 2.0Angelica Mendoza
193 vues4 diapositives

Similaire à Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores(20)

Que es la ley sopa par gero31
Que es la ley sopaQue es la ley sopa
Que es la ley sopa
gero3185 vues
Aviso Legal par aurapark
Aviso LegalAviso Legal
Aviso Legal
aurapark172 vues
El derecho a la privacidad del usuario en relación a las políticas de uso par Software Guru
 El derecho a la privacidad del usuario en relación a las políticas de uso El derecho a la privacidad del usuario en relación a las políticas de uso
El derecho a la privacidad del usuario en relación a las políticas de uso
Software Guru673 vues
Blogueras Barcelona Aspectos Legales par AvaticAbogados
Blogueras Barcelona Aspectos LegalesBlogueras Barcelona Aspectos Legales
Blogueras Barcelona Aspectos Legales
AvaticAbogados606 vues
propuesta tecica y economica.pdf par jorge977764
propuesta tecica y economica.pdfpropuesta tecica y economica.pdf
propuesta tecica y economica.pdf
jorge977764145 vues
Taller SEO. Asier Barainka par andalucialab
Taller SEO. Asier BarainkaTaller SEO. Asier Barainka
Taller SEO. Asier Barainka
andalucialab469 vues

Plus de Fernando Puente

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto… par
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…Fernando Puente
57 vues21 diapositives
Qué es y para que sirve la carga condicional par
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicionalFernando Puente
41 vues33 diapositives
Optimiza tus webs a bajo costo - WCVenezuela2021 par
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021Fernando Puente
105 vues20 diapositives
WordPress y cómo llegar al 50% de Internet par
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de InternetFernando Puente
79 vues30 diapositives
Mitos y realidades sobre el WPO en WordPress par
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPressFernando Puente
285 vues35 diapositives
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress par
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressFernando Puente
371 vues41 diapositives

Plus de Fernando Puente(20)

¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto… par Fernando Puente
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
¿Te preocupa el rendimiento de tu web? No deberías estar haciendo esto…
Fernando Puente57 vues
Qué es y para que sirve la carga condicional par Fernando Puente
Qué es y para que sirve la carga condicionalQué es y para que sirve la carga condicional
Qué es y para que sirve la carga condicional
Fernando Puente41 vues
Optimiza tus webs a bajo costo - WCVenezuela2021 par Fernando Puente
Optimiza tus webs a bajo costo - WCVenezuela2021Optimiza tus webs a bajo costo - WCVenezuela2021
Optimiza tus webs a bajo costo - WCVenezuela2021
Fernando Puente105 vues
WordPress y cómo llegar al 50% de Internet par Fernando Puente
WordPress y cómo llegar al 50% de InternetWordPress y cómo llegar al 50% de Internet
WordPress y cómo llegar al 50% de Internet
Fernando Puente79 vues
Mitos y realidades sobre el WPO en WordPress par Fernando Puente
Mitos y realidades sobre el WPO en WordPressMitos y realidades sobre el WPO en WordPress
Mitos y realidades sobre el WPO en WordPress
Fernando Puente285 vues
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress par Fernando Puente
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPressHTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
HTTP/3, PHP 7.4 y otras novedades en WPO para WordPress
Fernando Puente371 vues
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019 par Fernando Puente
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
El editor clásico como ejemplo de deuda tecnológica - WordCamp Granada 2019
Fernando Puente129 vues
Tipologías de migración - WordCamp Valencia 2019 par Fernando Puente
Tipologías de migración - WordCamp Valencia 2019Tipologías de migración - WordCamp Valencia 2019
Tipologías de migración - WordCamp Valencia 2019
Fernando Puente472 vues
Básicos para medir tu web - Taller de iniciación par Fernando Puente
Básicos para medir tu web - Taller de iniciaciónBásicos para medir tu web - Taller de iniciación
Básicos para medir tu web - Taller de iniciación
Fernando Puente136 vues
Primeros pasos con WPO: aprende a analizar tu web - Taller par Fernando Puente
Primeros pasos con WPO: aprende a analizar tu web - TallerPrimeros pasos con WPO: aprende a analizar tu web - Taller
Primeros pasos con WPO: aprende a analizar tu web - Taller
Fernando Puente252 vues
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos! par Fernando Puente
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Tu posicionamiento mejora con la velocidad de tu web ¡WPO para todos!
Fernando Puente446 vues
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ... par Fernando Puente
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
WordPress de la A a la Z. Guía de todos los términos que debes conocer y que ...
Fernando Puente827 vues
Retos de WordPress para llegar al 50% de Internet par Fernando Puente
Retos de WordPress para llegar al 50% de Internet Retos de WordPress para llegar al 50% de Internet
Retos de WordPress para llegar al 50% de Internet
Fernando Puente563 vues
Taller WPO - Carga condicional de plugins par Fernando Puente
Taller WPO - Carga condicional de pluginsTaller WPO - Carga condicional de plugins
Taller WPO - Carga condicional de plugins
Fernando Puente66.2K vues
Extender la funcionalidad de WordPress par Fernando Puente
Extender la funcionalidad de WordPressExtender la funcionalidad de WordPress
Extender la funcionalidad de WordPress
Fernando Puente319 vues

Dernier

Cómo publicar una presentación grafica en internet.pptx par
Cómo publicar una presentación grafica en internet.pptxCómo publicar una presentación grafica en internet.pptx
Cómo publicar una presentación grafica en internet.pptxsharpeymedina
7 vues8 diapositives
Nirvana y su Disco de Nervermind par
Nirvana y su Disco de NervermindNirvana y su Disco de Nervermind
Nirvana y su Disco de Nervermindalexachavezramirez01
12 vues8 diapositives
antena radioenlace....pdf par
antena radioenlace....pdfantena radioenlace....pdf
antena radioenlace....pdfrubenjaradelacruz
5 vues9 diapositives
internet_servicios.pptx par
internet_servicios.pptxinternet_servicios.pptx
internet_servicios.pptxIselaAnairsLpez
45 vues27 diapositives
Presentación marlinda.pdf par
Presentación marlinda.pdfPresentación marlinda.pdf
Presentación marlinda.pdfMarlindaUrbina
6 vues2 diapositives
catalogo_final_web.pdf par
catalogo_final_web.pdfcatalogo_final_web.pdf
catalogo_final_web.pdfFabianGarcia829609
23 vues48 diapositives

Dernier(12)

Cómo publicar una presentación grafica en internet.pptx par sharpeymedina
Cómo publicar una presentación grafica en internet.pptxCómo publicar una presentación grafica en internet.pptx
Cómo publicar una presentación grafica en internet.pptx
sharpeymedina7 vues
Manual para publicar un grafico en SlideShare_Jose Diaz.pptx par josediazreyes823
Manual para publicar un grafico en SlideShare_Jose Diaz.pptxManual para publicar un grafico en SlideShare_Jose Diaz.pptx
Manual para publicar un grafico en SlideShare_Jose Diaz.pptx
Alexandre López-Borrull, Javier Guallar. Curar la verdad, curar la mentira: e... par Javier Guallar
Alexandre López-Borrull, Javier Guallar. Curar la verdad, curar la mentira: e...Alexandre López-Borrull, Javier Guallar. Curar la verdad, curar la mentira: e...
Alexandre López-Borrull, Javier Guallar. Curar la verdad, curar la mentira: e...
Infografia Informativa Bellas Artes Cuadros Simple Llamativa Azul.pdf par LizbethAlarcn4
Infografia Informativa Bellas Artes Cuadros Simple Llamativa Azul.pdfInfografia Informativa Bellas Artes Cuadros Simple Llamativa Azul.pdf
Infografia Informativa Bellas Artes Cuadros Simple Llamativa Azul.pdf
LizbethAlarcn411 vues
Cómo publicar una presentación grafica en internet.docx par vivianaalvare179
Cómo publicar una presentación grafica en internet.docxCómo publicar una presentación grafica en internet.docx
Cómo publicar una presentación grafica en internet.docx

Protege a tu rey. Defiende tu contenido de amenazas, scraping, IA o malos actores

  • 1. Protege a tu rey Defiende tu contenido de amenazas, scraping, IA o malos actores FERNANDO PUENTE
  • 2. Content is King “El contenido es de donde espero que se obtenga el dinero real en Internet” Bill Gates (January 3, 1996)
  • 3. Fernando Puente Informático de vocación y de profesión, formador ocasional y un enamorado de comer y beber. ● Embajador de marca de Raiola Networks ● Profesor Curso Superior de Periodismo Deportivo ● Consultor especializado en Web Performance @fpuenteonline linkedin.com/in/fpuente/
  • 6. Detallar en los términos y condiciones de uso las Condiciones Generales y las responsabilidades derivadas del acceso y la utilización de sus contenidos
  • 7. Los derechos de propiedad intelectual del Sitio Web de los distintos elementos en ella contenidos son titularidad de la Sociedad, a quien corresponde el ejercicio exclusivo de los derechos de explotación de los mismos en cualquier forma y en especial, los derechos de reproducción, distribución, comunicación pública y transformación, de acuerdo con la legislación española y de la unión europea aplicable. Así mismo, el Sitio Web es fruto de la información de cualquier tipo relacionada con las actividades de la Sociedad (información creada por la Sociedad o creada por terceros), que habilita a un uso personal y no comercial de la propia información por parte de los Usuarios. TODOS LOS DERECHOS RESERVADOS en relación con los contenidos de la Sociedad, del Medio y, en su caso, de otras empresas del grupo de la empresa del cual forma parte la Sociedad o de terceros. Queda prohibida la reproducción total o parcial, distribución, puesta a disposición, comunicación pública y utilización, total o parcial, de los contenidos de esta web, en cualquier forma o modalidad, sin previa, expresa y escrita autorización, incluyendo, en particular, su mera reproducción y/o puesta a disposición como resúmenes, reseñas o revistas de prensa con fines comerciales o directa o indirectamente lucrativos, a la que se manifiesta oposición expresa. Así mismo, también queda prohibida la presentación de páginas del Sitio Web y la inserción de imágenes difundidas en el Sitio Web en páginas no pertenecientes a la Sociedad (sea cual sea la técnica que se use para ello). La utilización no autorizada de estos contenidos dará lugar a las responsabilidades legalmente establecidas. La Sociedad, de conformidad con lo establecido en la LSSI, no responderá de las infracciones realizadas por el Usuario del Sitio Web que afecten a terceros, salvo que la misma tenga un "conocimiento efectivo" de dicha infracción. La Sociedad informa a los Usuarios de que, salvo autorización previa, expresa y por escrito, no concede licencia o autorización expresa o implícita alguna sobre los derechos de propiedad intelectual y/o industrial o sobre cualquier otro derecho o propiedad relacionada, directa o indirectamente, con los contenidos incluidos en el Sitio Web, quedando prohibida cualquier alteración o modificación de los contenidos y de cualquier otro elemento.
  • 8. Protege tu contenido de visitantes Humanos
  • 9. Deshabilitar menú contextual (click derecho) * Usuarios avanzados pueden acceder al contenido * Posibilidad de usar plugins del repositorio
  • 10. Deshabilitar selección de texto * Usuarios avanzados pueden acceder al contenido
  • 11. Estrategias de protección adicional ● Marcas de agua y/o copyright en contenido multimedia ● Metadatos en imágenes ● Muro de pago/Paywall ● Registro de usuario o modelo freemium ● Generar el contenido dinámicamente (Javascript) ● Acceso condicional al contenido (restringir por usuario, zona geográfica o número de visitas/páginas) * SEO y UX pueden verse afectados de manera importante * Metadatos y marcas de agua pueden ser eliminadas
  • 12. Protección ante traducciones de la página * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 13. Protección ante traducciones de elementos * Existen herramientas/extensiones que no obedecen a estas etiquetas
  • 14. Protege tu contenido de visitantes No solo SEOcotillas
  • 15. Qué buscan las herramientas SEO ● Enlazado interno/externo ● Estructura web ● Palabras clave ● Datos sensibles o de negocio ● Contenido
  • 16. Protección anti-competencia ● Eliminar feeds de contenido/Crear feeds incompletos ● Bloquear/moderar comentarios ● Marcas de agua en imágenes ● Habilitar la protección de hotlink ● Deshabilitar incrustado como iframe * Hotlink puede afectar al contenido compartido en medios fuera de la web
  • 17. Bloquear competencia (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 18. Reforzar la seguridad de tu sitio ● Proveedor de hosting de confianza ● Certificado de seguridad ● WordPress y componentes actualizados ● Capas adicionales de seguridad (plugin, WAF, htaccess…) ● Política de roles, usuarios y contraseñas ● Entornos de test y producción (actualizaciones y cambios) ● En general, buenas prácticas
  • 19. En último caso ● Publicar un aviso de eliminación DMCA (Digital Millennium Copyright Act) ● Solicitar retirada de contenido por infracciones de derechos de autor en buscadores
  • 20. Protege tu contenido de enlaces dañinos Disavow links
  • 21. Desautorizar enlaces 1. Identificar (fraudulentos, artificiales o de baja calidad) 2. Crear lista de enlaces a desautorizar 3. Subir lista por buscador: https://search.google.com/search-console/disavow-links
  • 22. Protege tu contenido de visitantes No humanos
  • 23. Estrategias anti-scraping ● Reglas específicas en archivo robots.txt ● Filtrar user-agent ● Bloquear servidores por IP ● Añadir Completely Automated Public Turing test to tell Computers and Humans Apart (aka CAPTCHA) ● Colocar «honeypots» ● Desativar feed ● Bloquear REST API
  • 24. Proteger el sitio de scrapeadores (user-agent) * Pueden realizar el rastreo usando el user agent de Google
  • 26. Proteger acceso a WordPress REST API
  • 27. Protege tu contenido de redes sociales Difusión
  • 28. Proteger cómo compartir el contenido ● Marcas de agua y/o copyright en contenido multimedia ● Metadata y etiquetas Open Graph falsas ● Bloqueo, contenido erróneo o redirección para bots (facebookexternalhit, Twitterbot, TelegramBot, LinkedInBot…) * SEO puede verse afectado de manera importante
  • 29. Protege tu contenido de motores de búsqueda Invisibilidad
  • 30. Proteger el sitio de ser rastreado e indexado * Cualquier contenido, no solo HTML
  • 31. Proteger el sitio de ser indexado * Solo HTML
  • 32. Proteger cada página de ser almacenada * Solo HTML * Aplica a la caché de Google
  • 33. Protege tu contenido de la Inteligencia Artificial Base de conocimiento
  • 34. Proteger del entrenamiento * No funciona en todos los modelos de entrenamiento (ejemplo basado en varios modelos LLM utilizando Common Crawl) * Puede cambiar en el futuro
  • 35. Proteger del entrenamiento (nuevo) * No funciona en todos los modelos de entrenamiento (ejemplo basado en OpenAI’s web crawler) * https://platform.openai.com/docs/gptbot (agosto/2023)
  • 36. Proteger del acceso * Sólo usado por los plugins de ChatGPT para acceso (live query), no entrenamiento * Puede cambiar en el futuro
  • 37. ¿La mejor defensa es un buen ataque?