Amazon Investiga a Perplexity AI por Raspado de Contenido y Violación del Protocolo de Exclusión de Robots

Amazon Investiga a Perplexity AI por Raspado de Contenido y Violación del Protocolo de Exclusión de Robots

Investigación de Amazon sobre Perplexity AI

Amazon ha iniciado una investigación sobre Perplexity AI, una startup de búsqueda impulsada por inteligencia artificial, debido a acusaciones de raspado de contenido de sitios de noticias prominentes sin permiso. Estas alegaciones han generado un gran revuelo en la industria, especialmente porque Perplexity AI supuestamente ignoró el Protocolo de Exclusión de Robots que prohíbe el acceso automatizado a ciertas páginas web.

El Protocolo de Exclusión de Robots se basa en colocar un archivo de texto plano en el dominio del sitio web para especificar las páginas que no deben ser accedidas por rastreadores automatizados, aunque no es legalmente vinculante, es generalmente seguido como una práctica común. Amazon Web Services (AWS), la plataforma en la que se aloja el servidor de Perplexity, requiere que sus clientes cumplan con este estándar y prohíben actividades ilegales por parte de los usuarios de sus servicios.

Respuesta y Evidencia

Un portavoz de Perplexity AI declaró que sus operaciones cumplen con los Términos de Servicio de AWS y respetan los archivos robots.txt, pero reconoció que su bot puede ocasionalmente ignorar estos archivos cuando un usuario ingresa una URL específica. Sin embargo, investigaciones realizadas por WIRED encontraron evidencia de abuso de scraping y plagio asociados con la búsqueda impulsada por IA de Perplexity, incluyendo el acceso a propiedades de Condé Nast a pesar de estar bloqueadas por robots.txt.

El incidente tomó mayor relevancia cuando la dirección IP vinculada a Perplexity se rastreó hasta una instancia de Elastic Compute Cloud (EC2) en AWS, lo que impulsó a la plataforma a lanzar una investigación formal. Esta conexión directa con los servicios de Amazon destaca la gravedad de las acusaciones y la necesidad de una evaluación detallada.

Preocupaciones de la Industria y Plagio

La asociación comercial Digital Content Next expresó sus preocupaciones sobre posibles violaciones de derechos de autor por parte de empresas de IA como Perplexity, que podrían estar ignorando los términos de servicio y las directivas de robots.txt. Estas preocupaciones reflejan un temor más amplio dentro de la industria sobre cómo las tecnologías de inteligencia artificial pueden poner en riesgo la propiedad intelectual y los permisos de contenido.

Además, Perplexity ha enfrentado críticas por plagio e invenciones de citas falsas de personas reales, con el CEO Aravind Srinivas admitiendo la necesidad de resaltar más prominente las fuentes. Aunque la investigación sigue en curso y Amazon aún no ha tomado ninguna medida contra Perplexity, este caso subraya la importancia de que las empresas respeten los derechos de propiedad intelectual y cumplan con las normativas establecidas.

Comentarios