Filtración de Datos en la Plataforma de IA DeepSeek: Un Análisis Exhaustivo

La plataforma china de inteligencia artificial generativa, DeepSeek, ha experimentado un crecimiento impresionante en la última semana, lo que ha intensificado las rivalidades en el sector y ha generado presión en el mercado para las empresas de IA basadas en Estados Unidos. Este auge ha atraído la atención y el escrutinio hacia los servicios que ofrece la compañía. En medio de este revuelo, investigadores de una firma de seguridad en la nube han revelado el descubrimiento de una base de datos crítica de DeepSeek que fue dejada expuesta en internet, lo que resultó en la filtración de registros del sistema, envíos de solicitudes de usuarios e incluso tokens de autenticación de API, alcanzando un total de más de un millón de registros accesibles para cualquier persona que se cruzara con la base de datos.

DeepSeek, siendo una empresa relativamente nueva, ha sido prácticamente inaccesible para la prensa y otras organizaciones durante esta semana. A pesar de los intentos de contacto, la compañía no ha respondido de inmediato a las solicitudes de información sobre la exposición de su base de datos. Los investigadores mencionan que tuvieron dificultades para comunicar sus hallazgos a la empresa y optaron por enviar la información a todas las direcciones de correo electrónico y perfiles de LinkedIn que pudieron encontrar o adivinar. Aunque no han recibido respuesta, en cuestión de media hora tras su intento de contacto masivo, la base de datos que descubrieron fue bloqueada y se volvió inaccesible para usuarios no autorizados. Sin embargo, no está claro si algún actor malicioso o parte autorizada accedió o descargó los datos antes de que esto sucediera.

“Es cierto que pueden ocurrir errores, pero este es un error dramático, porque el nivel de esfuerzo es muy bajo y el nivel de acceso que obtuvimos es muy alto”, comenta un experto en ciberseguridad. “Esto indica que el servicio no está maduro para manejar ningún dato sensible”.

El problema de las bases de datos expuestas, accesibles para cualquier persona en internet, ha sido un tema recurrente que instituciones y proveedores de servicios en la nube han estado tratando de resolver lentamente. Sin embargo, los investigadores notan que la base de datos de DeepSeek que encontraron era visible casi de inmediato con un escaneo o sondeo mínimo.

“Normalmente, cuando encontramos este tipo de exposiciones, se trata de algún servicio descuidado que nos lleva horas localizar—horas de escaneo”, señala un especialista en investigación de vulnerabilidades. “Pero esta vez, estaba justo en la puerta de entrada”. Además, añade que “la dificultad técnica de esta vulnerabilidad es la mínima posible”.

Los investigadores indican que la base de datos que encontraron parece ser un tipo de base de datos de código abierto, comúnmente utilizada para análisis de servidores, conocida como base de datos ClickHouse. La información expuesta respaldaba esta afirmación, dado que había archivos de registro que contenían las rutas o caminos que los usuarios habían tomado a través de los sistemas de DeepSeek, así como las solicitudes de los usuarios y otras interacciones con el servicio, incluyendo las claves de API que utilizaron para autenticarse. Las solicitudes que los investigadores observaron estaban en chino, aunque es posible que la base de datos también contuviera solicitudes en otros idiomas. Los investigadores afirmaron que realizaron la evaluación mínima necesaria para confirmar sus hallazgos sin comprometer innecesariamente la privacidad de los usuarios, pero especulan que incluso podría haber sido posible para un actor malicioso utilizar dicho acceso profundo a la base de datos para moverse lateralmente hacia otros sistemas de DeepSeek y ejecutar código en otras partes de la infraestructura de la empresa.

Resultados Importantes

AspectoDetalles
Filtración de DatosMás de 1 millón de registros expuestos, incluyendo logs del sistema y tokens de autenticación de API.
AccesibilidadLa base de datos fue visible casi de inmediato con un escaneo mínimo, lo que indica una falta de seguridad.
ConsecuenciasPosibilidad de que actores maliciosos accedieran a datos sensibles y se movieran lateralmente en la infraestructura de la empresa.

Puntos Clave

  • DeepSeek ha dejado expuesta una base de datos crítica, poniendo en riesgo la información de sus usuarios.
  • El acceso a la base de datos fue sorprendentemente fácil, lo que pone de manifiesto fallas en la seguridad de la plataforma.
  • Los investigadores advierten que la falta de madurez del servicio podría resultar en graves problemas de seguridad en el manejo de datos sensibles.