Las grandes empresas tecnológicas se han topado con un muro No lo vieron venir. Un muro que puede haber surgido para frenar el avance que ha experimentado la inteligencia artificial en los últimos meses.
Es sobre la falta de información. La tecnología subyacente a la IA generativa, los modelos de lenguaje grande (LLM), requiere una inmensa cantidad de datos para entrenarse. Los LLM requieren tanta información que probablemente no habrá suficiente, ya que lo que actualmente está disponible abiertamente en Internet no será suficiente.
Esto lleva a gigantes tecnológicos como Meta, la empresa matriz de Facebook, Instagram y WhatsApp, o a startups pioneras como OpenAI, el desarrollador de ChatGPT, a intentar encontrar sus propias soluciones.
La información fue publicada hace apenas unos días. New York Times reveló esto Meta está tan desesperado por obtener datos Para entrenar sus modelos de inteligencia artificial, la empresa habría considerado comprar una importante editorial estadounidense como Simon & Schuster y correr el riesgo de ser demandada por derechos de autor.
En el caso de AbiertoAIla startup ha confirmado ocasionalmente que utiliza un Robot araña para buscar en Internet para poder recopilar información para entrenar su modelo de IA. Esta técnica se conoce como “raspado” e implica una práctica de dudosa legalidad lo cual ha sido cuestionado por muchos expertos en ciberseguridad.
Esta técnica sería utilizada por Spy Pet, un sitio web espía que recopila datos sobre los usuarios de Discord, incluidos los mensajes que publican en servidores de todo tipo. Así lo publicó. 404 significaque ha podido acceder a los servicios ofrecidos por esta plataforma y ha descrito detalladamente su funcionamiento interno.
Aparentemente, Spy Pet escanea masivamente servidores de Discord, archiva y rastrea mensajes de los usuarios y sus actividades en los servidores (incluidos los canales de voz a los que se unen) y luego venden el acceso a esa información por tan solo 5 dólares.
El desarrollador de este servicio afirma en su sitio web que rastrea más de diez mil servidores de Discord y más allá. Vender acceso a cualquier persona con criptomonedasTambién proporciona datos para entrenar modelos de inteligencia artificial o para apoyar a las autoridades.
“¿Alguna vez te has preguntado dónde está tu amigo en Discord? ¿Estás cansado de herramientas de búsqueda simples como Discord.id? No busques más”, dice el sitio web de Spy Pet.
Respectivamente 404 significaEste servicio rastrea más de 14.000 servidores, 600 millones de usuarios e incluye una base de datos de más de 3 mil millones de mensajes. El medio de comunicación centrado en la tecnología dijo que no podía verificar la exactitud de estas cifras, pero confirmó que el servicio extrae mensajes de los servidores de Discord y los pone a disposición de los clientes que pagan junto con otros datos de los usuarios.
El servicio requiere un pago mínimo de $5 en criptomonedas.Se aceptan Bitcoin, Ethereum o Monero.– y a cambio, los clientes reciben 500 créditos Spy Pet. La búsqueda de un solo usuario cuesta aparentemente 10 créditos, lo que equivale a unos 47 céntimos.
Comments