Open AI utilizó sin autorización contenido de YouTube para entrenar GPT4

OpenAI desarrolló su modelo de transcripción de audio Whisper, que transcribió más de un millón de horas de videos de YouTube para entrenar a GPT-4. Se acerca una posible crisis de entrenamiento por falta de contenido para 2028,

Curiosidades 10 de abril de 2024 3300.com.ar 3300.com.ar
openai-yt
OpenAI y YouTube Entrenamiento

Los modelos lingüísticos grandes (LLM) requieren de una gran cantidad de datos para su entrenamiento, pero estos no son infinitos.  Una investigación del The New York Times ha revelado que para no quedarse sin datos de entrenamiento, recurrieron al uso de herramientas de terceros sin el permiso indicado.

Whisper es la herramienta en cuestión, un modelo de transcripción de audio a texto, que permitió usar los vídeos de YouTube como fuente amplia de textos de entrenamiento. 
La cantidad de horas de video analizando, superó el millón de horas, una enorme cantidad de audio útil para entrenar a GPT4.

Después de hacer pública la investigación, YouTube consideró que OpenAI había violado sus términos de servicio y uso, tanto de YouTube como de toda su comunidad de creadores de contenido.

El Wall Street Journal ya venía informando sobre una posible crisis de entrenamiento por falta de contenido para 2028, sugiriendo como alternativa, al aprendizaje curricular como posible solución.

Te puede interesar
Lo más visto
tiktok-ceo

EE.UU. quiere prohibir TikTok en su territorio

3300.com.ar
Empresas/Negocios 22 de abril de 2024

Durante los últimos años, Estados Unidos debate la prohibición de TikTok, propiedad de la china ByteDance. El motivo son múltiples acusaciones ligadas a la seguridad y la gestión de publicidad encubierta ligada al régimen chino.

netflix-ads

Netflix más barato, pero con anuncios

3300.com.ar
Empresas/Negocios 23 de abril de 2024

Netflix ha puesto a disposición de todos los usuarios un nuevo plan con anuncios. Los patrocinios ya están disponibles en Estados Unidos y se habilitarán en 2024 en todo el mundo para cubrir títulos de películas, series, eventos en vivo y otro tipo de contenido audiovisual.

uberlegal

Uber legal en Posadas, Misiones

3300.com.ar
Misiones 25 de abril de 2024

Se aprobó el uso de UBER en el municipio. Se exigirá licencia profesional, seguro del pasajero y que el auto esté radicado en la ciudad de Posadas.

google-apple

Enemigo Amigo

3300.com.ar
Empresas/Negocios 04 de mayo de 2024

Google pagó a Apple 18.000 millones de dolares para seguir siendo el búscador predeterminado en todos los dispositivos Mac, iPad y iPhone. Este acuerdo lleva lleva años y sirve a Google seguir en una posición dominante.

audible-amazon

Revolución en el mundo del libro

3300.com.ar
Cultura 10 de mayo de 2024

Más de 40.000 libros fueron narrados con IA en la plataforma Audible de Amazon. Cumpliendo algunos requisitos básicos, se pueden procesar libros completos en poco mas de una hora.