Sam Altman pidió a los usuarios que compartieran sus ‘prompts’ para después crear y publicar los videos.
La semana pasada, Sam Altman retó a sus seguidores a través de su perfil de X.
Para demostrar la capacidad de Sora, una nueva herramienta de inteligencia artificial generativa para crear videos, pidió a los usuarios que le enviaran prompts para que la herramienta los realizara:
«Nos gustaría mostrarte lo que Sora puede hacer. Por favor, responde con tus captions para los videos que te gustaría ver ¡y comenzaremos a hacer algunos!»
Los usuarios no tardaron en responderle al ejecutivo, quien se encargó de publicar el resultado de algunos de estos videos en la plataforma.
Un usuario llamado Matt Schilcht pidió: «Un pato mitad pato, mitad dragón, vuela a través de un hermoso atardecer con un hámster vestido con equipo de aventura en su espalda.»
Esto es lo que obtuvo:
Deep Thrill solicitó: «Un recorrido a nivel de calle a través de una ciudad futurista que está en armonía con la naturaleza y al mismo tiempo es ciberpunk/de alta tecnología. La ciudad debería estar limpia, con tranvías futuristas avanzados, hermosas fuentes, gigantescos hologramas por todas partes y robots por doquier».
Sora se encargó de crear el sitio:
Cate Bligh pidió algo más realista: «Una sesión de cocina instructiva para hacer gnocchi caseros, presentada por una influencer de redes sociales que es abuela, ubicada en una rústica cocina campestre toscana con iluminación cinematográfica».
He aquí el resultado:
Sora, la herramienta de IA que promete revolucionar la creación de videos
A través de un comunicado en su página web, OpenAI hizo oficial el lanzamiento de Sora y explicó que ha concedido acceso a la herramienta a un grupo de creadores visuales, diseñadores y cineastas para que empiecen a experimentar con ella.
El comunicado explica: «Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. El modelo comprende no solo lo que el usuario ha solicitado en el comando, sino también cómo esas cosas existen en el mundo físico».
El modelo funciona de manera similar a DALL-E, la herramienta de Open AI para generar imágenes a partir de una entrada de texto, pero entregando al usuario pequeños fragmentos de video.
La empresa explicó que el modelo actual aún tiene algunas debilidades: «Puede tener dificultades para simular con precisión la física de una escena compleja y puede no entender casos específicos de causa y efecto. Por ejemplo, una persona podría darle un mordisco a una galleta, pero después, la galleta puede no tener una marca de mordida. El modelo también puede confundir detalles espaciales de un comando, por ejemplo, mezclar izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que ocurren a lo largo del tiempo, como seguir una trayectoria de cámara específica».
Pero como sea, los resultados son en verdad prometedores.Sora todavía no está disponible al público en general y OpenAI ha explicado que la probará ampliamente antes de liberarla, poniendo especial énfasis en blindarla para que no pueda ser utilizada para la creación de contenido nocivo.
Artículo tomado de Entrepreneur, lea el original aquí.