Inteligencia artificial

Google lanza Gemini 3.1 Flash-Lite, su modelo de IA más económico: rapidez y bajo coste por encima de todo

Llega Gemini 3.1 Flash-Lite, un modelo multimodal que apuesta por la eficiencia y la economía para tareas cada vez más necesarias

Google ha publicado la versión preliminar de Gemini 3.1 Flash-Lite, el modelo que ocupa el escalón más bajo de su familia en términos de coste y latencia. No está pensado para razonar sobre problemas complejos ni para competir con Gemini Pro en capacidades avanzadas. Su propósito es otro: procesar enormes volúmenes de tareas sencillas al menor coste posible y con la menor espera.

El modelo acepta texto, imágenes, vídeo, audio y PDF como entrada, y genera únicamente texto como salida. Su ventana de contexto admite hasta un millón de tokens de entrada, con un límite de salida de 65.536 tokens. Está disponible a través de Google AI Studio bajo el identificador gemini-3.1-flash-lite-preview, con fecha de conocimiento hasta enero de 2025.

Traducción masiva, transcripción y enrutamiento de modelos, sus casos de uso principales

Google orienta explícitamente este modelo a escenarios donde el presupuesto y la velocidad mandan sobre la profundidad de razonamiento. La traducción a gran escala es uno de sus usos más directos: procesar miles de mensajes, reseñas o tickets de atención al cliente en otros idiomas sin el coste asociado a modelos más potentes.

También resulta útil para transcripción de audio, extracción de datos estructurados desde documentos o reseñas y resumen de PDF en flujos de procesamiento automatizados. Uno de los casos de uso más interesantes es el enrutamiento de modelos: usar Flash-Lite como clasificador que analiza la complejidad de cada petición entrante y decide si debe responderla él mismo o derivarla a un modelo más avanzado como Gemini Pro. La propia interfaz de línea de comandos de Gemini ya usa esta arquitectura en producción.

El modelo también soporta pensamiento paso a paso configurable, lo que permite mejorar la precisión en tareas que se benefician de un razonamiento más estructurado, aunque sin llegar a las capacidades de los modelos de la gama alta. Entre las funciones compatibles se incluyen llamadas a herramientas, resultados estructurados en JSON, búsqueda fundamentada y caché de contexto. No admite generación de imágenes, audio ni el uso de ordenador.

Te interesa 👉 Google lanza Gemini 3 Flash gratis para todos: una IA rápida que logra superar a GPT-5.2 en pruebas clave

La apuesta de Google es clara: a medida que los sistemas de IA se despliegan en producción con millones de llamadas diarias, el coste por token se convierte en una variable crítica. Flash-Lite busca ese hueco donde la potencia importa menos que la escala y la eficiencia.

Siguiente Microsoft prepara Copilot Canvas, una pizarra con IA que genera imágenes y responde en tiempo real mientras dibujas »

Anterior « Todo tipo de periféricos a precio mínimo histórico en los Días Naranja de PcComponentes

AMD desafía a Nvidia en la IA: AMD Helios costará hasta un 40% más que la arquitectura Rubin

AMD está dispuesta a cambiar las reglas del juego en el mercado de la inteligencia…

1 hora atrás

Tarjetas gráficas

Nvidia Rubin: Hasta 336 mil millones de transistores y 288 GB de HBM4

Nvidia ha revelado oficialmente los detalles completos de su nueva generación de procesadores gráficos para…

6 horas atrás

Procesadores

Nvidia desvela la arquitectura de CPU Vera con 88 núcleos Olympus y memoria LPDDR5X a 1.2 TB/s

Nvidia ha publicado nuevos detalles sobre su esperada CPU Vera, diseñada específicamente para centros de…

7 horas atrás