Inteligencia artificial

Google lanza Gemini 3.1 Flash-Lite, su modelo de IA más económico: rapidez y bajo coste por encima de todo

Llega Gemini 3.1 Flash-Lite, un modelo multimodal que apuesta por la eficiencia y la economía para tareas cada vez más necesarias

Google ha publicado la versión preliminar de Gemini 3.1 Flash-Lite, el modelo que ocupa el escalón más bajo de su familia en términos de coste y latencia. No está pensado para razonar sobre problemas complejos ni para competir con Gemini Pro en capacidades avanzadas. Su propósito es otro: procesar enormes volúmenes de tareas sencillas al menor coste posible y con la menor espera.

El modelo acepta texto, imágenes, vídeo, audio y PDF como entrada, y genera únicamente texto como salida. Su ventana de contexto admite hasta un millón de tokens de entrada, con un límite de salida de 65.536 tokens. Está disponible a través de Google AI Studio bajo el identificador gemini-3.1-flash-lite-preview, con fecha de conocimiento hasta enero de 2025.

Traducción masiva, transcripción y enrutamiento de modelos, sus casos de uso principales

Google orienta explícitamente este modelo a escenarios donde el presupuesto y la velocidad mandan sobre la profundidad de razonamiento. La traducción a gran escala es uno de sus usos más directos: procesar miles de mensajes, reseñas o tickets de atención al cliente en otros idiomas sin el coste asociado a modelos más potentes.

También resulta útil para transcripción de audio, extracción de datos estructurados desde documentos o reseñas y resumen de PDF en flujos de procesamiento automatizados. Uno de los casos de uso más interesantes es el enrutamiento de modelos: usar Flash-Lite como clasificador que analiza la complejidad de cada petición entrante y decide si debe responderla él mismo o derivarla a un modelo más avanzado como Gemini Pro. La propia interfaz de línea de comandos de Gemini ya usa esta arquitectura en producción.

El modelo también soporta pensamiento paso a paso configurable, lo que permite mejorar la precisión en tareas que se benefician de un razonamiento más estructurado, aunque sin llegar a las capacidades de los modelos de la gama alta. Entre las funciones compatibles se incluyen llamadas a herramientas, resultados estructurados en JSON, búsqueda fundamentada y caché de contexto. No admite generación de imágenes, audio ni el uso de ordenador.

Te interesa 👉 Google lanza Gemini 3 Flash gratis para todos: una IA rápida que logra superar a GPT-5.2 en pruebas clave

La apuesta de Google es clara: a medida que los sistemas de IA se despliegan en producción con millones de llamadas diarias, el coste por token se convierte en una variable crítica. Flash-Lite busca ese hueco donde la potencia importa menos que la escala y la eficiencia.

Recent Posts

  • NAS

QNAP TS-h966TX, TS-h666TX, TS-h866TX, TS-h1066TX y TS-467X: los NAS para producción audiovisual en 8K de QNAP

QNAP también ha reservado una parte importante de su presencia en Computex 2026 a la…

8 horas atrás
  • Noticias

QNAP lleva ADRA NDR X y el switch QSW-M7230-2X4F24T a Computex 2026 para unir red, ciberseguridad y videovigilancia

El stand de QNAP en el Computex de este año ha dado de sí. La…

8 horas atrás
  • NAS

Así son los AI NAS de QNAP con 6 y 8 bahías que hemos visto a QuAgent y Qsirch 7.1.0 en el Computex 2026

QNAP en el Computex 2026 también se ha enfocado en la inteligencia artificial ejecutada dentro…

8 horas atrás