Google lanza Gemini 1.5 Flash-8B: su IA más pequeña y barata

Google acaba de anunciar una importante actualización para Gemini 1.5 Flash. Este modelo, que fue anunciado en el Google I/O, marcó un hito en el ecosistema IA de la compañía y se ha consolidado como uno de los mejores modelos de lenguaje pequeños del mercado actual. Ahora, tras escuchar a los propios desarrolladores, y haciendo uso de DeepMind, la gran G ha lanzado Gemini 1.5 Flash-8B.

Estas versiones Flash, al igual que en el resto de la industria, están pensadas para las tareas sencillas y acumulativas. Es decir, aquellas que no requieren demasiada potencia IA, pero que soportan un gran volumen y deben ofrecer una eficiencia en el gasto energético y el coste. Ahora, con Gemini 1.5 Flash-8B estas ventajas son aún más interesantes.

No solo es mucho más económica, más eficiente, tiene límites más amplios y una velocidad mayor, Gemini 1.5 Flash-8B supera a la anterior versión en muchos de los campos comparativos más populares de los LLM. Todo esto, siendo una IA más pequeña que la anterior, lo que significa que Google ha optimizado bien sus posibilidades.

Gemini 1.5 Flash-8B ya se puede utilizar

Lo mejor de todo es que Gemini 1.5 Flash-8B ya está disponible. Google la ha puesto a disposición de todos en Google AI Studio y a través de la propia API de Gemini. No es una beta ni una versión de pruebas, sino el modelo final y estable que ya se puede exprimir y que probablemente sea una mejor inversión que 1.5 Flash a secas, sin el 8B.

Para convencerte, Google ha confirmado que es su modelo de lenguaje IA más liviano, mejor optimizado y uno de los más avanzados del sector 'mini' en la industria. No solo eso, también es el más barato, y no por ello el peor en todos los escenarios. Gracias a su optimización consigue superar a otras IA mucho más potentes y caras en varios aspectos clave.

Gemini 1.5 Flash-8B, de hecho, tiene un gran desempeño en tareas de chat, IA conversacional, transcripción de contenido y traducción de contextos complejos y extensos. Parece un modelo de lenguaje perfecto para tareas repetitivas y de gran volumen, como crear un chatbot para asistencia técnica o dotar a un call center de una buena dosis de inteligencia artificial.

De hecho, su clave no es la optimización o su tamaño, sino el precio que ofrece. Gemini 1.5 Flash-8B es la IA más económica de Google y una de las más baratas de todo el mercado actual. Además, ha duplicado su límite de solicitudes, pasando de 2.000 a 4.000 por minuto.

0,0375 dólares por cada millón de tokens de entrada (<128K)
0,15 dólares por cada millón de tokens de salida (<128 000)
0,01 dólares por cada millón de tokens en solicitudes almacenadas en caché (<128 000)