ChatGPT y Gemini: una nueva batalla en el campo de la Inteligencia Artificial

La más reciente versión del sistema de inteligencia artificial ChatGPT, desarrollado por OpenAI y respaldado por Microsoft, ha sido lanzada bajo el nombre GPT-4o. En un movimiento paralelo, Google, su competidor directo, ha introducido la versión 1.5 Pro de su sistema Gemini.

Tiempo de lectura: 10 minutos

Antes de sumergirnos en las novedades, es útil entender qué es la inteligencia artificial generativa, ya que ese tipo de inteligencia es la que usaron OpenIA y Google para presentar sus nuevas versiones.

Esta tecnología utiliza modelos de aprendizaje automático para crear contenido nuevo a partir de grandes cantidades de datos. Por ejemplo, puede escribir textos, general imágenes, traducir idiomas, y más.

Es como tener un asistente personas súper inteligente que puede ayudarte con una variedad de tareas.

Gemini 1.5 Pro: Innovación de Google

Gemini 1.5 Pro es la nueva versión del modelo de IA de Google, diseñado principalmente para integrarse con todo el ecosistema de Google.

Una característica de Gemini es que va más allá de las entradas de texto ya que es multimodal ósea que no solo recibe instrucciones mediante la introducción de texto, sino también a través de la vista, el sonido y el lenguaje hablado.

4 funciones increíbles de Gemini 1.5 Pro

1. El buscador y sus nuevas funciones

Ha sido sin duda la innovación más destacada entre las presentadas por Google y, a la vez, una de las más esperadas. Ante los rumores sobre un buscador alternativo desarrollado por OpenAI, Google ha respondido con la presentación de su nuevo motor de búsqueda, que incorpora una integración total de Gemini. Esta integración promete hacer las búsquedas más inteligentes e intuitivas que nunca.

This is Search in the Gemini era. #GoogleIO pic.twitter.com/JxldNjbqyn
— Google (@Google) May 14, 2024

2. Preguntas con video

Ahora podrás utilizar el buscador para analizar un vídeo que estas grabando en tiempo real con la cámara del móvil, mostrando algún problema que podrías tener con dispositivos como una cámara de fotos o un tocadiscos que no funcionan correctamente.

Con la integración de Gemini, la búsqueda de Google será capaz de analizar todo ese contenido visual y proporcionarnos soluciones precisas para los problemas que enfrentamos.

And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024

3. La expansión de una función muy esperada: Rodear para buscar

Esta característica, previamente exclusiva de los Samsung Galaxy S24 y los Google Pixel, finalmente llega a todos los teléfonos Android. Esta novedad representa una mejora significativa en la experiencia de uso de Google Lens.

Ahora, los usuarios pueden acceder a los resultados buscando cualquier objeto directamente desde la pantalla, simplemente rodeándolo con el dedo.

Esta acción proporciona los mismos resultados que antes se obtenían a través de Lens, pero de manera más directa y sencilla, agilizando así el proceso de búsqueda.

The Gemini era is here, bringing the magic of AI to the tools you use every day. Learn more about all the announcements from #GoogleIO → https://t.co/ZQaDrmItuh pic.twitter.com/9Tu1C6WNqQ
— Google (@Google) May 14, 2024

4. Integración de Gemini en el ecosistema Android.

Se espera que Gemini, en lugar del asistente de Google, asuma un papel central en nuestros dispositivos. Ahora, la Inteligencia Artificial de Google será capaz de interactuar con diversas aplicaciones, llevando la multitarea a nuevos límites.

Por ejemplo, podremos compartir imágenes generadas por IA en aplicaciones como YouTube y Gmail, entre otras.

Además, los resúmenes no se limitarán únicamente a los correos electrónicos en Gmail; ahora también podrán ser generados para documentos, permitiéndonos obtener una visión rápida del contenido de archivos PDF o de texto con solo solicitarlo a la IA. Esta integración promete simplificar y potenciar nuestras actividades diarias en el móvil.

Cuando nos referimos a los teléfonos móviles, especialmente a los dispositivos Pixel, es inevitable mencionar a Nano, la versión compacta de Gemini. Ahora, Nano incorporará características que antes solo estaban disponibles en los modelos de lenguaje más extensos basados en Gemini.

Esta versión mejorada podrá analizar conversaciones en nuestras aplicaciones de mensajería para detectar intentos de estafa. La gama de funciones que ofrece es amplia y continúa expandiéndose. Gemini ya ha hecho su incursión en Google Workspace, proporcionando utilidades cada vez más diversas para diversos ámbitos laborales, incluyendo el ámbito creativo.

Gemini on @Android is becoming more helpful and context aware. Later this year, you’ll be able to drag-and-drop generated images into Google Messages & Gmail, and ask questions about @YouTube videos and PDFs right on your device. #GoogleIO pic.twitter.com/ZRajfzXBWw
— Google (@Google) May 14, 2024

ChatGPT-4o: Un salto en la interacción persona-computadora

ChatGPT-4o es la última versión del famoso modelo de lenguaje de OpenAI. Esta versión está diseñada para hacer la interacción con computadoras más fluida y natural. Puede procesar entradas de texto, audio e imagen, y generar salidas en cualquier combinación de estos formatos.

¿Cómo puede mejorar tu día a día?

Imagina que estás preparando una presentación importante para el trabajo. Con ChatGPT-4o, puedes dictar tus ideas en voz alta y ver cómo se convierten en texto en tu pantalla. Si necesitas una imagen para ilustrar un punto, simplemente describe lo que necesitas y ChatGPT-4o puede generar una imagen relevante.

Otra aplicación práctica es en el aprendizaje. Si eres estudiante y tienes problemas para entender un concepto complicado, puedes preguntarle a ChatGPT-4o. Este no solo te explicará el concepto, sino que también puede proporcionarte ejemplos visuales o incluso videos educativos para ayudarte a entender mejor.

Velocidad y Eficiencia

Una de las mejoras clave en ChatGPT-4o es su velocidad. Puede responder en tan solo 232 milisegundos, lo que lo hace casi tan rápido como una conversación humana. Esto es ideal para situaciones en las que necesitas respuestas rápidas, como cuando estás cocinando y necesitas una receta o cuando estás en medio de una conversación importante y necesitas información adicional.

10 funciones sorprendentes de chatGTP-4

La número 10 te dejará con la boca abierta.

1. Un apoyo ideal para personas con discapacidad visual

Con la nueva capacidad de entrada visual de GPT-4, Be My Eyes en alianza con Chat-GTP-4, comenzó a desarrollar un asistente virtual que puede generar el mismo nivel de contexto y comprensión que un asistente humano.

«Las implicaciones para la accesibilidad global son profundas. En un futuro no muy lejano, la comunidad de personas ciegas y con baja visión utilizará estas herramientas no solo para una variedad de necesidades de interpretación visual, sino también para tener un mayor grado de independencia en sus vidas». Señaló Michael Buckley, CEO de Be My Eyes.

2. Entablar una conversación tan real como con una persona.

El chatbot también permite una conversación muy fluida y de manera natural. De esta manera, podemos entablar un dialogo y pedirle hasta su opinión.

Además de esto, el nuevo ChatGPT logra analizar la expresión en el rostro de la persona a través de la cámara o ver lo que lleva puesto.

3. Resuelve problemas matemáticos

También se mostró que puede ayudar con pistas para resolver ecuaciones matemáticas, pero sin dar la respuesta de manera puntual, ya que su objetivo es ayudar al usuario a encontrar la solución final por su propia cuenta.

4. Diferentes tonalidades de voz

Podemos pedirle que nos relate un cuento y a la vez que cambie el tono de su voz según como queramos, como por ejemplo con tono dramático, emocionante, robótica y más.

5. Asiste en la programación y desarrollo de software

Si de programación hablamos, la nueva versión de ChatGTP-4 es un gran aliado porque ahora podrá ver el código que estás escribiendo desde tu computador y podrá analizarlo, detectar errores comunes y mejorar la calidad de tu código.

5/ Asistencia en programación pic.twitter.com/DHSullk2Ew
— Alejandro | Copywriting Liberador (@CopyRebeldia) May 15, 2024

6. Dos asistentes de ChatGTP-4 hablando y cantando

Si crees que no tienes amigos pues eso ahora no será un problema porque con la nueva actualización dos ChatGTP-4 pueden interactuar junto contigo como en una reunión de amigos, hasta podrán armar un coro musical. ¿Increíble no?

7. Una traducción en tiempo real y más precisa

Conversar con un amigo que habla en otro idioma ahora será más fácil con el nuevo traductor, ya que obtendrás una traducción precisa, rápida y sin interrupciones.

8. Puedes presentarle a tu mascota

Ahora con la entrada visual de la nueva versión puedes presentarle a tu mascota a través de la cámara de tu celular, así comenzarás una conversación como si estuvieras en una videollamada con un amigo que vive lejos.

9. Te asesora para una entrevista

Si tienes que prepararte para una entrevista de trabajo o alguna reunión importante, la asistente de ChatGTP-4 te recomendará algunos consejos importantes y podrás practicar con ella.

10. ¡Celebra tu cumpleaños!

¡Esto nos pareció increíble! Un video dice más que mil palabras, así que mejor mira el video y sorpréndete como nosotros.

Los nuevos avances en inteligencia artificial, como ChatGPT-4o y Gemini 1.5 Pro, están transformando la manera en que interactuamos con la tecnología.

Estas herramientas no solo hacen nuestras vidas más fáciles y eficientes, sino que también abren nuevas posibilidades para la creatividad, el aprendizaje y la comunicación.

A medida que estas tecnologías continúan evolucionando, es emocionante imaginar cómo seguirán impactando nuestro día a día de formas innovadoras y positivas.

La IA está aquí para quedarse, y entender cómo aprovechar estas herramientas puede darnos una ventaja significativa en nuestra vida cotidiana. Así que, ¿por qué no empezar a explorar estas nuevas versiones hoy mismo y ver cómo pueden ayudarte a simplificar y enriquecer tu vida?

Si te interesan más temas como este, te invitamos a leer: Ciberseguridad: tipos de ataques que tienes que conocer para estar prevenido, Inversión en la nube experimenta un 11% de crecimiento en América Latina, WhatsApp ahora se conectará con otras apps de mensajería, como Telegram o Signal.

Escrito por: Paola Jara