Le hice preguntas a Google Bard 3 para probar sus nuevas capacidades de imagen: así fue como funcionó

Estás leyendo la publicación: Le hice preguntas a Google Bard 3 para probar sus nuevas capacidades de imagen: así fue como funcionó

Bardo de Google definitivamente fue un punto focal de E/S de Google 2023 a principios de este mes, con la introducción de la funcionalidad multimodal acaparando la mayoría de los titulares. La funcionalidad multimodal le permite a Bard responder a las indicaciones con imágenes y procesar el contexto cuando se le proporcionan imágenes en lugar de una indicación de solo texto, y todo gracias al modelo de lenguaje grande de PaLM 2.

Al momento de escribir este artículo, Bard aún no puede manejar entradas de imágenes, pero puede entregar salidas de imágenes. Así que decidí poner a prueba esta característica haciéndole tres preguntas técnicas que cualquiera de nuestros lectores podría necesitar una respuesta en este momento. Esto es lo que sucedió.

Bard Pregunta 1: ¿Dónde está el puerto de carga en el Macbook Air M2?

Para la primera pregunta, le pregunté a Google Bard “¿Dónde está el puerto de carga en el Macbook Air M2?” Y respondió a mi pregunta, diciendo que “El puerto de carga de la MacBook Air M2 está ubicado en el lado izquierdo de la computadora portátil, cerca de la tecla Escape. Es un puerto MagSafe 3, lo que significa que utiliza un conector magnético para conectarse a la computadora portátil”.

Desafortunadamente, Bard no me dio ninguna imagen como referencia, pero rápidamente me di cuenta de por qué. Si miras nuestro consejos para usar ChatGPT, otro chatbot popular de IA, el primer paso es ser específico. Debido a que no le pedí a Bard específicamente una imagen, decidió que una respuesta de solo texto era lo mejor.

🔥 Recomendado:  Los mejores libros electrónicos gratuitos de marketing digital que vale la pena descargar (PDF)

Entonces, usé nuestro segundo consejo, sea conversacional, y le pregunté a Bard: “¿Puedes mostrarme esto con una imagen?” Y de inmediato me proporcionó una imagen de la macbook aire m2 puerto de carga extraído del comunicado de prensa de Apple para nuestro mejor portátil. Problema resuelto.

Una nota: si hace clic en la imagen que proporciona Bard, saltará a la fuente de la imagen en lugar de obtener una imagen ampliada. Hay pros y contras de este método, pero tenlo en cuenta cuando uses Bard y sus nuevas capacidades.

Bard Pregunta 2: ¿Qué teléfono toma mejores fotos?

Entonces, ahora que sabía que tenía que ser específico, me volví mucho más granular cuando le pregunté a Bard qué teléfono toma las mejores fotos. Mi mensaje fue: “¿Qué teléfono toma mejores fotos? ¿El Samsung Galaxy S23? ¿O el iPhone 14? Muéstrame fotos tomadas por cada uno para comparar”.

¡Éxito! Esta vez obtuve fotos en el primer intento, y Bard hizo un buen trabajo mostrándome fotos comparando un teléfono con el otro.

Desafortunadamente, Bard todavía no logró que los hechos fueran completamente correctos. Su primer punto, “El Galaxy S23 tiene una cámara principal de 50MP, lo que le da más detalle que la cámara principal de 48MP del iPhone 14”. es incorrecto por varias razones.

Primero el iPhone 14 tiene una cámara principal de 12MP — la iPhone 14 Pro es el que tiene una cámara de 48MP. En segundo lugar, se podría argumentar que tener más megapíxeles no siempre equivale a un mejor detalle de la foto. En nuestro iPhone 14 versus Samsung S22 Enfrente, nuestras pruebas mostraron que Photonic Engine de Apple captó muchos más detalles a través del procesamiento de imágenes de lo que cabría esperar de un disparador de 12MP.

🔥 Recomendado:  Los mejores trabajos desde casa para los amantes de Disney

Así que tenga cuidado al tomar las respuestas de Bard como un evangelio: todavía se equivoca. Pero gracias a que todas las fotos lo llevan a la fuente original, puede hacer una investigación de seguimiento y corregir estos errores usted mismo.

Bard Pregunta 3: ¿Cuáles son las diferencias entre ChatGPT y Google Bard?

Finalmente, decidí ver qué tan bien se conoce Bard. Le pregunté (nuevamente, con gran especificidad) “¿Cuáles son las diferencias entre las interfaces de usuario de ChatGPT y Google Bard? Muestre imágenes para cada diferencia”.

Ser específico pagó dividendos una vez más, ya que inmediatamente obtuve un resultado con imágenes. Bard dijo que era la interfaz superior, ya que es “más fácil de usar y ofrece más funciones que la interfaz de ChatGPT”.

Una vez más, Bard no lo entiende del todo bien, aunque en general estoy de acuerdo en que es la interfaz más atractiva visualmente. Bardo afirmó que ChatGPT no le permite votar a favor o en contra de las respuestas, lo hace, y que ChatGPT no puede conectarse a Internet, lo cual ya no es cierto si tiene acceso a la Beta de ChatGPT Plus.

Bard es mejor con las imágenes, pero sigue siendo defectuoso

No se equivoque, a pesar de que Bard todavía comete errores, el chatbot de IA es mucho mejor ahora que ha agregado la funcionalidad multimodal. Como herramienta de investigación, la capacidad de proporcionar imágenes además de texto es una mejora significativa e incluso compensa algunas de las deficiencias de Bard en lo que respecta a la precisión.

Pero si quieres probarlo por ti mismo, consulta nuestra guía sobre cómo usar Google Bard. Esta guía hará que le hagas tus propias preguntas al chatbot en poco tiempo.

🔥 Recomendado:  El mejor cajero automático para comprar en 2023 (iniciar un negocio de cajero automático)

Las mejores ofertas de Google Pixel Buds Pro de hoy