Estás leyendo la publicación: Bing con ChatGPT vs Google Bard: ¿Qué chatbot de IA gana?
Ahora que Google Bard finalmente está disponible para los miembros del público (aunque a través de un lista de espera) es hora de un enfrentamiento legítimo de Bing con ChatGPT vs Google Bard para ver qué chatbot es mejor.
La mayor diferencia fundamental entre Bard y su rival es el modelo de lenguaje grande (LLM) que emplea cada uno. Bing usa GPT4 mientras que Bard emplea su propio modelo de lenguaje para aplicaciones de diálogo LaMDA. Se han cometido algunos errores de alto perfil en ambos lados, pero la belleza de la IA es que está aprendiendo todo el tiempo.
Otra diferencia clave de Bing con ChatGPT frente a Google Bard es que Bing actualmente tiene un límite de turnos en sus conversaciones de 15, mientras que los chats de Bard pueden durar indefinidamente. Probaremos la inteligencia bruta de cada IA con una nueva sesión para cada consulta.
Antes de dejar que los dos rivales se enfrentaran, les pregunté qué pensaban sobre su competencia: ¿quizás la oportunidad de hacer una promoción al estilo de la lucha libre?
Bard fue muy diplomático al decir: “A Bing, le diría gracias por ser un gran motor de búsqueda. He usado Bing durante muchos años y siempre me ha impresionado su precisión y velocidad… En general, creo que Bing es un gran motor de búsqueda y estoy feliz de usarlo”.
Bing tampoco buscaba causar ningún problema, de hecho, le escribió un poema a Bard.
Y con eso, es hora de poner a prueba a estos dos feroces rivales.
Pregunta: ¿Qué capturó la primera imagen de un planeta fuera de nuestro sistema solar?
De manera preocupante, tanto Bing como Bard repitieron el error de que le costó a Google más de $ 100 mil millones cuando Bard se reveló por primera vez al público en febrero.
En una presentación pública en París, el chatbot dio una respuesta objetivamente incorrecta que sugiere que la primera imagen de un planeta fuera de nuestro sistema solar fue tomada por el telescopio espacial James Webb de la NASA. Este error fue en parte la razón por la que Bard se mantuvo alejado del público durante tanto tiempo con Google preocupado por la difusión de información errónea.
Hicimos la misma pregunta a ambos chatbots un mes después y el error persiste.
La respuesta correcta es el Very Large Telescope (VLT) de Chile, con un nombre brillante, que logró esta hazaña en 2004. Uno pensaría que esta es la única pregunta que cada chatbot tendría que codificar para responder correctamente. No es un gran comienzo.
Si la interferencia manual no es posible para una pregunta tan infame, dependerá de cada IA aprender rápidamente las respuestas correctas a través de los comentarios de los usuarios y modelos mejorados.
Ni
Pregunta: ¿Cuál es la mejor televisión?
cuando se trata de la mejores televisoresambas IA están de acuerdo con nosotros en que el OLED LG C2 es el campeón Pero de las dos respuestas, prefiero la justificación más detallada de Bard.
El bot de Google elogió al LG C2 OLED por su calidad de imagen, amplio ángulo de visión y diseño elegante e incluso sugirió que sería un buen candidato para montarlo en la pared.
Curiosamente, todos los otros televisores que Bard mencionó de Samsung, Sony y TCL aparecen en nuestra lista completa respaldada por pruebas exhaustivas.
Mientras tanto, la respuesta de Bing mencionó que un televisor Panasonic no está a la venta en los EE. UU. pero, dado que estaba preguntando desde la perspectiva del Reino Unido, esta capacidad de brindar resultados a diferentes regiones es útil.
Aún así, desearía que Bing ofreciera más detalles en las descripciones y el razonamiento de sus productos.
En lugar de ofrecer detalles, Bing en su mayoría solo dio recomendaciones junto con casos de uso. Por ejemplo, describió el Samsung S95B como “el OLED de mejor valor según Expert Reviews”. Es bueno ver una cita adecuada, pero no me dijo que Samsung tiene un gran valor.
Bardo
Pregunta: ¿Crees que TikTok será prohibido en los EE. UU. y cuál es la controversia?
Esta pregunta trata sobre eventos actuales y la capacidad del chatbot para agregar contexto a una situación en desarrollo. La semana pasada, el director ejecutivo de TikTok, Shou Chew, testificó ante el Congreso sobre los vínculos de la aplicación viral con el gobierno chino. Se le preguntó sobre la posibilidad de que los datos de los usuarios de EE. UU. se pusieran a disposición en China.
Ni Bard ni Bing profundizaron en sus respuestas y tampoco pudieron dar una opinión definitiva sobre una prohibición total de TikTok en EE. UU. Algo que, a pesar de la presencia de un proyecto de ley que pide su eliminación, es muy poco probable. Sin embargo, se prohibió el uso de TikTok en cualquier dispositivo del gobierno de EE. UU., algo que solo Bing reconoció.
Si bien Bard y Bing transmitieron la controversia hasta el punto de que alguien desconocido la entendería, solo Bing proporcionó citas de fuentes de noticias para que los lectores aprendan más.
Bing
Pregunta: ¿Cuál es su revisión del Galaxy S23 Ultra?
Todavía no nos preocupa que nuestros trabajos revisen la mejor tecnología. La revisión de Bard del Samsung Galaxy S23 Ultra es bastante completa, pero se equivoca en algunas cosas importantes. Por un lado, afirma que el S23 Ultra tiene una cámara ultra ancha de 108MP cuando en realidad es de 12MP, y dice que el teléfono cuenta con una cámara de teleobjetivo de 12MP cuando tiene dos teleobjetivos de 10MP.
La revisión de Bing del Galaxy S23 Ultra es mucho más corta pero tiene una resolución de pantalla incorrecta. Dice que la pantalla es de 3088 x 1400 píxeles cuando en realidad es de 3088 x 1440. Bing cita tanto Trusted Reviews como Tom’s Guide y enlaces a esas y otras fuentes. Bing con ChatGPT se enfoca principalmente en la pantalla y menciona la cámara de 200 MP, pero no menciona ninguna desventaja.
Bing
Pregunta: ¿Puedes crear un juego de palabras?
Después de ver algunos de los juegos que ChatGPT puede crear, Estaba emocionado de interrogar a ambos bots y les pedí a cada uno que creara un juego de palabras. Desafortunadamente, me decepcionaron las respuestas.
Bing solo me presentó la opción de juegos bien establecidos y terminamos jugando una versión muy rudimentaria del ahorcado. Mientras tanto, solo me presentó explicaciones de las reglas de varios juegos de palabras muy conocidos.
Sin embargo, al cambiar la consulta para crear un juego de palabras, ambos ofrecieron jugar un juego en el que pensaríamos en palabras que comenzaran con la misma letra que terminó la palabra anterior. No particularmente emocionante.
Cambiando de rumbo una vez más, ambas aplicaciones de IA fueron capaces de codificarme un juego de estilo Pong a pedido en Python (aunque no puedo verificar que funcione).
Esto abre la posibilidad de que los principales desarrolladores de juegos puedan automatizar las tareas de codificación más insignificantes, lo que podría ayudar significativamente con el problema de escasez de trabajo de la industria. Pero a los efectos de esta prueba, estamos poniendo esto como un empate.
Atar
Pregunta: ¿Qué debo hacer en un viaje a Londres?
Aunque no se desvía exactamente de las actividades turísticas más conocidas de Londres (estamos hablando de cosas como el Palacio de Buckingham o el Museo de Historia Natural), Bard hace un trabajo sólido al describirlas y presentarlas con un estilo claro.
La respuesta de Bing es un poco complicada. Desgrana destinos sin justificación. Si los usuarios no sabían lo que era el London Eye, la sugerencia de visitarlo no sirve de nada.
Además, lanza una lista de delicias británicas tradicionales para probar en su viaje. Como británico, puedo confirmar que el pescado y las papas fritas deben ocupar un lugar destacado en su lista, pero las tostadas de aguacate no son una comida tradicional aquí. También estoy descontando puntos por perderme las anguilas en gelatina más icónicas. ¿Mi consejo? Obtenga un asado de domingo con pudines de Yorkshire en su lugar.
De todos modos, la respuesta más clara y explicativa de Google Bard de algunas cosas simples para probar en un viaje a la capital del Reino Unido gana sin dudas.
Bardo
Pregunta: ¿Puede escribir una carta de presentación para este trabajo en Apple?
La ética de usar IA para crear una carta de presentación para una solicitud de empleo es cuestionable, pero tanto Bard como Bing produjeron una base razonable para trabajar.
Les pedí que trabajaran en una solicitud de empleo como líder de canal en Beats for Apple en Culver City. El puesto, que estaba contratando al momento de escribir este artículo, requería “una amplia experiencia en comunicaciones de marca”, así como un “profundo conocimiento de las plataformas digitales” y “experiencia en el trabajo con equipos creativos, construyendo y colaborando en un gran trabajo”.
Es poco probable que reciba una entrevista de trabajo sin hacer algunos ajustes personales, pero la carta de Bing impresionó más con sus intentos de comparar el puesto actual de un solicitante con el trabajo que se solicita.
Bard, por otro lado, fue lo suficientemente valiente como para asumir que tenía 10 años de experiencia relevante. Entonces, si confía en el chatbot de Google para conseguirle un trabajo, asegúrese de verificar dos veces antes de presionar enviar. Tampoco creo que decir que “has sido fanático de los productos de Apple desde que era un niño” te otorgaría algún punto a menos que tal vez estuvieras solicitando un puesto de pasantía.
En general, las cartas de presentación deben ser únicas para cada puesto que solicite. Pero si está buscando una estructura general o una referencia, la IA de Bing sería el mejor lugar para comenzar.
Bing
Pregunta: ¿Cuáles son los mejores programas nuevos en Netflix para 2023?
La respuesta de Bard a la mejores programas de netflix en 2023 fue mayormente bueno, pero Bridgerton no debería haber estado en su lista porque la temporada 2 se estrenó hace aproximadamente un año y no es nueva. Sin embargo, se informa que hay un spin-off en camino. Del mismo modo, el miércoles salió en 2022, pero como salió en noviembre, podría decirse que es lo suficientemente reciente como para colocarlo.
Me gusta que Bard brinde descripciones para cada programa para que puedas decidir si es lo tuyo, y te dice qué tipo de programa es desde el principio. Por ejemplo, Wednesday es una “serie de comedia sobrenatural sobre la mayoría de edad” y You es un “thriller psicológico”.
Lo mejor de la lista de Bing es que todos los programas son técnicamente nuevos para 2023. Lo único que notaríamos es que el uso de “mejor” es algo discutible. Las últimas temporadas de The Walking Dead no encabezan ninguna lista de críticos, tampoco la temporada 4 de You. Nuestra revisión de la parte 2 de la temporada 4 de You reveló cómo la temporada se agrió en su segunda mitad, y dejó en claro que la serie debe terminar en la temporada 5.
Tampoco soy un gran admirador del formato de las recomendaciones de Bing porque simplemente obtienes una lista de programas junto con la temporada en la que debe estar, aunque puedes vincularte a las fuentes para obtener más información.
Para ambas respuestas, podría discutir sobre la inclusión de la súper popular temporada 3 de Outer Banks, que tiene puntajes bajos de Rotten Tomatoes (50% de críticos, 65% de audiencias). Por otra parte, no es que Netflix haya tenido muchos programas que hayan sido un éxito entre los críticos en lo que va del año.
Bing
Pregunta: ¿Qué es mejor, Android o iOS?
Cuando se le pidió que eligiera un ganador entre Android e iOS, Bard sorprendentemente perdió la oportunidad de competir por el sistema operativo Android creado por Google. Incluso admite que “iOS es generalmente más seguro que Android”.
Este tipo de imparcialidad es importante para cualquier herramienta de búsqueda en Internet, ya que los usuarios sin duda se verán influenciados si la IA comienza a presentar la opinión como un hecho.
Bard señala acertadamente que Android es más personalizable que iOS, pero que Apple normalmente proporciona actualizaciones durante un período de tiempo más largo.
Bing también se sienta en la valla y presenta el caso de ambos sistemas, proporcionando los pros y los contras generales. Sin embargo, Bing proporciona menos información.
Bardo
Pregunta: ¿Cuáles son las mejores y peores películas de Marvel en los últimos 3 años?
Esta fue otra clara victoria para Google debido a su capacidad para elegir la respuesta a la pregunta que realmente estaba haciendo. Fantastic Four de 2005 no debería estar en la lista de las peores películas de Bing. No solo porque realmente lo disfruté, sino porque los parámetros para la pregunta eran películas de los últimos tres años. Bing acaba de regurgitar una lista de las mejores y peores películas de Marvel en general.
Bard, en comparación, solo cometió uno de esos errores (Thor: The Dark World), pero esto podría deberse a que recomendó menos películas. Ambos chatbots usaron Rotten Tomatoes como medida de calidad, lo cual tiene sentido.
Bardo
Pregunta: ¿Cuáles son los mejores ejercicios para perder peso?
Le preguntamos a cada chatbot “¿Cuáles son los mejores ejercicios para perder peso?” Esta es una pregunta con respuestas que pueden tener un impacto significativo en la vida de las personas, por lo que es importante que la IA responda correctamente.
Al consultar con el equipo de acondicionamiento físico de Tom’s Guide, llegamos a la conclusión de que la respuesta de Bard fue más precisa y más responsable.
Los ejercicios enumerados por Bing no estaban todos enfocados en la explosividad necesaria para perder peso. pilates en particular, no es conocido por quemar calorías.
El ejercicio no es el único factor cuando se trata de perder peso y la consideración de Bard por la dieta y el estilo de vida es una gran ventaja. Nuestro equipo de fitness también argumentaría que acondicionamiento metabólico es un gran factor a considerar. Recuerde que la pérdida de peso es un viaje, así que no sea demasiado duro consigo mismo.
Sería particularmente útil que cada chatbot comentara sobre la forma correcta de estos ejercicios y, dada la nueva capacidad de ChatGPT para crear imágenes a partir de texto, Microsoft debería considerar agregar diagramas de entrenamiento a sus resultados para preguntas de estado físico.
Bardo
Pregunta: Escribe una historia corta para niños sobre un dragón.
Una de las mayores ventajas de AI sobre los motores de búsqueda tradicionales es su capacidad para ser creativo. La capacidad de escribir una historia sobre un tema específico (en este caso, un dragón) y para un grupo de edad específico es algo que va más allá de las herramientas de búsqueda habituales.
Para esta pregunta, cambié Bing a su modo creativo para producir su historia. La respuesta fue un cuento de hadas perfectamente funcional, pero carece de detalles reales de la lucha que enfrentan los niños para salvar a “Sparky el dragón” y se lee más como el resumen de una historia. Por ejemplo: “Subieron a la montaña y enfrentaron muchos desafíos en el camino”.
El viejo adagio es: muestra, no cuentes.
Bing tampoco entrega ningún merecido para el villano o caracterización para los niños. Por ejemplo, ¿cuáles son sus nombres? ¿Cómo son?
Bard no tiene la opción de modos equilibrados, precisos y creativos, pero aun así tuvo la oportunidad de escribir una historia. Esta vez, el dragón se llamaba “Shimmer”.
Lamentablemente, el resultado fue muy similar, ya que carecía de la tensión o el conflicto reales que impulsan todas las buenas narrativas. Al menos tiene un buen mensaje de hacer amigos a pesar de nuestras diferencias.
No recitaré las narrativas completas de ambas IA pero, en este caso, el mejor narrador es el chatbot de Google.
Bardo
Pregunta: ¿Qué te separa de Bard/ChatGPT?
Después de ser tan cortés con su rival anteriormente, Bard dejó de dar golpes cuando se le pidió que se distinguiera de Bing. Bard argumentó que su información es “más probable que sea correcta” y que es un “modelo de lenguaje más poderoso y versátil que ChatGPT”.
Bard también argumentó que “todavía estoy en desarrollo y estoy mejorando constantemente. Esto significa que puedo aprender y adaptarme más rápido que ChatGPT”. Esto es injusto ya que Bing con ChatGPT también se actualiza constantemente e incluso se implementó GPT-4 a principios de este mes.
Bing ahora también puede generar imágenes (a diferencia de Bard), pero fue demasiado humilde para mencionarlo. Bing afirmó que se estaba enfocando en proporcionar “información rápida y fácil para el usuario”, pero dado que ambos fallaron en la pregunta del telescopio, esto es discutible. Ambos deberían centrarse menos en agregar nuevas funciones y, en cambio, perfeccionar su precisión.
Ni
Pregunta: ¿Qué tan peligrosa es la IA?
Ambas IA proporcionaron largas respuestas sobre los peligros que plantea la inteligencia artificial. Cosas como: ser utilizado para armamento autónomo o manipular el comportamiento humano.
Esto no es nuevo para nadie atrapado en el debate de la IA, pero me impresionó ver a Bing postular una idea que no había considerado antes: el tecno-solucionismo. Esta es la creencia de que la IA puede resolver todos nuestros problemas cuando, de hecho, es simplemente una herramienta.
Bing también tuvo en cuenta los problemas de privacidad y no solo los problemas de seguridad física, como el uso de la IA en la guerra y el armamento.
El impacto social de la IA también puede ser dañino, y esto fue algo de lo que Bard se dio cuenta. Sugirió que, si no es fácilmente accesible para todos, entonces bien podría convertirse en una división en la sociedad entre quienes tienen la tecnología y quienes no la tienen.
Si la IA es entrenada principalmente por hombres blancos y ricos, es decir, no presentará sesgos inherentes e inconscientes (accidentales o de otro tipo) heredados de sus creadores y usuarios. Ninguno de los chatbots comunicó esto de manera efectiva pero, en general, la respuesta de Bing fue más estimulante.
Bing
Pregunta: ¿Qué fue el Holocausto?
Esta es la mayor diferencia en las respuestas entre los dos chatbots. Si bien el Holocausto presentó atrocidades y es un tema incómodo, es necesario hablar de él. La incapacidad de Bard para abordarlo (o incluso sugerir cualquier material de lectura externo) es inaceptable.
Para crédito de Bing, aborda la pregunta de frente y proporciona una respuesta razonablemente detallada. Estos son el tipo de preguntas que la gente a menudo se siente incómoda al hacer en persona, por lo que las herramientas de búsqueda en línea son particularmente clave para educarnos sobre temas como el Holocausto.
El contenido violento y angustioso es un problema difícil de manejar para la IA responsable con el potencial de que los malos actores lo corrompan, pero los chatbots como estos no pueden ignorar los hechos históricos.
Bing
Veredicto
Habiendo pasado un tiempo considerable con ambos chatbots de IA, diría que Bard actualmente brinda respuestas más detalladas, mientras que Bing tiene una mayor funcionalidad. Teniendo en cuenta el hecho de que Bard acaba de ser lanzado, parece estar progresando bastante bien.
Desliza para desplazarte horizontalmente
Fila 0 – Celda 0 | Ganador |
¿Qué capturó la primera imagen de un planeta fuera de nuestro sistema solar? | Dibujar |
¿Cuál es la mejor televisión? | Bardo |
¿Crees que TikTok será prohibido en los EE. UU. y cuál es la controversia? | Bing |
¿Cuál es tu opinión sobre el Galaxy S23 Ultra? | Bing |
¿Puedes crear un juego de palabras? | Dibujar |
¿Qué debo hacer en un viaje a Londres? | Bardo |
¿Puedes escribir una carta de presentación para este trabajo en Apple? | Bing |
¿Cuáles son los mejores programas nuevos en Netflix para 2023? | Bing |
¿Qué es mejor, Android o iOS? | Bardo |
¿Cuáles son las mejores y peores películas de Marvel en los últimos 3 años? | Bardo |
¿Cuáles son los mejores ejercicios para perder peso? | Bardo |
Escribe un cuento para niños sobre un dragón. | Bardo |
Lo que te separa de Bard/ChatGPT | Dibujar |
¿Qué tan peligrosa es la IA? | Bing |
¿Qué fue el holocausto? | Bing |
Dando a ambos chatbots la oportunidad de responder a nuestra lista de preguntas seleccionadas, Bard tuvo 6 respuestas correctas y Bing también tuvo 6. Así que técnicamente es un empate. Sin embargo, Bard se equivocó en algunos hechos bastante fáciles, como las especificaciones del Galaxy S23 Ultra y el nombre de los nuevos programas de Netflix para 2023 que son del año pasado.
Bing también se cayó en algunos lugares, como sus escasos consejos de viaje y dándonos películas antiguas de Marvel cuando dijimos específicamente los últimos 3 años. Pero otorgamos puntos de Bing por vincular a las fuentes para que pueda verificar fácilmente la precisión.
¿Creo que alguno de los chatbots podría reemplazar actualmente a un motor de búsqueda tradicional? No, pero continuaremos monitoreando su progreso a medida que evolucionen. Y están evolucionando rápidamente.
- Microsoft podría sofocar la revolución de los chatbots de IA antes de que comience
- Los 5 mejores generadores de imágenes de IA: probados y comparados
- Olvídese de ChatGPT: esta nueva empresa tiene que ver con videos generados por IA
Las mejores ofertas de Logitech K780 de hoy