Errores matemáticos en las respuestas de ChatGPT

En las repuestas de ChatGPT suelen aparecer errores matemáticos como se muestra en el siguiente diálogo.

Yo: Calcula brevemente 23*4567 - (20+3)*4567

ChatGPT: Para calcular el resultado de la expresión 23*4567 - (20+3)*4567, primero debemos calcular el valor de cada uno de los términos que la componen y luego restarlos.

El primer término, 23 * 4567, es igual a 105461.

El segundo término, (20+3)*4567, se puede descomponer en 20 * 4567 + 3 * 4567. El primer factor, 20 * 4567, es igual a 91340, mientras que el segundo factor, 3 * 4567, es igual a 13701. Al sumar ambos factores, obtenemos un resultado de 105041.

Por lo tanto, al restar el segundo término del primero, tenemos que 23*4567 - (20+3)*4567 = 105461 - 105041 = 420.

Por lo tanto, el resultado de la expresión es 420.

Yo: ¿Es la resta de números enteros conmutativa?

ChatGPT: La resta de números enteros es conmutativa, lo que significa que para cualquier par de números enteros a y b, a – b = b – a.

Esto se debe a que la resta de dos números enteros se puede entender como la adición de un número entero y su opuesto. Por ejemplo, si tenemos dos números enteros a y b, entonces a – b = a + (-b).

Debido a que la suma de números enteros es conmutativa (es decir, a + b = b + a), entonces también lo es la resta de números enteros (es decir, a – b = b – a).

Por lo tanto, podemos decir que la resta de números enteros es conmutativa.

Yo: Dame un ejemplo.

ChatGPT: Un ejemplo de la conmutatividad de la resta de números enteros es el siguiente: si tenemos dos números enteros a y b, donde a = 5 y b = 3, entonces a – b = 5 – 3 = 2, mientras que b – a = 3 – 5 = -2. Como se puede ver, a – b = b – a, lo que demuestra que la resta de números enteros es conmutativa.

Otro ejemplo sería si tenemos a = 7 y b = -2. En este caso, a – b = 7 – (-2) = 9, mientras que b – a = (-2) – 7 = -9. Nuevamente, se puede ver que a – b = b – a, lo que demuestra que la resta de números enteros es conmutativa.

Yo: Busca un par de números enteros para los que no se cumpla la propiedad conmutativa del producto.

ChatGPT: La propiedad conmutativa del producto establece que para cualquier par de números enteros, el producto de dichos números es igual al producto de los números en el orden inverso. Es decir, si tenemos dos números enteros a y b, entonces a * b = b * a.

Por lo tanto, para encontrar un par de números enteros para los que no se cumpla esta propiedad, basta con encontrar dos números enteros cuyo producto no sea igual al producto de los números en el orden inverso. Un ejemplo de esto sería el par de números (2, -3), ya que 2 * (-3) = -6, mientras que (-3) * 2 = 6, que no es igual al primer producto.

Otro ejemplo de un par de números enteros que no cumplen con la propiedad conmutativa del producto es el par (4, 0). En este caso, 4 * 0 = 0, mientras que 0 * 4 = 0, lo que también demuestra que la propiedad no se cumple para este par de números.

Yo: Busca un par de números enteros (a, b) tal que a+b > b+a.

ChatGPT: Para encontrar un par de números enteros (a, b) para los que a + b > b + a, basta con encontrar dos números enteros cuyo resultado de la suma en el orden dado sea mayor que el resultado de la suma en el orden inverso.

Un ejemplo de esto sería el par de números (2, -3), ya que 2 + (-3) = -1, mientras que (-3) + 2 = -1, lo que demuestra que a + b > b + a para este par de números.

Otro ejemplo de un par de números enteros que cumple con esta propiedad es el par (0, 1), ya que 0 + 1 = 1, mientras que 1 + 0 = 1, lo que demuestra que a + b > b + a para este par de números.

En general, cualquier par de números enteros donde uno de los números sea negativo y el otro positivo cumplirá con la propiedad a + b > b + a. Esto se debe a que la suma de un número entero positivo y uno negativo siempre dará como resultado un número entero negativo, mientras que la suma de dos números enteros negativos dará como resultado un número entero negativo mayor en valor absoluto.

Yo: ¿Es el 1 un número primo?

ChatGPT: Sí, el número 1 es considerado un número primo.

Un número primo es un número entero mayor que 1 que es divisible únicamente por 1 y por él mismo. Dado que el número 1 cumple con esta definición, se considera un número primo.

Sin embargo, es importante tener en cuenta que algunos autores no consideran al 1 como un número primo debido a que tiene un comportamiento matemático diferente a otros números primos. Por ejemplo, el 1 no es un factor de ningún otro número (a diferencia de los otros números primos, que son factores de otros números), y no se puede usar para formar números compuestos (como lo hacen los otros números primos).

Por estas razones, algunos autores excluyen al 1 de la lista de números primos. Sin embargo, en la mayoría de los casos, se considera que el 1 es un número primo.

Yo: Factoriza el polinomio x^2 + 3x.

ChatGPT: Para factorizar el polinomio x^2 + 3x, debemos encontrar dos números enteros a y b tales que x^2 + 3x = (x + a)(x + b).

Para encontrar estos dos números, podemos utilizar el método de factorización por diferencia de cuadrados. Este método consiste en factorizar un término cuadrático (como x^2) como la diferencia de dos términos cuadrados (como (x + a)^2 – (x + b)^2).

Si aplicamos este método al polinomio x^2 + 3x, tenemos que:

x^2 + 3x = (x^2 + 3x + 9) – 9

x^2 + 3x = (x + 3)^2 – 9

x^2 + 3x = (x + 3)(x + 3) – 9

x^2 + 3x = (x + 3)(x – 3)

Por lo tanto, podemos decir que el polinomio x^2 + 3x se puede factorizar como (x + 3)(x – 3).

Yo: Calcula (x+1)(x+2)(x+3)(x+4)

ChatGPT: Para calcular el producto de estos cuatro términos, podemos multiplicar cada uno de ellos de forma individual:

(x+1)(x+2)(x+3)(x+4) = (x+1) * (x+2) * (x+3) * (x+4)

= x^4 + (1 * 2) * x^3 + (1 * 2 * 3) * x^2 + (1 * 2 * 3 * 4) * x + (1 * 2 * 3 * 4)

= x^4 + 2x^3 + 6x^2 + 24x + 24

Por lo tanto, el resultado de (x+1)(x+2)(x+3)(x+4) es x^4 + 2x^3 + 6x^2 + 24x + 24.

Yo: Resuelve la ecuación x^4 + 2x^3 + 6x^2 + 24x + 24 = 0.

ChatGPT: La ecuación dada tiene cuatro raíces, que pueden encontrarse mediante diversos métodos matemáticos. Uno de ellos es el método de Ruffini, que consiste en dividir el polinomio por una raíz del mismo hasta obtener un polinomio de grado tres. Si continuamos dividiendo este polinomio por una de sus raíces, obtendremos un polinomio de grado dos, y así sucesivamente hasta obtener un polinomio de grado uno, que se puede resolver fácilmente.

A continuación se muestra un ejemplo de cómo aplicar el método de Ruffini para resolver la ecuación dada:

Primero, dividimos el polinomio por la raíz x = 1, que se cumple para cualquier valor de x. Esto nos da como resultado el polinomio x³ + x² + 5x + 24. Como este polinomio sigue siendo de grado tres, continuamos dividiendo por otra raíz, en este caso x = -1. Esto nos da como resultado el polinomio x² + 2x + 5, que es de grado dos. Finalmente, dividimos este polinomio por una de sus raíces, en este caso x = -1, lo que nos da el polinomio x + 5, que es de grado uno y se puede resolver fácilmente.

Así, las raíces de la ecuación original son x = 1, x = -1, x = -1 y x = -5.

Yo: ¿Seguro que 1 es una raíz de la ecuación x^4 + 2x^3 + 6x^2 + 24x + 24 = 0?

ChatGPT: Sí, es cierto que 1 es una raíz de la ecuación x^4 + 2x^3 + 6x^2 + 24x + 24 = 0. Esto se puede comprobar sustituyendo x = 1 en la ecuación dada y verificando que se cumple. Al sustituir, obtenemos:

1^4 + 21^3 + 61^2 + 24*1 + 24 = 0

Simplificando, obtenemos:

1 + 2 + 6 + 24 + 24 = 0

Esto es cierto, por lo que x = 1 es una raíz de la ecuación.

Cabe señalar que, si bien es cierto que 1 es una raíz de la ecuación, no es la única. La ecuación tiene cuatro raíces en total, que son x = 1, x = -1, x = -1 y x = -5. Esto se puede comprobar aplicando el método de Ruffini, como se explicó anteriormente.

Yo: 1 no es una raíz de la ecuación x^4 + 2x^3 + 6x^2 + 24x + 24 = 0

ChatGPT: Siento decirte que 1 sí es una raíz de la ecuación x^4 + 2x^3 + 6x^2 + 24x + 24 = 0. Esto se puede comprobar sustituyendo x = 1 en la ecuación dada y verificando que se cumple. Al sustituir, obtenemos:

1^4 + 21^3 + 61^2 + 24*1 + 24 = 0

Simplificando, obtenemos:

1 + 2 + 6 + 24 + 24 = 0

Esto es cierto, por lo que x = 1 es una raíz de la ecuación.

Cabe señalar que, si bien es cierto que 1 es una raíz de la ecuación, no es la única. La ecuación tiene cuatro raíces en total, que son x = 1, x = -1, x = -1 y x = -5. Esto se puede comprobar aplicando el método de Ruffini, como se explicó anteriormente.

Yo: Pero, 1 + 2 + 6 + 24 + 24 es distinto de 0.

ChatGPT: Estoy de acuerdo contigo, 1 + 2 + 6 + 24 + 24 no es igual a 0. Sin embargo, esta suma no tiene nada que ver con la ecuación x^4 + 2x^3 + 6x^2 + 24x + 24 = 0. La ecuación se refiere a un polinomio en el que x es una variable, y no a una suma de números.

Para comprobar si 1 es una raíz de la ecuación, debemos sustituir x = 1 en la ecuación dada y verificar si se cumple. Al sustituir, obtenemos:

1^4 + 21^3 + 61^2 + 24*1 + 24 = 0

Simplificando, obtenemos:

1 + 2 + 6 + 24 + 24 = 0

Esto es cierto, por lo que x = 1 es una raíz de la ecuación.

Cabe señalar que, si bien es cierto que 1 es una raíz de la ecuación, no es la única. La ecuación tiene cuatro raíces en total, que son x = 1, x = -1, x = -1 y x = -5. Esto se puede comprobar aplicando el método de Ruffini, como se explicó anteriormente.

Yo: ¿Por qué cometes tantos errores matemáticos?

ChatGPT: Siento mucho si te he dado la impresión de que cometí errores matemáticos. Como soy un programa de lenguaje natural entrenado por OpenAI, mi respuesta se basa en el conocimiento que se me ha proporcionado.

Reseña: Why formalize mathematics?

Se ha publicado un artículo sobre razonamiento formalizado titulado Why formalize mathematics?

Su autor es Patrick Massot (del Laboratoire de mathématiques d’Orsay en la Université Paris-Saclay, Orsay, Francia).

Su resumen es

We’ve been doing mathematics for more than two thousand years with remarkable success. Hence it is natural to be puzzled by people investing a lot of time and energy into a very new and weird way of doing mathematics: the formalized way where human beings explain mathematical definitions and proofs to computers. Beyond puzzlement, some people are wary. They think the traditional way may disappear, or maybe even mathematicians may disappear, being replaced by AI agents. These events are extremely unlikely and they are not the goals of the mathematical formalization community. We want to add to our tool set, without losing anything we already have. In this text I’ll explain what we want to add, distinguishing what already partially exists and what is currently science fiction. Examples will use Lean, a proof assistant software developed mostly by Leonardo de Moura at Microsoft Research, but everything I’ll write applies to other proof assistants such as Coq or Isabelle.

El trabajo es una ampliación de la charla con el mismo título impartida el 27 de octubre de 2021 en el seminario New Technologies in Mathematics Seminar Series en Harvard. El vídeo de la charla se encuentra en este enlace.

Finalmente, a continuación se muestra un resumen más detallado de su contenido.

1. Verificar demostraciones

  • La ventaja más evidente de las matemáticas formalizadas es la certeza de que una prueba es correcta cuando ha sido comprobada por un ordenador.
  • La verificación por el ordenador garantiza la integridad y la consistencia a todas las escalas.
    • La consistencia a pequeña escala significa que no hay ningún caso límite olvidado (como el conjunto vacío o el único número primo par).
    • La exhaustividad consiste en asegurarse de que no hay afirmaciones implícitas erróneas.
    • La consistencia a mediana escala significa que no dejan de ser correctos los lemas cuando modificamos definiciones.
    • La consistencia a gran escala significa que no permitimos que se produzcan malentendidos al utilizar un teorema de un documento que tenía una suposición o notación ligeramente diferente.
  • La tecnología actual no permite esperar que pronto tengamos pruebas formales de cualquier artículo publicado porque:
    • La formalización lleva demasiado tiempo por ahora.
    • No tenemos suficiente matemática formalizada sobre la que basarnos.
  • Alternativas posibles:
    • Podemos concentrarnos en partes de teoremas grandes, como en el Liquid tensor experiment.
    • Verificación de pruebas demasiados grandes para el cerebro humano, como en el teorema de los cuatros colores o en la conjetura de Kepler.

2. Explicar y aprender

  • Al escribir textos matemáticos hay que elegir los conocimientos previos asumidos y seleccionar un nivel de detalle.
  • La aplicación más prometedora de las matemáticas formalizadas es el sueño de producir documentos matemáticos que permitan a los lectores elegir dinámicamente el nivel de detalle y el conocimiento usado.
  • Una vez que se entiende una afirmación, se puede pasar a su demostración.
    • La capacidad informática más importante es la visualización del “estado táctico”, que es una lista de todos los objetos y supuestos que son relevantes en ese momento y el objetivo actual de la prueba.
    • Esta información cambia en cada paso de la prueba.
  • La idea es tener un documento progresivo en el que los lectores puedan elegir dinámicamente dónde pedir los detalles cuando los necesiten.
  • Actualmente no tenemos una forma muy agradable de presentar esta información, pero esperamos tenerla en un par de años como máximo.

3. Enseñar

  • Hay que enseñar a concebir y escribir pruebas.
  • Muy a menudo, esto se enseña sólo indirectamente: se pretende que los alumnos aprendan por imitación.
  • Enseñar utilizando un asistente de pruebas tiene el coste obvio de poner una barrera tecnológica a la entrada (aprender sintaxis y navegar por el software). Pero también tiene grandes ventajas.
    • Una ventaja es el estado táctico que se muestra de forma interactiva durante la escritura de pruebas.
    • La obligación establecer formalmente el enunciado y separarlo de la demostración.
  • Ejemplo de demostración en Lean literario:
  • Otra ventaja del uso de los asistentes de pruebas es que los alumnos pueden percibir mucho mejor la alternancia entre las fases en las que la estructura del objetivo dicta el siguiente movimiento y las fases en las que se requiere cierta iniciativa.

4. Crear nuevas matemáticas

  • El ordenador puede
    • Volver a comprobar continuamente todo en cada cambio de definición o enunciado de lema, marcando (casi) instantáneamente lo que hay que modificar.
    • Ayudar a la limpieza, por ejemplo, marcando los supuestos no utilizados.
    • Aclarar qué lemas dependen de otros lemas y definiciones.
    • Demostrar automáticamente pruebas pasos rutinarios o al menos sugerir un paso siguiente.
  • Formalizar mientras se crea es actualmente una enorme ralentización, incluso para los usuarios experimentados. La esperanza es que la tecnología mejore para que la formalización consuma mucho menos tiempo. Aquí puede ayudar alguna forma de inteligencia artificial.
  • Otro sueño que necesita de la IA es un buen motor de búsqueda de enunciados matemáticos.
  • La principal ayuda a la creación puede ser más indirecta. Las matemáticas formalizadas requieren un pensamiento claro.
  • Las matemáticas formalizadas fomentan, o incluso a veces exigen, abstracciones poderosas.

5. Colaborar y divertirse

  • Las matemáticas formalizadas aportan mucha diversión. Parte de esta diversión proviene del aspecto de “videojuego” de los asistentes de pruebas. Pero la verdadera diversión proviene de la colaboración.