OpenAIのO3数学モデルは「テストされ、誤りが証明された」:テストの点数は水増しされていたとされる