我们先看一道数学题:
有两个人数数,谁先数到2048谁就胜利,每次可以数1-6中的任一个数。
问题:应该怎么数才能赢?
这道其实是一道经典的数学题,用Python就可以解。
但大家有没有想过让AI来解高中数学题?
前几天有一则新闻,说的是谷歌的DeepMind开发的人工智能,无法通过英国高中的数学考试。
DeepMind可能大家都比较陌生,但打败人类世界棋王的AlphaGo肯定都知道。
DeepMind在一份名为《分析神经模型的数学推理能力》的研究报告中谈到,让AI接受一项包含了算术、几何、概率和测量的数学测试,考题有 40 题,难度大约是英国高中数学的程度。在这40道高中难度的数学题中,拥有强大通用算法和远超人类计算能力的人工智能,却只答对了14题,正确率只有35%。
底层的原理是想用RNN来学习题目的逻辑关系,大致是3步:
STEP1
准备200万道题目的题库
涵盖了算术、代数、概率、微积分等各种题型。
STEP2
OCR识别数学题
STEP3
训练模型,主要为循环神经网络 (RNN)和Transformer
STEP4
预测答案
为何准确率只有35%?
主要的问题是AI“看不懂”题目。
因为数学题的复杂性和符号多样性,导致AI没有办法很好地读懂题目。
欢迎在MixLab讨论相关内容、技术实现,