在看《Dive into Python》的单元测试时,发现用作例子的“阿拉伯数字-罗马数字”的转换算法非常的巧妙,现在发上来和大家分享一下。
romanNumeralMap = (('M',1000), ('CM',900), ('D',500), ('CD',400), ('C',100), ('XC',90), ('L',50), ('XL',40), ('X',10), ('IX',9), ('V',5), ('IV',4), ('I',1)) def toRoman(n): result = "" for numeral, integer in romanNumeralMap: while n >= integer: result += numeral n -= integer return result
def fromRoman(s): result = 0 index = 0 for numeral, integer in romanNumeralMap: while s[index:index+len(numeral)] == numeral: result += integer index += len(numeral) return result
print toRoman(1356) print fromRoman('MCMLXXII')
这个算法的聪明之处,就在于他通过一个romanNumeralMap,把罗马数字与阿拉伯数字里面的“边界值”做出一一对应。这个边界刚刚好是罗马数字组合之间的转换。例如,I,II,III都可以通过第一个边界值组合获得;V,VI,VII,VIII可以通过V和I的组合获得。而对于一些特殊的值,则直接列出来。例如IV。通过这个边界值的组合,就能实现所需求的转换。这就类似于在一些机读卡上,需要填写1到100的数字,他会使用0,1,2,4,7这样以来:
3 = 1 + 2; 5 = 4 + 1; 6 = 4 + 2; 8 = 7 + 1; 9 = 7 + 2.
首先看一下toRoman()函数,把阿拉伯数字转换成罗马数字。它使用Python连接字符串的操作符号 + 来使“边界值”连接到一起。例如用作例子的n = 1356,程序遍历romanNumeralMap,寻找n对应的罗马数字,如果找不到,那就找刚刚比n小一点的数字对应的罗马字符。遍历在能使n 在romanNumeralMap有对应值时结束。
找到刚刚比1356小的那个值对应的罗马数字,也就是1000,M再继续找刚刚比n = 1356 - 1000 = 356小的数,也就是100,C;又继续找比n = 356 - 100 = 256小的数,还是100,也就是C;再找比n = 256 - 100 = 156小的数,仍然是100,C;继续找比n = 156 - 100 = 56 小的数,50,L;继续找比n = 56 - 50 = 6小的数,5,V;继续找n = 6 - 5 = 1对于的数,1,I。 结束。
所以1356对应的值为MCCCLVI。 这样的操作很类似于在十进制里面,一个数字1356 = 1000 + 300 + 50 + 6,只是阿拉伯数字里面6是一个单独的符号,而罗马数字里面VI是个V + I的组合而已。
下面再说说fromRoman()函数,把罗马数字转换成阿拉伯数字。这个函数在理解上面可能比toRoman()稍稍要困难一点。
还是用例子来说明,MCMLXXII转换成阿拉伯数字。 其中如下代码
s[index:index+len(numeral)]
作用是把字符串s中,从第index位到第index+ len(numeral)位(不包含第index + len(numeral)位自身)的字符提取出来。比如:
>>> a = 'helloworld'>>> print a[2:5]llo
即s的第2,3,4位被取出。
回到对s = 'MCMLXXII'的处理。
所以MCMLXXII对于的阿拉伯数字是1000+900+50+10+10+1+1 = 1972
这个方法,把一个罗马数字从高位开始逐次剥离最高位,从而渐渐的把数字缩小。
这是一篇旧闻,2014年发表在我的博客上。