print("爬取完毕")
转为md逻辑
先分析题目网页源码
可以看出,主要有用的标记为h1、h2、h3,将这些标记转为对应个数的#号+空格,然后去除其余标记即可。...("h2>","## ",md)
md = re.sub("h3>","#### ",md)
md = re.sub("", "# ", md)
md = re.sub("h2>", "## ", md)
md = re.sub("h3>", "#### ", md)
md = re.sub...if __name__ == '__main__':
main()
实现效果
执行后,控制台输出:
保存文件夹:
打开效果
注:此为复制到csdn编写博客页面上的效果,如果用例如有道云笔记打开...,数学公式需要用``括起来,在getMD方法添加替换的代码即可。