前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >转-复现,机器学习-支持向量机(SVM)方法判断一个网页是列表页还是详情页

转-复现,机器学习-支持向量机(SVM)方法判断一个网页是列表页还是详情页

作者头像
用户7138673
发布2022-08-11 18:03:49
发布2022-08-11 18:03:49
42000
代码可运行
举报
文章被收录于专栏:大大的小数据大大的小数据
运行总次数:0
代码可运行

https://mp.weixin.qq.com/s/rAwr0_jWMXagHOvhzrE9DA

https://baijiahao.baidu.com/s?id=1639719949469452687&wfr=spider&for=pc

让电脑做一个二分类。

代码语言:javascript
代码运行次数:0
复制
from gerapy_auto_extractor import is_detail, is_list, probability_of_detail, probability_of_list
from gerapy_auto_extractor.helpers import content, jsonify

html = content('detail.html')
print(probability_of_detail(html), probability_of_list(html))
print(is_detail(html), is_list(html))

html = content('list.html')
print(probability_of_detail(html), probability_of_list(html))
print(is_detail(html), is_list(html))

numpy需要卸载重装。

先卸载numpy: pip uninstall numpy

下载numpy:pip install numpy

把网页保存为detail.html、list.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大大的小数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档