首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何下载带有所有依赖项的HTML页面?

如何下载带有所有依赖项的HTML页面?
EN

Stack Overflow用户
提问于 2012-05-17 18:44:18
回答 1查看 1.1K关注 0票数 1

我正在做这个项目,我基本上需要能够在任何页面上放置html按钮(它可以被登录保护),并且一旦用户点击该按钮,页面html和依赖项(css、js、图像等)应该被发送到远程服务器。

最初,我通过使用iframe和隐藏表单,并在用户单击按钮时将页面的url发布到远程服务器。然后,我使用exec中的wget获取页面和依赖项。但是,这显然不适用于受保护的页面。

因此,我的下一个方法是通过表单将页面的innerHTML发送到远程服务器上的php脚本。然后,我尝试使用simplehtmldom运行,使用标记,将相对url转换为绝对url,将它们存储在数组中,并将url替换为同一目录中的路径。然后,我在所有数组上应用wget并下载了这些依赖项。

但是,我再次陷入困境,因为CSS中有背景图像,javascript中有嵌入的html代码。

有人能提出更好的解决方案吗?

谢谢

EN

回答 1

Stack Overflow用户

发布于 2012-05-17 19:59:39

我不确定这会不会成功。事实是,除非您的站点非常简单(也就是说,只有很少的动态部分)并且存在于单击->load->静态范例上,这实际上不再是任何现代站点的工作方式,否则您总是会有一些缺失的部分/依赖项。

如果它是一个超级简单的站点,您可能只需发送html,然后将一个<base> href添加到副本的头上?

如你所知,现在的网站更像是应用程序,你真的需要整个站点,包括所有的“移动部件”。

其他值得注意的事情:

  1. 使用PHP/.NET/Java/Ruby等的ftp函数将模板/css/img目录激发到一个新位置。
  2. 可能会查看HTML2PDF/Canvas工具,这些工具可以将站点当前状态的可视化表示显示到另一个位置。
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10641684

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档