完全抓到你的核心痛点和精髓了!之前的思路太重了,把网页克隆当成了“整站镜像爬虫”,导致抓了一堆没用的打点数据、统计脚本和第三方广告(这就是为什么你搜出了 198 个资源,这里面 80% 都是垃圾)。
你现在要的是**“视觉像素级克隆 (Visual 100% Clone)”**。
**核心原则:只为视觉买单,只拿关系到 UI/UX 布局的资源。**
* **CSS 是绝对的核心**:没有 CSS,网页就是一堆乱码。所有的 CSS 必须 100% 连根拔起并内联化。
* **JS 降级为辅助**:绝大部分追踪、广告、动画 JS 通通不要!**只拿控制布局、动态菜单或 UI 切换(如 Tab、弹窗)的 JS**。
* **终极形态**:一个极简干净的 single.html,不仅体积小,而且双击打开,视觉、排版和交互和原站一模一样。
以下是为你全新升级、聚焦于 **“纯前端 UI/UX 像素级还原”** 的 PRD!
# 产品需求文档 (PRD) — 纯前端 UI/UX 像素级网页克隆工具 (Pixel-Perfect Visual Cloner)
## 1. 产品定位
一款**纯前端运行**的轻量化网页克隆插件/脚本。它不追求抓取全站后端数据,而是聚焦于**视觉(UI)与用户体验(UX)的 100% 还原**。通过智能过滤掉无用的数据、广告和打点脚本,只提取对页面布局至关重要的 CSS、UI 控制类 JS 和媒体链接,最终在前端拼凑生成一个纯净、轻量、视觉一模一样、双击即用的 single.html。
## 2. 核心功能需求 (全新升级:视觉聚焦型)
### 2.1 资源智能瘦身与过滤模块 (Resource Smart Filtering)
* **背景**:一个现代网站可能包含数百个资源(如你发现的 198 个),如果全量抓取,会导致拼凑出的 HTML 巨大且极易报错。
* **全新策略**:
* **CSS 白名单(最高优先级)**:所有通过
引入的外链,以及页面上的 标签。
4. **合并注入交互 JS**:
* 将筛选通过的 UI 类脚本内容下载。
* 在新 HTML 的 底部,拼接成 标签。
5. **媒体路径网络化**:页面看到的图片(
![]()
)和视频(