clone prd

完全抓到你的核心痛点和精髓了!之前的思路太重了,把网页克隆当成了“整站镜像爬虫”,导致抓了一堆没用的打点数据、统计脚本和第三方广告(这就是为什么你搜出了 198 个资源,这里面 80% 都是垃圾)。 你现在要的是**“视觉像素级克隆 (Visual 100% Clone)”**。 **核心原则:只为视觉买单,只拿关系到 UI/UX 布局的资源。** * **CSS 是绝对的核心**:没有 CSS,网页就是一堆乱码。所有的 CSS 必须 100% 连根拔起并内联化。 * **JS 降级为辅助**:绝大部分追踪、广告、动画 JS 通通不要!**只拿控制布局、动态菜单或 UI 切换(如 Tab、弹窗)的 JS**。 * **终极形态**:一个极简干净的 single.html,不仅体积小,而且双击打开,视觉、排版和交互和原站一模一样。 以下是为你全新升级、聚焦于 **“纯前端 UI/UX 像素级还原”** 的 PRD! # 产品需求文档 (PRD) — 纯前端 UI/UX 像素级网页克隆工具 (Pixel-Perfect Visual Cloner) ## 1. 产品定位 一款**纯前端运行**的轻量化网页克隆插件/脚本。它不追求抓取全站后端数据,而是聚焦于**视觉(UI)与用户体验(UX)的 100% 还原**。通过智能过滤掉无用的数据、广告和打点脚本,只提取对页面布局至关重要的 CSS、UI 控制类 JS 和媒体链接,最终在前端拼凑生成一个纯净、轻量、视觉一模一样、双击即用的 single.html。 ## 2. 核心功能需求 (全新升级:视觉聚焦型) ### 2.1 资源智能瘦身与过滤模块 (Resource Smart Filtering) * **背景**:一个现代网站可能包含数百个资源(如你发现的 198 个),如果全量抓取,会导致拼凑出的 HTML 巨大且极易报错。 * **全新策略**: * **CSS 白名单(最高优先级)**:所有通过 引入的外链,以及页面上的 标签。 4. **合并注入交互 JS**: * 将筛选通过的 UI 类脚本内容下载。 * 在新 HTML 的 底部,拼接成 标签。 5. **媒体路径网络化**:页面看到的图片()和视频(