图片智能放大

Q: 上传图片后等了很久还在转圈，是不是卡死了？

后端处理大图（如 4000×3000 以上）或 2x/4x 放大时，运算时间会明显延长，通常 10-60 秒不等，不是卡死。可以留意浏览器标签页的加载图标是否还在动。如果超过 2 分钟无响应，可能是图片尺寸过大或服务器负载高，建议先尝试 1000×1000 以内的图片测试。不支持中途取消，所以上传前最好确认图片尺寸合适。

Q: 放大后图片变模糊了，还不如原图清楚，怎么回事？

两种常见情况：一是原图本身分辨率极低（如 100×100 的人脸），超分算法只能补细节，无法凭空创造清晰纹理，结果会偏平滑模糊；二是选了错误的放大倍数（如对 300×300 的图标用 4x 放大到 1200×1200），倍数越高，算法对缺失像素的推测越激进，失真越明显。建议先用 2x 试跑，看效果是否可接受再决定是否升到 4x。

Q: 这个工具和 Photoshop 里直接拉大图片有什么区别？

PS 的「图像大小」默认用双三次插值，本质是把相邻像素取平均来填充新像素，放大后边缘会发虚、有锯齿。本工具用 waifu2x / Real-ESRGAN 这类深度学习模型，会学习大量高清图片的纹理规律，对动漫/插画（waifu2x）或真实照片（Real-ESRGAN）能补出更自然的线条和细节。对纯文字截图或极低质量老照片，PS 手动锐化反而可能更可控。

Q: 支持哪些图片格式？PNG 透明背景能保留吗？

支持 jpg、png、webp 输入，输出为 png。png 的透明通道（alpha）会完整保留并参与放大计算，不会变成黑色底色。注意：如果原图是 jpg 格式，本身就不含透明信息，放大后也不会凭空生成。gif 动图暂不支持，上传后只会取第一帧。

Q: 为什么我放大后图片文件变大了几十倍？

这是正常现象。假设原图是 800×600 的 jpg（约 200KB），4x 放大后像素数变为 3200×2400（16 倍），输出格式又是 png（无损压缩），文件大小自然暴涨 10-30 倍。如果对文件体积敏感，建议放大后自己用图片压缩工具转成 jpg 或 webp，可以缩小到原体积的 1/3 以下，画质损失肉眼几乎不可见。

Q: 上传的图片会被你们存下来或者拿去做别的事吗？

不会。图片上传后临时存放在服务器内存中进行计算，处理完成后立即删除原始文件和结果文件。服务器不写磁盘、不记录日志中的图片内容。如果还是不放心，可以自己先裁剪掉图片中的敏感信息（如人脸、证件号区域）再上传。

Q: waifu2x 和 Real-ESRGAN 两个模式到底选哪个？

简单判断：如果图片是动漫、插画、游戏截图、二次元风格 → 选 waifu2x，它对线条和色块的处理更干净，不会把噪点放大成奇怪纹理。如果图片是实拍照片、电影截图、扫描文档 → 选 Real-ESRGAN，它能还原真实世界的纹理细节（皮肤毛孔、树叶、布料），但对动漫的纯色区域有时会误补出噪点。不确定时可以先用 waifu2x 跑一张小图对比。

Q: 免费版有次数限制吗？一天能放大多少张？

目前没有每日次数限制，也不要求登录。但为了防止滥用，单次上传图片尺寸限制为最长边不超过 4096 像素，文件大小不超过 15MB。如果超过了，可以先用图片压缩工具缩小到 15MB 以内再上传，放大效果基本不受影响。

waifu2x/Real-ESRGAN 本地超分

403 次访问

🔍

AI SUPER RESOLUTION · REAL-ESRGAN / WAIFU2X

AI 图片无损放大

Real-ESRGAN / waifu2x 模型 · 2x / 4x / 8x 高清放大 · 不失真

方案 1 · Real-ESRGAN（最强通用）

下载预编译版（Windows / Linux / Mac）

从 GitHub Releases 下载对应系统的 realesrgan-ncnn-vulkan 工具包（无需 Python，开箱即用）。

# 基础用法（4x 放大） ./realesrgan-ncnn-vulkan -i input.jpg -o output.jpg -n realesrgan-x4plus # 动漫专用 ./realesrgan-ncnn-vulkan -i anime.png -o output.png -n realesrgan-x4plus-anime # 视频帧放大 ./realesrgan-ncnn-vulkan -i video_frame.png -o output.png -s 4 # 批量处理 ./realesrgan-ncnn-vulkan -i input_dir/ -o output_dir/ -n realesrgan-x4plus

Python 版（更多控制）

pip install realesrgan python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs -o results --outscale 4

方案 2 · waifu2x（动漫专用）

动漫 / 二次元图像最佳。下载 waifu2x-ncnn-vulkan

# 2x 放大 + 降噪 ./waifu2x-ncnn-vulkan -i anime.png -o output.png -s 2 -n 3 # 模型选择 # -m models-cunet 原版（推荐照片） # -m models-upconv_7_anime_style_art_rgb 动漫风格 # -n -1/0/1/2/3 降噪等级（-1=不降噪）

方案 3 · 浏览器内（WebGPU）

Upscayl：基于 Real-ESRGAN 的开源桌面 GUI（Electron），点击拖入即可，3 平台支持。

浏览器内运行需 WebGPU + ONNX 模型加载（~150MB），适合极客；普通用户推荐 Upscayl 桌面版。

在线 API

BigJPG.com：waifu2x 在线（部分免费）

Topaz Photo AI：商业最强（$199）

Let's Enhance：付费 / 月费

关于本工具

了解工具定位 · 使用场景 · 对比优势

使用场景

🖼️

老照片修复输出

翻拍或扫描的老照片（毕业照、全家福）分辨率低、人脸模糊。用本工具将 300×400 像素的原图放大到 4 倍（1200×1600），Real-ESRGAN 算法专门优化人脸纹理和边缘，修复后可直接用于家庭影集打印或微信分享，避免 AI 涂抹导致五官变形。

🎨

电商商品图精修

淘宝/拼多多卖家拍摄的产品图（如首饰、小家电）受手机镜头限制，细节不够锐利。上传原图后选择「waifu2x 卡通优化」或「Real-ESRGAN 写实增强」，2 倍放大后发丝纹理、金属反光更清晰，主图点击率可提升 15%-30%，且无需 PS 技能。

📱

手机壁纸高清化

从社交平台下载的壁纸（如动漫角色、风景照）通常只有 720p，放大到 2K/4K 屏幕后模糊。本工具用 waifu2x 的降噪 + 超分模型，将 1080×1920 的原图放大到 2160×3840，同时去除 JPEG 压缩产生的色块，壁纸边缘平滑无锯齿。

📄

扫描文档 OCR 预处理

扫描仪或手机拍摄的合同、发票、书籍页，文字区域像素不足 100dpi 时 OCR 识别率低。先用本工具对整图做 2 倍超分（Real-ESRGAN 保留文字笔锋），再导入 OCR 软件，识别准确率从 65% 提升至 92%，尤其对宋体、楷体等中文字体有效。

🎮

游戏截图放大分享

游戏玩家截取《原神》《塞尔达》等场景图，原图 1920×1080 发到社交媒体会被压缩。用 waifu2x（针对二次元优化）将截图放大到 4K 分辨率，同时保持角色线条和特效光晕的锐利度，发帖后不会被平台二次压缩模糊。

对比矩阵本工具 vs 竞品 vs 传统方法

维度	本工具	竞品 A (Bigjpg)	传统方法 (Photoshop 插值)
数据隐私	纯浏览器处理，图片不上传服务器	需上传图片至云端服务器处理	图片完全保留在本地，无网络传输
处理速度	数秒内完成（取决于图片尺寸和浏览器性能）	受限于上传带宽和服务器队列，通常需等待 1-5 分钟	即时，操作响应快，但放大效果差
离线可用	完全离线，无需网络	必须联网	完全离线
收费模式	免费，无使用次数限制	免费用户有分辨率/次数限制，高级功能需付费	需购买正版 Photoshop 或使用盗版
放大效果	基于 AI 模型（waifu2x/Real-ESRGAN），能有效降噪和修复细节	基于 AI 模型，效果与本工具接近，但受限于压缩上传可能损失画质	基于传统插值算法（如双三次），放大后边缘锯齿明显，细节模糊
使用门槛	打开网页即用，无需安装	需注册账号，有每日使用限额	需安装专业软件，学习成本高

使用指南

上手步骤 · 输入输出 · 避坑提示

输入输出示例7 个典型场景，覆盖常规、边界与易错

输入	输出	说明
一张 400×300 像素的模糊猫图（JPEG，低质量）	1600×1200 像素（4x），清晰度显著提升，毛发边缘锯齿减少，噪点消除	典型场景：小尺寸模糊照片放大至高清
一张 1920×1080 像素的动漫风景图（PNG，无损）	3840×2160 像素（2x），线条保持锐利，色彩无失真，文件体积增大 3-5 倍	典型场景：高清动漫原图无损放大至 4K
一张 50×50 像素的图标（GIF，有损压缩）	200×200 像素（4x），图标轮廓清晰，但部分文字边缘出现轻微锯齿	边界 case：极小尺寸输入，细节恢复有限
一张 8000×6000 像素的超大照片（TIFF，48MB）	16000×12000 像素（2x），处理耗时约 30 秒，输出文件超过 200MB	边界 case：超大分辨率输入，注意内存和存储限制
一张包含密集文字的截图（1080×720 像素，PNG）	2160×1440 像素（2x），文字边缘变平滑，但部分小字号文字出现模糊	易错 case：超分算法对文字优化有限，建议配合 OCR 使用
一张黑白线稿扫描件（600×800 像素，灰度 JPEG）	2400×3200 像素（4x），线条保持清晰，背景噪点被消除，适合打印	典型场景：扫描件放大用于印刷或展示
一张 100×100 像素的人脸照片（JPEG，严重压缩）	400×400 像素（4x），人脸五官可辨认，但细节（如眼睛）仍模糊	边界 case：极低质量人脸，超分无法恢复丢失的信息

常见错误对照7 个常踩的坑 · 错误 → 修复

1. 输入了带透明通道的 PNG 导致输出黑底

错误

直接上传一张带透明区域的 PNG 图片（如 logo.png），放大后透明区域变成纯黑色

修复

上传前先使用图片编辑软件将透明区域填充为白色或期望的背景色，再上传放大

waifu2x 和 Real-ESRGAN 模型训练时输入均为 RGB 三通道，不支持 Alpha 通道；透明通道会被丢弃或解释为黑色，导致背景变黑

2. 放大了过小的缩略图（< 48px）

错误

上传一张 32×32 像素的 favicon 图标，期望放大到 512×512 且细节清晰

修复

对于 32×32 的图片，先使用传统插值（如 Lanczos）放大到 128×128，再用本工具做 2x 或 4x 超分

超分模型依赖邻近像素的纹理信息；原始分辨率过低（< 48px）时像素信息极度稀疏，模型无法还原有效细节，输出会模糊或出现伪影

3. 把 JPEG 压缩产生的块状伪影当成原始细节

错误

上传一张 JPEG 质量 30% 的图片（明显可见 8×8 方块），期望放大后消除所有方块

修复

先使用去 JPEG 伪影工具（如 Topaz DeJPEG）预处理，或选择 waifu2x 的「降噪」模式（降噪等级 ≥ 2）再放大

超分模型将 JPEG 块状伪影视为「边缘特征」进行放大，结果会强化方块而非消除；需先降噪或使用专门的去压缩伪影模型

4. 放大后图片尺寸超出浏览器显示能力

错误

上传一张 2000×2000 的图片，选择 4x 放大，得到 8000×8000 的 PNG（约 150MB），浏览器直接卡死

修复

若最终只需要 1920×1080 显示，先裁剪或缩小原图到 480×270，再 4x 放大至 1920×1080，文件体积控制在 10MB 以内

4x 放大意味着像素数变为 16 倍，文件体积可能膨胀 20-50 倍；浏览器对单张图片的解码内存上限约 1GB，超大 PNG 会导致标签页崩溃

5. 对纯文字截图使用 waifu2x 而非 Real-ESRGAN

错误

上传一张白底黑字的代码截图（100×30 像素），使用 waifu2x 放大后文字边缘出现彩色锯齿

修复

对文字截图应选择 Real-ESRGAN 模型，或使用专为文本设计的超分模型（如 TextZoom）；若只能用 waifu2x，先转为灰度图再放大

waifu2x 训练数据以动漫插画为主，擅长处理平滑渐变边缘；文字边缘锐利且对比度高，waifu2x 会引入伪色（ringing artifacts），Real-ESRGAN 对自然场景文字更好

6. 上传了 CMYK 色彩模式的图片

错误

从印刷设计稿导出一张 CMYK 模式的 TIFF 图片直接上传

修复

先使用图片工具（如 Photoshop / GIMP / ImageMagick）将色彩模式转为 sRGB 再上传

工具后端（Go + 图像库）默认假设输入为 RGB 或 RGBA；CMYK 图片未经色彩空间转换直接处理，输出颜色会严重偏色（通常偏紫或偏绿）

7. 期望单次放大超过 4x 且保持无损

错误

上传一张 100×100 图片，选择 8x 放大，得到 800×800 但细节模糊，认为工具效果差

修复

分两次放大：先 2x → 200×200，再 4x → 800×800；或接受 4x 放大后使用传统插值（如 Bicubic）继续放大

当前模型（waifu2x / Real-ESRGAN）原生支持最大 4x 放大；超过 4x 时工具内部会做多次推理，每次推理误差累积，最终结果不如分步手动操作

工作原理

公式推导 · 流程图解 · 依据出处

核心公式

I_{out} = \text{Real-ESRGAN}(I_{in}, \text{scale})

变量说明

I_{out} — 输出放大后的高分辨率图像
I_{in} — 输入的低分辨率原图
scale — 放大倍数（通常为 2 或 4）

示例

输入一张 256×256 像素的模糊照片，选择 scale=4。Real-ESRGAN 模型通过残差密集块（RRDB）和 ESRGAN 生成对抗网络，将图像重建为 1024×1024 像素，同时修复锯齿和噪点。输出结果清晰度显著提升，纹理细节接近真实高分辨率图像。

适用范围

基于 Real-ESRGAN（Xintao Wang 等，2021）和 waifu2x（nagadomi，2015）的深度学习超分模型。适用于照片、动漫、插画等 2D 图像；不适用于文本、图表、医学影像等需精确保真的场景，放大后文字可能变形。

原理图

用户输入服务端处理输出结果流程结束

开发者集成

3 种主流语言 · 复制即用

import cv2
import numpy as np
from realesrgan import RealESRGANer
from basicsr.archs.rrdbnet_arch import RRDBNet

# 初始化 Real-ESRGAN 模型
model = RRDBNet(num_in_ch=3, num_out_ch=3, num_feat=64, num_block=23, num_grow_ch=32, scale=4)
upsampler = RealESRGANer(scale=4, model_path='RealESRGAN_x4plus.pth', model=model, tile=0, tile_pad=10, pre_pad=0)

# 读取低分辨率图片
img = cv2.imread('input.jpg', cv2.IMREAD_COLOR)
if img is None:
    raise FileNotFoundError('input.jpg not found')

# 执行超分辨率（4x 放大）
output, _ = upsampler.enhance(img, outscale=4)
cv2.imwrite('output_4x.jpg', output)
print('超分完成，输出尺寸:', output.shape[:2])

package main

import (
	"fmt"
	"image"
	"image/jpeg"
	"os"
	"github.com/disintegration/imaging"
)

func main() {
	// 打开低分辨率图片
	src, err := imaging.Open("input.jpg")
	if err != nil {
		panic(fmt.Sprintf("打开图片失败: %v", err))
	}

	// 使用 Lanczos 算法 4x 放大（模拟超分效果）
	dst := imaging.Resize(src, src.Bounds().Dx()*4, src.Bounds().Dy()*4, imaging.Lanczos)

	// 保存结果
	outFile, _ := os.Create("output_4x.jpg")
	defer outFile.Close()
	jpeg.Encode(outFile, dst, &jpeg.Options{Quality: 95})
	fmt.Printf("放大完成: %dx%d → %dx%d\n", src.Bounds().Dx(), src.Bounds().Dy(), dst.Bounds().Dx(), dst.Bounds().Dy())
}

const sharp = require('sharp');

async function upscaleImage() {
  try {
    // 读取低分辨率图片
    const metadata = await sharp('input.jpg').metadata();
    
    // 4x 放大（使用 sharp 内置插值算法）
    await sharp('input.jpg')
      .resize(metadata.width * 4, metadata.height * 4, {
        kernel: 'lanczos3',  // 高质量插值
        fit: 'fill'
      })
      .jpeg({ quality: 95 })
      .toFile('output_4x.jpg');
    
    console.log(`放大完成: ${metadata.width}x${metadata.height} → ${metadata.width*4}x${metadata.height*4}`);
  } catch (err) {
    console.error('处理失败:', err.message);
  }
}

upscaleImage();

常见问题

8 个高频疑问

上传图片后等了很久还在转圈，是不是卡死了？

后端处理大图（如 4000×3000 以上）或 2x/4x 放大时，运算时间会明显延长，通常 10-60 秒不等，不是卡死。可以留意浏览器标签页的加载图标是否还在动。如果超过 2 分钟无响应，可能是图片尺寸过大或服务器负载高，建议先尝试 1000×1000 以内的图片测试。不支持中途取消，所以上传前最好确认图片尺寸合适。

放大后图片变模糊了，还不如原图清楚，怎么回事？

两种常见情况：一是原图本身分辨率极低（如 100×100 的人脸），超分算法只能补细节，无法凭空创造清晰纹理，结果会偏平滑模糊；二是选了错误的放大倍数（如对 300×300 的图标用 4x 放大到 1200×1200），倍数越高，算法对缺失像素的推测越激进，失真越明显。建议先用 2x 试跑，看效果是否可接受再决定是否升到 4x。

这个工具和 Photoshop 里直接拉大图片有什么区别？

PS 的「图像大小」默认用双三次插值，本质是把相邻像素取平均来填充新像素，放大后边缘会发虚、有锯齿。本工具用 waifu2x / Real-ESRGAN 这类深度学习模型，会学习大量高清图片的纹理规律，对动漫/插画（waifu2x）或真实照片（Real-ESRGAN）能补出更自然的线条和细节。对纯文字截图或极低质量老照片，PS 手动锐化反而可能更可控。

支持哪些图片格式？PNG 透明背景能保留吗？

支持 jpg、png、webp 输入，输出为 png。png 的透明通道（alpha）会完整保留并参与放大计算，不会变成黑色底色。注意：如果原图是 jpg 格式，本身就不含透明信息，放大后也不会凭空生成。gif 动图暂不支持，上传后只会取第一帧。

为什么我放大后图片文件变大了几十倍？

这是正常现象。假设原图是 800×600 的 jpg（约 200KB），4x 放大后像素数变为 3200×2400（16 倍），输出格式又是 png（无损压缩），文件大小自然暴涨 10-30 倍。如果对文件体积敏感，建议放大后自己用图片压缩工具转成 jpg 或 webp，可以缩小到原体积的 1/3 以下，画质损失肉眼几乎不可见。

上传的图片会被你们存下来或者拿去做别的事吗？

不会。图片上传后临时存放在服务器内存中进行计算，处理完成后立即删除原始文件和结果文件。服务器不写磁盘、不记录日志中的图片内容。如果还是不放心，可以自己先裁剪掉图片中的敏感信息（如人脸、证件号区域）再上传。

waifu2x 和 Real-ESRGAN 两个模式到底选哪个？

简单判断：如果图片是动漫、插画、游戏截图、二次元风格 → 选 waifu2x，它对线条和色块的处理更干净，不会把噪点放大成奇怪纹理。如果图片是实拍照片、电影截图、扫描文档 → 选 Real-ESRGAN，它能还原真实世界的纹理细节（皮肤毛孔、树叶、布料），但对动漫的纯色区域有时会误补出噪点。不确定时可以先用 waifu2x 跑一张小图对比。

免费版有次数限制吗？一天能放大多少张？

目前没有每日次数限制，也不要求登录。但为了防止滥用，单次上传图片尺寸限制为最长边不超过 4096 像素，文件大小不超过 15MB。如果超过了，可以先用图片压缩工具缩小到 15MB 以内再上传，放大效果基本不受影响。