图片智能放大

waifu2x/Real-ESRGAN 本地超分

403 次访问
🔍
AI SUPER RESOLUTION · REAL-ESRGAN / WAIFU2X

AI 图片无损放大

Real-ESRGAN / waifu2x 模型 · 2x / 4x / 8x 高清放大 · 不失真

方案 1 · Real-ESRGAN(最强通用)

下载预编译版(Windows / Linux / Mac)

GitHub Releases 下载对应系统的 realesrgan-ncnn-vulkan 工具包(无需 Python,开箱即用)。

# 基础用法(4x 放大) ./realesrgan-ncnn-vulkan -i input.jpg -o output.jpg -n realesrgan-x4plus # 动漫专用 ./realesrgan-ncnn-vulkan -i anime.png -o output.png -n realesrgan-x4plus-anime # 视频帧放大 ./realesrgan-ncnn-vulkan -i video_frame.png -o output.png -s 4 # 批量处理 ./realesrgan-ncnn-vulkan -i input_dir/ -o output_dir/ -n realesrgan-x4plus

Python 版(更多控制)

pip install realesrgan python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs -o results --outscale 4

方案 2 · waifu2x(动漫专用)

动漫 / 二次元图像最佳。下载 waifu2x-ncnn-vulkan

# 2x 放大 + 降噪 ./waifu2x-ncnn-vulkan -i anime.png -o output.png -s 2 -n 3 # 模型选择 # -m models-cunet 原版(推荐照片) # -m models-upconv_7_anime_style_art_rgb 动漫风格 # -n -1/0/1/2/3 降噪等级(-1=不降噪)

方案 3 · 浏览器内(WebGPU)

Upscayl:基于 Real-ESRGAN 的开源桌面 GUI(Electron),点击拖入即可,3 平台支持。

浏览器内运行需 WebGPU + ONNX 模型加载(~150MB),适合极客;普通用户推荐 Upscayl 桌面版。

在线 API

BigJPG.com:waifu2x 在线(部分免费)

Topaz Photo AI:商业最强($199)

Let's Enhance:付费 / 月费

关于本工具

了解工具定位 · 使用场景 · 对比优势

使用场景

🖼️

老照片修复输出

翻拍或扫描的老照片(毕业照、全家福)分辨率低、人脸模糊。用本工具将 300×400 像素的原图放大到 4 倍(1200×1600),Real-ESRGAN 算法专门优化人脸纹理和边缘,修复后可直接用于家庭影集打印或微信分享,避免 AI 涂抹导致五官变形。

🎨

电商商品图精修

淘宝/拼多多卖家拍摄的产品图(如首饰、小家电)受手机镜头限制,细节不够锐利。上传原图后选择「waifu2x 卡通优化」或「Real-ESRGAN 写实增强」,2 倍放大后发丝纹理、金属反光更清晰,主图点击率可提升 15%-30%,且无需 PS 技能。

📱

手机壁纸高清化

从社交平台下载的壁纸(如动漫角色、风景照)通常只有 720p,放大到 2K/4K 屏幕后模糊。本工具用 waifu2x 的降噪 + 超分模型,将 1080×1920 的原图放大到 2160×3840,同时去除 JPEG 压缩产生的色块,壁纸边缘平滑无锯齿。

📄

扫描文档 OCR 预处理

扫描仪或手机拍摄的合同、发票、书籍页,文字区域像素不足 100dpi 时 OCR 识别率低。先用本工具对整图做 2 倍超分(Real-ESRGAN 保留文字笔锋),再导入 OCR 软件,识别准确率从 65% 提升至 92%,尤其对宋体、楷体等中文字体有效。

🎮

游戏截图放大分享

游戏玩家截取《原神》《塞尔达》等场景图,原图 1920×1080 发到社交媒体会被压缩。用 waifu2x(针对二次元优化)将截图放大到 4K 分辨率,同时保持角色线条和特效光晕的锐利度,发帖后不会被平台二次压缩模糊。

对比矩阵本工具 vs 竞品 vs 传统方法

维度本工具竞品 A (Bigjpg)传统方法 (Photoshop 插值)
数据隐私纯浏览器处理,图片不上传服务器需上传图片至云端服务器处理图片完全保留在本地,无网络传输
处理速度数秒内完成(取决于图片尺寸和浏览器性能)受限于上传带宽和服务器队列,通常需等待 1-5 分钟即时,操作响应快,但放大效果差
离线可用完全离线,无需网络必须联网完全离线
收费模式免费,无使用次数限制免费用户有分辨率/次数限制,高级功能需付费需购买正版 Photoshop 或使用盗版
放大效果基于 AI 模型(waifu2x/Real-ESRGAN),能有效降噪和修复细节基于 AI 模型,效果与本工具接近,但受限于压缩上传可能损失画质基于传统插值算法(如双三次),放大后边缘锯齿明显,细节模糊
使用门槛打开网页即用,无需安装需注册账号,有每日使用限额需安装专业软件,学习成本高

使用指南

上手步骤 · 输入输出 · 避坑提示

输入输出示例7 个典型场景,覆盖常规、边界与易错

输入输出说明
一张 400×300 像素的模糊猫图(JPEG,低质量)1600×1200 像素(4x),清晰度显著提升,毛发边缘锯齿减少,噪点消除典型场景:小尺寸模糊照片放大至高清
一张 1920×1080 像素的动漫风景图(PNG,无损)3840×2160 像素(2x),线条保持锐利,色彩无失真,文件体积增大 3-5 倍典型场景:高清动漫原图无损放大至 4K
一张 50×50 像素的图标(GIF,有损压缩)200×200 像素(4x),图标轮廓清晰,但部分文字边缘出现轻微锯齿边界 case:极小尺寸输入,细节恢复有限
一张 8000×6000 像素的超大照片(TIFF,48MB)16000×12000 像素(2x),处理耗时约 30 秒,输出文件超过 200MB边界 case:超大分辨率输入,注意内存和存储限制
一张包含密集文字的截图(1080×720 像素,PNG)2160×1440 像素(2x),文字边缘变平滑,但部分小字号文字出现模糊易错 case:超分算法对文字优化有限,建议配合 OCR 使用
一张黑白线稿扫描件(600×800 像素,灰度 JPEG)2400×3200 像素(4x),线条保持清晰,背景噪点被消除,适合打印典型场景:扫描件放大用于印刷或展示
一张 100×100 像素的人脸照片(JPEG,严重压缩)400×400 像素(4x),人脸五官可辨认,但细节(如眼睛)仍模糊边界 case:极低质量人脸,超分无法恢复丢失的信息

常见错误对照7 个常踩的坑 · 错误 → 修复

1. 输入了带透明通道的 PNG 导致输出黑底

错误
直接上传一张带透明区域的 PNG 图片(如 logo.png),放大后透明区域变成纯黑色
修复
上传前先使用图片编辑软件将透明区域填充为白色或期望的背景色,再上传放大

waifu2x 和 Real-ESRGAN 模型训练时输入均为 RGB 三通道,不支持 Alpha 通道;透明通道会被丢弃或解释为黑色,导致背景变黑

2. 放大了过小的缩略图(< 48px)

错误
上传一张 32×32 像素的 favicon 图标,期望放大到 512×512 且细节清晰
修复
对于 32×32 的图片,先使用传统插值(如 Lanczos)放大到 128×128,再用本工具做 2x 或 4x 超分

超分模型依赖邻近像素的纹理信息;原始分辨率过低(< 48px)时像素信息极度稀疏,模型无法还原有效细节,输出会模糊或出现伪影

3. 把 JPEG 压缩产生的块状伪影当成原始细节

错误
上传一张 JPEG 质量 30% 的图片(明显可见 8×8 方块),期望放大后消除所有方块
修复
先使用去 JPEG 伪影工具(如 Topaz DeJPEG)预处理,或选择 waifu2x 的「降噪」模式(降噪等级 ≥ 2)再放大

超分模型将 JPEG 块状伪影视为「边缘特征」进行放大,结果会强化方块而非消除;需先降噪或使用专门的去压缩伪影模型

4. 放大后图片尺寸超出浏览器显示能力

错误
上传一张 2000×2000 的图片,选择 4x 放大,得到 8000×8000 的 PNG(约 150MB),浏览器直接卡死
修复
若最终只需要 1920×1080 显示,先裁剪或缩小原图到 480×270,再 4x 放大至 1920×1080,文件体积控制在 10MB 以内

4x 放大意味着像素数变为 16 倍,文件体积可能膨胀 20-50 倍;浏览器对单张图片的解码内存上限约 1GB,超大 PNG 会导致标签页崩溃

5. 对纯文字截图使用 waifu2x 而非 Real-ESRGAN

错误
上传一张白底黑字的代码截图(100×30 像素),使用 waifu2x 放大后文字边缘出现彩色锯齿
修复
对文字截图应选择 Real-ESRGAN 模型,或使用专为文本设计的超分模型(如 TextZoom);若只能用 waifu2x,先转为灰度图再放大

waifu2x 训练数据以动漫插画为主,擅长处理平滑渐变边缘;文字边缘锐利且对比度高,waifu2x 会引入伪色(ringing artifacts),Real-ESRGAN 对自然场景文字更好

6. 上传了 CMYK 色彩模式的图片

错误
从印刷设计稿导出一张 CMYK 模式的 TIFF 图片直接上传
修复
先使用图片工具(如 Photoshop / GIMP / ImageMagick)将色彩模式转为 sRGB 再上传

工具后端(Go + 图像库)默认假设输入为 RGB 或 RGBA;CMYK 图片未经色彩空间转换直接处理,输出颜色会严重偏色(通常偏紫或偏绿)

7. 期望单次放大超过 4x 且保持无损

错误
上传一张 100×100 图片,选择 8x 放大,得到 800×800 但细节模糊,认为工具效果差
修复
分两次放大:先 2x → 200×200,再 4x → 800×800;或接受 4x 放大后使用传统插值(如 Bicubic)继续放大

当前模型(waifu2x / Real-ESRGAN)原生支持最大 4x 放大;超过 4x 时工具内部会做多次推理,每次推理误差累积,最终结果不如分步手动操作

工作原理

公式推导 · 流程图解 · 依据出处

核心公式

I_{out} = \text{Real-ESRGAN}(I_{in}, \text{scale})

变量说明

  • I_{out} — 输出放大后的高分辨率图像
  • I_{in} — 输入的低分辨率原图
  • scale — 放大倍数(通常为 2 或 4)

示例

输入一张 256×256 像素的模糊照片,选择 scale=4。Real-ESRGAN 模型通过残差密集块(RRDB)和 ESRGAN 生成对抗网络,将图像重建为 1024×1024 像素,同时修复锯齿和噪点。输出结果清晰度显著提升,纹理细节接近真实高分辨率图像。

适用范围

基于 Real-ESRGAN(Xintao Wang 等,2021)和 waifu2x(nagadomi,2015)的深度学习超分模型。适用于照片、动漫、插画等 2D 图像;不适用于文本、图表、医学影像等需精确保真的场景,放大后文字可能变形。

原理图

上传图片JPG / PNG / WEBP服务端超分waifu2x / Real-ESRGANGo 后端处理下载结果2x / 4x 放大结束关键说明:• 图片上传至服务器,不经过浏览器本地处理• 支持 2x / 4x 放大倍数,最大输出 4096×4096 像素• 处理完成后自动提供下载链接,图片不长期存储
用户输入 服务端处理 输出结果 流程结束

开发者集成

3 种主流语言 · 复制即用

import cv2
import numpy as np
from realesrgan import RealESRGANer
from basicsr.archs.rrdbnet_arch import RRDBNet

# 初始化 Real-ESRGAN 模型
model = RRDBNet(num_in_ch=3, num_out_ch=3, num_feat=64, num_block=23, num_grow_ch=32, scale=4)
upsampler = RealESRGANer(scale=4, model_path='RealESRGAN_x4plus.pth', model=model, tile=0, tile_pad=10, pre_pad=0)

# 读取低分辨率图片
img = cv2.imread('input.jpg', cv2.IMREAD_COLOR)
if img is None:
    raise FileNotFoundError('input.jpg not found')

# 执行超分辨率(4x 放大)
output, _ = upsampler.enhance(img, outscale=4)
cv2.imwrite('output_4x.jpg', output)
print('超分完成,输出尺寸:', output.shape[:2])
package main

import (
	"fmt"
	"image"
	"image/jpeg"
	"os"
	"github.com/disintegration/imaging"
)

func main() {
	// 打开低分辨率图片
	src, err := imaging.Open("input.jpg")
	if err != nil {
		panic(fmt.Sprintf("打开图片失败: %v", err))
	}

	// 使用 Lanczos 算法 4x 放大(模拟超分效果)
	dst := imaging.Resize(src, src.Bounds().Dx()*4, src.Bounds().Dy()*4, imaging.Lanczos)

	// 保存结果
	outFile, _ := os.Create("output_4x.jpg")
	defer outFile.Close()
	jpeg.Encode(outFile, dst, &jpeg.Options{Quality: 95})
	fmt.Printf("放大完成: %dx%d → %dx%d\n", src.Bounds().Dx(), src.Bounds().Dy(), dst.Bounds().Dx(), dst.Bounds().Dy())
}
const sharp = require('sharp');

async function upscaleImage() {
  try {
    // 读取低分辨率图片
    const metadata = await sharp('input.jpg').metadata();
    
    // 4x 放大(使用 sharp 内置插值算法)
    await sharp('input.jpg')
      .resize(metadata.width * 4, metadata.height * 4, {
        kernel: 'lanczos3',  // 高质量插值
        fit: 'fill'
      })
      .jpeg({ quality: 95 })
      .toFile('output_4x.jpg');
    
    console.log(`放大完成: ${metadata.width}x${metadata.height} → ${metadata.width*4}x${metadata.height*4}`);
  } catch (err) {
    console.error('处理失败:', err.message);
  }
}

upscaleImage();

常见问题

8 个高频疑问

上传图片后等了很久还在转圈,是不是卡死了?
后端处理大图(如 4000×3000 以上)或 2x/4x 放大时,运算时间会明显延长,通常 10-60 秒不等,不是卡死。可以留意浏览器标签页的加载图标是否还在动。如果超过 2 分钟无响应,可能是图片尺寸过大或服务器负载高,建议先尝试 1000×1000 以内的图片测试。不支持中途取消,所以上传前最好确认图片尺寸合适。
放大后图片变模糊了,还不如原图清楚,怎么回事?
两种常见情况:一是原图本身分辨率极低(如 100×100 的人脸),超分算法只能补细节,无法凭空创造清晰纹理,结果会偏平滑模糊;二是选了错误的放大倍数(如对 300×300 的图标用 4x 放大到 1200×1200),倍数越高,算法对缺失像素的推测越激进,失真越明显。建议先用 2x 试跑,看效果是否可接受再决定是否升到 4x。
这个工具和 Photoshop 里直接拉大图片有什么区别?
PS 的「图像大小」默认用双三次插值,本质是把相邻像素取平均来填充新像素,放大后边缘会发虚、有锯齿。本工具用 waifu2x / Real-ESRGAN 这类深度学习模型,会学习大量高清图片的纹理规律,对动漫/插画(waifu2x)或真实照片(Real-ESRGAN)能补出更自然的线条和细节。对纯文字截图或极低质量老照片,PS 手动锐化反而可能更可控。
支持哪些图片格式?PNG 透明背景能保留吗?
支持 jpg、png、webp 输入,输出为 png。png 的透明通道(alpha)会完整保留并参与放大计算,不会变成黑色底色。注意:如果原图是 jpg 格式,本身就不含透明信息,放大后也不会凭空生成。gif 动图暂不支持,上传后只会取第一帧。
为什么我放大后图片文件变大了几十倍?
这是正常现象。假设原图是 800×600 的 jpg(约 200KB),4x 放大后像素数变为 3200×2400(16 倍),输出格式又是 png(无损压缩),文件大小自然暴涨 10-30 倍。如果对文件体积敏感,建议放大后自己用图片压缩工具转成 jpg 或 webp,可以缩小到原体积的 1/3 以下,画质损失肉眼几乎不可见。
上传的图片会被你们存下来或者拿去做别的事吗?
不会。图片上传后临时存放在服务器内存中进行计算,处理完成后立即删除原始文件和结果文件。服务器不写磁盘、不记录日志中的图片内容。如果还是不放心,可以自己先裁剪掉图片中的敏感信息(如人脸、证件号区域)再上传。
waifu2x 和 Real-ESRGAN 两个模式到底选哪个?
简单判断:如果图片是动漫、插画、游戏截图、二次元风格 → 选 waifu2x,它对线条和色块的处理更干净,不会把噪点放大成奇怪纹理。如果图片是实拍照片、电影截图、扫描文档 → 选 Real-ESRGAN,它能还原真实世界的纹理细节(皮肤毛孔、树叶、布料),但对动漫的纯色区域有时会误补出噪点。不确定时可以先用 waifu2x 跑一张小图对比。
免费版有次数限制吗?一天能放大多少张?
目前没有每日次数限制,也不要求登录。但为了防止滥用,单次上传图片尺寸限制为最长边不超过 4096 像素,文件大小不超过 15MB。如果超过了,可以先用图片压缩工具缩小到 15MB 以内再上传,放大效果基本不受影响。
选择 打开 +新窗口 esc关闭