 

共 36 篇文章

标签：图像生成

FLUX.2 [klein] 发布：亚秒级实时图像生成，适配消费级显卡

Black Forest Lab 发布 FLUX.2 [klein] 模型家族，号称迄今为止最快的图像模型。该架构统一了生成与编辑功能，实现亚秒级端到端推理，最高画质下仅需0.5秒。模型专为实时交互设计，支持消费级显卡（约13GB显存），并...

Toy2026-01-17前沿阅读(30)去评论

Ollama v0.14.1 发布：新增实验性图像生成支持

本地大模型运行工具 Ollama 发布 v0.14.1 版本，宣布在 macOS 和 Linux (CUDA) 系统上提供实验性图像生成模型支持。用户现可通过命令体验首个可用模型 Z-Image-Turbo。虽然目前该模型仅支持 macOS...

Toy2026-01-16前沿阅读(38)去评论

智谱发布GLM-Image：自回归融合扩散架构，图像生成能力超越SD3.5

智谱AI正式推出首个开源工业级离散自回归图像生成模型GLM-Image。该模型创新性采用“自回归+扩散解码”混合架构，利用9B参数的GLM-4处理语义逻辑，结合7B参数扩散解码器还原视觉细节。这种设计实现了高精度语义对齐，在中文文字渲染、多...

Toy2026-01-14前沿阅读(37)去评论

面临监管威胁，Grok关停图像生成功能，仅限付费用户使用

埃隆·马斯克的AI工具Grok因被广泛用于制作性暗示和暴力图像而引发强烈抗议，目前已关闭绝大多数用户的图像创建功能。此前，英国首相威胁将采取监管行动，甚至可能禁止X平台。新规将图像生成和编辑功能限制在付费订阅者范围内，以便在滥用时进行身份追...

Toy2026-01-09前沿阅读(39)去评论

免费AI图像生成工具z-image.me上线，引爆创意引擎

开发者基于AI模型z-image推出免费图像生成工具z-image.me，提供无限生成、提示词库、创意引擎和图像解析功能。通过广告模式覆盖成本，承诺限速将随收益提升取消。提示词库支持多语言翻译和预览图，创意引擎可AI分析主题生成提示词。已获...

Toy2026-01-08前沿阅读(36)去评论

AI Prompt打造武林外传新年动漫场景

本文分享了一个精心设计的AI prompt，用于生成融合日本动漫风格与中国传统元素的春节场景。prompt详细描述了武林外传角色在雪天客栈的庆祝活动，包括红灯笼、樱花和烟花等元素。这展示了AI图像生成工具的强大能力，用户可以通过精确的文本提...

Toy2026-01-07前沿阅读(29)去评论

金鱼AI模型上线Artificial Analysis测试平台

Artificial Analysis的Image Arena平台提供了一个创新环境，让用户通过选择偏好图像来评估AI文本到图像模型，无需了解模型提供商。目前，新图像模型“金鱼”正在该平台进行测试。测试中使用了提示“设计一个关于日常运动益处...

Toy2026-01-07前沿阅读(31)去评论

派奇智图开源Imagine Server，免费分享AI图像生成服务

Peinture（派奇智图）服务端Imagine Server正式开源，提供统一的AI图像生成API，支持Hugging Face、Gitee AI、ModelScope等多个提供商。服务端聚合服务，可用于其他项目，未来计划推出OpenAI...

Toy2026-01-04前沿阅读(38)去评论

AI提示词详解：九宫格时尚肖像生成

本文分享了一个详细的AI提示词，用于生成九宫格时尚肖像图像。提示词涵盖视觉风格、主体描述、构图和技术规格，确保输出图像具有高分辨率、时尚感和一致性。该技术适用于AI图像生成领域，如Stable Diffusion，展示了提示工程在优化生成结...

Toy2026-01-03前沿阅读(34)去评论

Google One订阅分级：AI功能分层详解

本文系统梳理了Google One订阅体系，涵盖免费版到高级版，以及新增的Google AI Plus、Pro、Ultra层级。各层级在存储空间、家庭共享、Gemini AI访问权限、图像生成、视频生成模型Veo、深度搜索、文件上传等方面差...

Toy2026-01-02前沿阅读(47)去评论

阿里通义Qwen-Image-2512 GGUF开源发布

阿里通义大模型Qwen-Image-2512 GGUF量化版本已发布，需14GB VRAM运行。该模型聚焦于提升图像生成真实感，包括更真实的人物质感、细腻的自然纹理和复杂的文字渲染。模型已在Hugging Face开源，提供线上Demo和C...

Toy2026-01-01前沿阅读(34)去评论

解决OpenWebUI生图模型chunk过大问题

在OpenWebUI中使用生图模型时，遇到返回体过大（800多KB）导致的chunk too big错误。通过配置ENABLE_CHAT_RESPONSE_BASE64_IMAGE_URL_CONVERSION和CHAT_STREAM_RE...

Toy2026-01-01前沿阅读(56)去评论

Qwen-Image-2512发布：开源AI文生图模型性能跃升

Qwen-Image-2512作为Qwen-Image模型的最新更新，显著提升了图像生成质量。该模型在人物真实感、自然细节渲染和文字准确性方面均有突破，尤其在人像表现上减少了AI痕迹。性能评估显示，它在AI Arena上经过10,000轮盲...

Toy2025-12-31前沿阅读(39)去评论

YPrompt升级：AI绘图与多轮对话功能上线

YPrompt是一个开源AI工具，通过对话挖掘用户需求并生成专业提示词。近日更新新增绘图功能，支持多轮对话生图改图、拖拽上传图片、图片预览、并发生成1-4张图片，以及提示词翻译。用户可配置模型参数，查看详细提示词和图片管理。演示站提供体验，...

Toy2025-12-31前沿阅读(32)去评论

Jimeng AI开源免费服务：超强图像视频生成能力

Jimeng AI推出免费开源服务，支持即梦4.5文生图和jimeng-video-3.5-pro文生视频模型，提供文生图、图生图和视频生成功能。项目可在GitHub获取，支持零配置部署和多路token，接口与OpenAI兼容，需sessi...

Toy2025-12-30前沿阅读(47)去评论

免费AI平台上线：集成GPT-5与Gemini模型

AI FREE FOREVER是一家声称永久免费、无需注册的AI站点，提供多种前沿模型如GPT-5、Gemini 2.5、Qwen 3和Mistral Small。用户可直接访问聊天功能，无需登录。该站点还推出图像生成服务，可免费生成无限A...

Toy2025-12-30前沿阅读(35)去评论

PixToArt 2.0发布：一站式AI图像视频生成平台，集成Sora等顶尖模型

独立开发者江炜推出的AI图像视频生成平台PixToArt完成重大改版并启用新域名。新平台集成了Sora2、Veo3.1、Midjourney等顶尖AI模型，提供’All In One’的图片/视频生成体验。改版后的P...

Toy2025-12-24前沿阅读(42)去评论

ChatGPT Images能否解决PPT中文字体模糊问题？

在数字化办公环境中，AI图像生成工具正成为提升PPT效果的重要手段。然而，用户在使用Google Slides结合nano banana生成图像时，普遍遇到中文字体模糊、清晰度不足的问题，影响了演示质量。本文源自Linux.do社区讨论，用...

Toy2025-12-23前沿阅读(32)去评论

Qwen-Image-Layered：透明层级感知扩散模型

Qwen-Image-Layered是一款最新的开放扩散模型，专注于图像生成领域。该模型结合了透明度和层级感知技术，能够根据文本描述生成高质量图像。作为扩散模型的一种前沿应用，它利用深度学习技术实现逼真的图像转换。近日，该模型在Huggin...

Toy2025-12-20前沿阅读(37)去评论

揭秘Gemini Canvas系统的技术奥秘

本文深入研究了Google Canvas系统的技术实现，发现其能够高效集成多种Gemini模型，包括文本/视觉生成、图像生成、图像编辑和语音合成功能。配额分配机制基于用户Google账号，确保资源合理使用。系统还实现了指数退避错误处理策略，...

Toy2025-12-19前沿阅读(51)去评论

1
2
下一页
共 2 页

前沿哨所

GitHub开源神器：一键完美翻译扫描版PDF文档

本文推荐了一款名为 PDFVisualTranslator 的开源工具，旨在解决扫描版 PDF 文档翻译难题。不同于普通 PDF 翻译工具，该工具针对图像化的文字内容进行了优化，能够精准识别并翻译，同时最大程度保留原文档的排版格式。这对于需要阅读大量外文文献、技术白皮书或扫描资料的用户而言，极大地提升了阅读效率。该工具托管于 GitHub，开发者可关注获取源码并进行个性化部署。

原文链接：V2EX 分享发现

2分钟前
开发者利用AI打造开源书签管理网站

开发者分享了一款名为 ForgetURL 的开源书签管理网站，该项目利用 AI 技术辅助开发。核心特色在于支持“子链接”功能，可将同一服务的多个环境或相关文档聚合。该工具支持 GitHub 和谷歌登录，具备 Chrome 书签批量导入、拖拽管理、深色模式及多种分享权限等实用功能。未来计划推出 Pro 会员及个人主页定制服务，目前产品已开放试用。

原文链接：V2EX 分享发现

2分钟前
Antigravity IDE频发崩溃：用户实测故障排查与谷歌AI工具现状

近期，谷歌AI编程工具Antigravity IDE遭遇频繁崩溃，严重影响开发者体验。用户反映存在模型连接超时、MCP加载失败及上下文重载报错等问题。尽管稳定性堪忧，但因其免费提供谷歌强大的Thinking Opus模型，依然吸引大量开发者使用。本文作者分享了针对性的故障排查技巧，如切换IP、刷新MCP及重启IDE等，并分析认为现状或将倒逼谷歌加强对此类IDE的稳定性维护与功能开发。

原文链接：Linux.do

2分钟前
GenAI陷入“吃尾巴”循环：如何解决模型崩溃与内容危机

文章探讨了生成式AI正在“吃掉自己尾巴”的现象。随着AI生成的内容充斥互联网，未来的模型可能会在低质量或递归生成的数据上进行训练，导致“模型崩溃”。核心挑战在于，如果AI完全取代了人类创作者，新的高质量训练数据来源将面临枯竭。作者强调，建立机制确保知识创造者能从AI生态系统中获益，是维持AI技术长期创新和数据质量可持续性的关键问题。

原文链接：V2EX 分享发现

55分钟前
告别网页查账：开发者开源 Cursor 用量监控 VS Code 插件

近日，一位开发者为了解决 Cursor 编辑器用量查询不便的问题，编写了一款 VS Code 插件。该插件可以在状态栏实时显示当前的 API 请求用量，并支持自动从本地数据库读取 token，无需手动配置。目前该项目已开源，但由于作者仅持有团队版按次计费账号，无法验证 Free、Pro 等其他账号类型的数据结构兼容性。作者呼吁拥有其他类型账号的开发者共同参与维护，完善功能。

原文链接：V2EX 分享发现

55分钟前
独立开发者推出 AI 生图 SaaS Nanoeditor，集成最新模型

一位独立开发者成功构建并上线了名为 Nanoeditor 的 AI 生图 SaaS 网站。该平台集成了最新的 AI 图像生成模型，支持用户根据具体场景生成图片。目前，该项目正处于公测阶段，开发者诚邀科技爱好者注册体验并反馈潜在 Bug。为回馈用户，在评论区留下注册邮箱即可获赠 500 积分，用于体验平台功能。

原文链接：V2EX 分享发现

55分钟前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始