共 5 篇文章

标签：模型优化

CodePlan Beta稳定运行，Claude支持与模型优化升级

X-AIO旗下品牌CodePlan在Beta阶段实现稳定运行，团队在过去半个月内完善了多项关键技术，包括Claude原生支持、优化转义层、提升工具调用兼容性，并引入MiniMax-M2.1和GLM-4.7等开源模型。产品稳定度已达95%，正...

Toy2026-01-07前沿阅读(34)去评论

研究人员成功在硬件上运行了loopcoder-40b模型，达到SWE基准81.4%的准确率，但性能瓶颈明显，仅9 token/s。由于vLLM和SGlang原生不支持该模型，团队采用了GitHub上的PR #31575来支持IQuestCo...

Toy2026-01-02前沿阅读(36)去评论

近日，技术文章揭示，ONNX Runtime和CoreML等AI框架在模型部署过程中，可能会自动将模型转换为FP16半精度格式，而未明确告知用户。这种转换旨在提升推理速度，但可能导致模型精度下降，尤其在复杂任务如自动驾驶或医疗AI中，影响预...

Toy2025-12-22前沿阅读(40)去评论

vLLora近日宣布为其大型语言模型(LLM)添加了调试模式功能，这一创新工具旨在帮助开发者更高效地识别和解决模型训练过程中的问题。调试模式提供了一系列可视化工具和实时监控功能，使开发人员能够深入理解模型行为，优化性能，并加速开发周期。该功...

Toy2025-12-17前沿阅读(50)去评论

最新研究表明，深度神经网络在不同任务训练后会收敛到相似的低维参数子空间。研究人员通过对1100多个模型（包括500个Mistral-7B LoRAs、500个视觉Transformer和50个LLaMA-8B模型）进行谱分析，首次证实神经网...

Toy2025-12-09前沿阅读(85)去评论