AI编程 · 架构思考 · 技术人生
共 1 篇文章

标签:评估

大模型面试100问06:评估与安全篇-Toy's Tech Notes

大模型面试100问06:评估与安全篇

TL;DR 评估和安全是LLM落地的两大关键——不能衡量就无法改进,不能保护就不敢上线。BLEU/ROUGE适合机器翻译但不适合开放生成,困惑度只能评估语言建模能力;幻觉检测用语义熵,偏见测量用CrowS-Pairs;红队测试模拟攻击,差分...

赞(0)ToyToyAI情报局 阅读(34)去评论

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始