让知识传播更远更长久 | 卓越笔记

排序：默认时间浏览

针对大模型的性能测试

对大型语言模型进行性能测试，通常需要从模型能力和推理效率这两个核心维度来衡量。一个全面的测试体系，需要结合衡量“智能”的学术基准与评估“速度”的 ...

continue reading AI 大模型 zhuoyuebiji 2026/4/16 215

国产热门模型注册送 tokens/代金券（OpenClaw 龙虾费 tokens, 免费的薅一薅，有代金券）

【智普GLM】 🚀 速来拼好模，智谱 GLM Coding 超值订阅，邀你一起薅羊毛！Claude Code、Cline 等 20+ 大编程工具无缝支持，“码力”全开，越拼越爽！立即开拼，享限时惊喜价！链接：h ...

continue reading AI 大模型 zhuoyuebiji 2026/3/18 195

机器学习和自然理解任务中的 Query、Ground Truth、Context

在机器学习和自然理解任务中，Query（查询）、Ground Truth（真值标签）、Context（上下文）是三个核心概念，尤其是在检索增强生成（RAG）、问答系统、信息检索等场景中。 1. Query（查询）是什么 ...

continue reading AI 大模型 zhuoyuebiji 2026/4/8 195

Obsidian 和 dify 做知识库的对比，哪个更适合落地到企业软件测试流程中

Obsidian 和 Dify 在构建知识库时，定位和核心能力有显著区别。简单来说，Obsidian 是一个强大的个人知识管理工具，而 Dify 是一个面向企业的应用开发与知识运营平台。将两者对比后，Dify 更适合落地到企业软件测 ...

continue reading AI 大模型 zhuoyuebiji 2026/4/17 194

针对大模型的安全性测试

大模型是有可能生成事实性错误的输出，我们不应依赖其提供事实准确的信息。还有预训练模型及微调数据集的局限性，大模型也有可能生成低俗、带有偏见或其他冒犯性的内容。所以测试工程师需要对大模型做安全性测试，根据最新的行业实践和标准建立一个系统化的 ...

continue reading AI 大模型 zhuoyuebiji 2026/4/14 190

如何判断测试各岗位人员的主动性

一、测试管理人员工作方面前瞻性规划：主动制定测试战略、优化测试体系，而非被动应对风险识别：主动识别团队和项目的质量风险，并提前制定应对措施能力建设：主动规划团队能力提升路径，关 ...

continue reading 软件测试 zhuoyuebiji 2026/3/2 182

全力推进和落地 AI QA 工作流

一、AI QA 工作流是什么？简单说：用 AI 替代 / 辅助传统人工测试，把 “质量保障” 全流程自动化、智能化。核心不是 “用 AI 写几条用例”，而是覆盖需求→用例&r ...

continue reading 软件测试 zhuoyuebiji 2026/4/28 164

测试任务提测标准和流程

提测标准的核心目标是：确保交付给测试团队的版本具备“可测性”和“基本稳定性”。标准覆盖开发自测、文档完备性、代码质量、功能完整性等维度。通过建立结构化、可量化的提测规范，并辅以 ...

continue reading 软件测试 zhuoyuebiji 2026/5/7 126

测试岗年终总结方向参考

【2025年，是公司产品与技术架构持续深化演进的一年。作为高级软件测试工程师，我始终以“保障产品高质量交付、驱动研发效能提升”为核心目标，在复杂系统测试、质量体系建设与团队赋能等维度深耕细作。现将本年度工作总结与未来 ...

continue reading 软件测试 zhuoyuebiji 2026/5/7 122

抽奖日志表统计中奖的次数和奖品出现的概率

抽奖日志表结构 -- game.smelt_log definition CREATE TABLE `smelt_log` ( `id` bigint NOT NULL AUTO_INCREMENT, `user ...

continue reading 软件测试 zhuoyuebiji 2026/5/7 118