精简模型带来强劲基准测试表现
尽管参数量不足前者的一半,Tether的1.7B模型在基准测试中仍领先谷歌MedGemma-4B超过11分。
4B版本模型将输出标记量削减至原有的三分之一,显著降低了计算成本并实现了更快的设备端响应速度。
QVAC MedPsy以GGUF格式实现完全本地化运行,确保敏感患者数据无需上传至远程云端服务器。
该系列模型历经八项基准测试的全面评估,涵盖临床考核、专家推理及现实场景模拟等多个维度。
高效能与本地化部署推动版本发布
研究团队正式推出专为智能手机及边缘设备设计的医疗语言模型系列QVAC MedPsy。该系列采用隐私优先的设计理念,致力于将敏感健康数据完全保留在本地设备进行处理。初期基准测试结果显示,这些体积更小的模型在多方面表现优于规模更大的竞品,这标志着医疗人工智能系统的构建与部署模式正在发生重要转变。
紧凑模型展现卓越性能
QVAC MedPsy提供17亿参数与40亿参数两种版本。两个版本均接受了八套医疗基准测试集的评估,内容覆盖临床知识、专家推理与实际应用场景。测试结果表明,其性能可与数倍于自身规模的模型相抗衡。
170亿参数模型在七项封闭式基准测试中取得62.62的综合评分,以不足一半的参数量领先谷歌MedGemma-4B超过11分。在HealthBench Hard测试中,该模型同样超越了参数量近乎其十六倍的MedGemma 27B模型。
40亿参数版本在上述七项测试中获得70.54分,其表现优于参数量约为自身七倍的MedGemma-27B-text及其他大型模型。该模型在HealthBench、HealthBench Hard及MedXpertQA等评估体系中均保持稳定优异的性能。
研究团队负责人强调了模型的高效性:“我们的40亿参数模型以不足七分之一的参数量实现了超越性表现,同时单次响应所需标记量减少了约三倍。”
效率与本地化部署成为关键优势
本次发布最显著的实践成果之一在于标记使用效率的提升。40亿参数模型每次响应仅生成约909个标记,而同类系统通常需要2953个标记,这意味着输出长度缩减至原有的32%。
17亿参数模型平均每次响应消耗约1110个标记,远低于同类系统的1901个标记。更短的输出意味着更快的响应速度与更低的计算成本,这在速度与成本因素直接影响应用落地的现实医疗场景中尤为重要。
两个版本均提供量化GGUF格式以供本地部署,其Q4_K_M版本体积分别约为1.2GB与2.6GB,使得模型能够在移动设备及医院本地系统中高效运行。
这些性能突破源于分阶段的训练后优化过程,该过程融合了广泛的医疗监督数据、临床推理资料以及对复杂病例的强化学习。值得注意的是,所有成果均未依赖额外的模型规模扩张。
传统医疗人工智能长期依赖云端基础设施进行敏感数据的远程处理,而QVAC MedPsy通过实现完全设备端的高性能运行改变了这一范式。对于在严格隐私法规下运作的医疗机构而言,这为云端访问受限或受控的环境开辟了全新的部署路径。

资金费率
资金费率热力图
多空比
大户多空比
币安/欧易/火币大户多空比
Bitfinex杠杆多空比
账号安全
资讯收藏
自选币种