Daily Papers - 2026-03-31

Mar 31, 2026

This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-03-31.

1. Towards a Medical AI Scientist

医学人工智能科学家是首个专为临床应用设计的自主研究框架，通过临床医生与工程师的协作，在三种研究模式下实现基于证据的假设生成和论文起草。

具有大型生成模型的多智能体系统会展现出涌现的集体行为和风险，这些风险在没有明确指令的情况下会模仿人类社会的病态现象。

LLaVA-DyMoE通过动态扩展混合专家模型，并结合Token级别的分配指导和路由分数正则化，解决了多模态指令持续调优中因路由漂移引起的遗忘问题。

ResAdapt是一个输入端自适应框架，它动态分配视觉资源，以提高多模态大型语言模型在视频任务中的效率，同时保持高性能。

Kernel-Smith是一个GPU内核生成框架，它结合了演化算法和训练后强化学习，以优化跨不同硬件后端的性能。

PRBench通过要求AI智能体实现已发表论文中的算法并匹配原始结果来评估其复现科学研究的能力，揭示了在公式实现、调试和数据准确性方面存在的重大挑战。

ImagenWorld引入了一个全面的图像生成和编辑基准，涵盖多个任务和领域，包含人工标注和可解释的评估，以评估模型性能和失效模式。

本文提出了一种搜索增强的图像生成智能体，该智能体通过多跳推理和搜索来收集文本知识和参考图像，以实现基于事实的生成。该智能体通过监督微调和具有双重奖励反馈的智能体强化学习进行训练。

本文引入了一个新的图像编辑基准和评估模型，以更好地评估在复杂编辑任务中视觉一致性和人类对齐度。

一种用于深度研究智能体的验证中心框架，通过在开发和推理的多个阶段纳入错误检查，提高了在复杂基准上的性能。