Daily Papers - 2026-03-31


This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-03-31.

Browse the daily feed

1. Towards a Medical AI Scientist

Read the paper

医学人工智能科学家是首个专为临床应用设计的自主研究框架,通过临床医生与工程师的协作,在三种研究模式下实现基于证据的假设生成和论文起草。

2. Emergent Social Intelligence Risks in Generative Multi-Agent Systems

Read the paper

具有大型生成模型的多智能体系统会展现出涌现的集体行为和风险,这些风险在没有明确指令的情况下会模仿人类社会的病态现象。

3. On Token’s Dilemma: Dynamic MoE with Drift-Aware Token Assignment for Continual Learning of Large Vision Language Models

Read the paper

LLaVA-DyMoE通过动态扩展混合专家模型,并结合Token级别的分配指导和路由分数正则化,解决了多模态指令持续调优中因路由漂移引起的遗忘问题。

4. ResAdapt: Adaptive Resolution for Efficient Multimodal Reasoning

Read the paper

ResAdapt是一个输入端自适应框架,它动态分配视觉资源,以提高多模态大型语言模型在视频任务中的效率,同时保持高性能。

5. Kernel-Smith: A Unified Recipe for Evolutionary Kernel Optimization

Read the paper

Kernel-Smith是一个GPU内核生成框架,它结合了演化算法和训练后强化学习,以优化跨不同硬件后端的性能。

6. PRBench: End-to-end Paper Reproduction in Physics Research

Read the paper

PRBench通过要求AI智能体实现已发表论文中的算法并匹配原始结果来评估其复现科学研究的能力,揭示了在公式实现、调试和数据准确性方面存在的重大挑战。

7. ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

Read the paper

ImagenWorld引入了一个全面的图像生成和编辑基准,涵盖多个任务和领域,包含人工标注和可解释的评估,以评估模型性能和失效模式。

8. Gen-Searcher: Reinforcing Agentic Search for Image Generation

Read the paper

本文提出了一种搜索增强的图像生成智能体,该智能体通过多跳推理和搜索来收集文本知识和参考图像,以实现基于事实的生成。该智能体通过监督微调和具有双重奖励反馈的智能体强化学习进行训练。

9. GEditBench v2: A Human-Aligned Benchmark for General Image Editing

Read the paper

本文引入了一个新的图像编辑基准和评估模型,以更好地评估在复杂编辑任务中视觉一致性和人类对齐度。

10. Marco DeepResearch: Unlocking Efficient Deep Research Agents via Verification-Centric Design

Read the paper

一种用于深度研究智能体的验证中心框架,通过在开发和推理的多个阶段纳入错误检查,提高了在复杂基准上的性能。