Daily Papers - 2026-04-19

Apr 19, 2026

This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-04-19.

HY-World 2.0 是一个多模态世界模型框架，它利用专门的模块（用于全景图生成、轨迹规划、世界扩展和组合）从多样化的输入生成高保真度的 3D 高斯溅射场景，并配备了一个增强的渲染平台用于交互式 3D 探索。

2. DR^{3}-Eval: Towards Realistic and Reproducible Deep Research Evaluation

DR$^{3}$-Eval 是一个用于评估深度研究智能体进行多模态、多文件报告生成的基准测试，该基准测试模拟了真实的 Web 环境并提供了一个全面的评估框架。

RAD-2 是一个用于自动驾驶运动规划的统一生成器-判别器框架，通过基于扩散的轨迹生成和强化学习优化来提高稳定性和性能。

该论文提出了一个教师-学生合作数据合成框架，用于生成与学生模型一致的 SFT（监督式微调）数据，从而解决合成数据中的风格差异问题，以提高模型微调的性能。

GlobalSplat 引入了一个全局场景表示框架，通过全局场景令牌实现了紧凑、一致的 3D 高斯溅射，同时降低了计算开销并提高了推理速度。

ASGuard（Activation-Scaling Guard）通过机制电路分析和有针对性的微调，识别并重新校准易受基于时态的越狱攻击的特定注意力头，从而缓解大型语言模型中脆性的拒绝行为。

HiVLA 提出了一个以视觉为中心的分层具身操作框架，它使用具有级联交叉注意力的扩散 Transformer 动作专家，将语义规划与运动控制解耦，从而提高了机器人操作的性能。

该研究分析了 Claude Code 的架构，识别了五个驱动人类价值观，并追溯了它们通过十三个设计原则如何具体实现，包括核心的 while 循环架构以及用于安全、上下文管理和可扩展性的支持系统。

UniDoc-RL 引入了一个用于 LVLM（大型视觉语言模型）的强化学习框架，通过分层决策和密集的多元奖励监督，联合优化了检索、重排序、视觉感知和推理。

LeapAlign 通过缩短轨迹步长来降低计算成本并实现稳定的梯度传播，同时保持与人类偏好的对齐，从而改进了流匹配模型的训练后微调。