Daily Papers - 2026-04-19
This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-04-19.
1. HY-World 2.0: A Multi-Modal World Model for Reconstructing, Generating, and Simulating 3D Worlds
HY-World 2.0 是一个多模态世界模型框架,它利用专门的模块(用于全景图生成、轨迹规划、世界扩展和组合)从多样化的输入生成高保真度的 3D 高斯溅射场景,并配备了一个增强的渲染平台用于交互式 3D 探索。
2. DR^{3}-Eval: Towards Realistic and Reproducible Deep Research Evaluation
DR$^{3}$-Eval 是一个用于评估深度研究智能体进行多模态、多文件报告生成的基准测试,该基准测试模拟了真实的 Web 环境并提供了一个全面的评估框架。
3. RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework
RAD-2 是一个用于自动驾驶运动规划的统一生成器-判别器框架,通过基于扩散的轨迹生成和强化学习优化来提高稳定性和性能。
4. How to Fine-Tune a Reasoning Model? A Teacher-Student Cooperation Framework to Synthesize Student-Consistent SFT Data
该论文提出了一个教师-学生合作数据合成框架,用于生成与学生模型一致的 SFT(监督式微调)数据,从而解决合成数据中的风格差异问题,以提高模型微调的性能。
5. GlobalSplat: Efficient Feed-Forward 3D Gaussian Splatting via Global Scene Tokens
GlobalSplat 引入了一个全局场景表示框架,通过全局场景令牌实现了紧凑、一致的 3D 高斯溅射,同时降低了计算开销并提高了推理速度。
6. ASGuard: Activation-Scaling Guard to Mitigate Targeted Jailbreaking Attack
ASGuard(Activation-Scaling Guard)通过机制电路分析和有针对性的微调,识别并重新校准易受基于时态的越狱攻击的特定注意力头,从而缓解大型语言模型中脆性的拒绝行为。
7. HiVLA: A Visual-Grounded-Centric Hierarchical Embodied Manipulation System
HiVLA 提出了一个以视觉为中心的分层具身操作框架,它使用具有级联交叉注意力的扩散 Transformer 动作专家,将语义规划与运动控制解耦,从而提高了机器人操作的性能。
8. Dive into Claude Code: The Design Space of Today’s and Future AI Agent Systems
该研究分析了 Claude Code 的架构,识别了五个驱动人类价值观,并追溯了它们通过十三个设计原则如何具体实现,包括核心的 while 循环架构以及用于安全、上下文管理和可扩展性的支持系统。
9. UniDoc-RL: Coarse-to-Fine Visual RAG with Hierarchical Actions and Dense Rewards
UniDoc-RL 引入了一个用于 LVLM(大型视觉语言模型)的强化学习框架,通过分层决策和密集的多元奖励监督,联合优化了检索、重排序、视觉感知和推理。
10. LeapAlign: Post-Training Flow Matching Models at Any Generation Step by Building Two-Step Trajectories
LeapAlign 通过缩短轨迹步长来降低计算成本并实现稳定的梯度传播,同时保持与人类偏好的对齐,从而改进了流匹配模型的训练后微调。