Daily Papers - 2026-04-22

Apr 22, 2026

This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-04-22.

1. Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

一个商用规模的虚拟试穿系统通过集成系统设计和多阶段训练，实现了高成功率、照片级逼真效果和实时性能。

CoInteract 提出了一个端到端的框架，利用具有特殊模块的 Diffusion Transformer 主干来合成人体-物体交互视频，这些模块专注于结构稳定性和物理合理性。

AgentSPEX 是一种领域特定语言和框架，用于创建结构化、模块化且可解释的大型语言模型 Agent 工作流，并具有明确的控制流和状态管理。

AnyRecon 利用具有持久场景记忆和几何感知条件的扩散模型，实现了从任意稀疏输入进行可扩展的三维重建，从而提高了几何一致性。

TEMPO 是一种测试时训练框架，通过交替进行策略精炼和评估器重新校准，在不发生多样性崩溃的情况下持续提升语言模型的性能。

大型语言模型在生成逻辑正确的 GUI 应用程序方面存在困难，这促使了 PlayEval 基准和 PlayCoder 框架的开发，该框架采用多智能体方法，通过迭代修复来提高功能正确性。

ShadowPEFT 是一种参数高效的微调框架，通过深度共享的 Shadow 模块进行层级精炼，与传统的低秩适配方法相比，在计算开销较低的情况下实现了具有竞争力的性能。

Chat2Workflow 提出了一个基准和智能体框架，用于从自然语言自动生成可执行的可视化工作流，揭示了尽管语言模型取得了进步，但在实现工业级自动化方面仍然存在显著挑战。

Agent-as-a-Judge 基准通过全面的任务评估，评估了跨多个领域的自动化验证能力。

任务算术的成功缺乏理论解释，但提出的 OrthoReg 方法通过在微调期间强制更新的权重正交性来促进权重解耦，从而解决了这一问题。