Daily Papers - 2026-04-22


This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-04-22.

Browse the daily feed

1. Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

Read the paper

一个商用规模的虚拟试穿系统通过集成系统设计和多阶段训练,实现了高成功率、照片级逼真效果和实时性能。

2. CoInteract: Physically-Consistent Human-Object Interaction Video Synthesis via Spatially-Structured Co-Generation

Read the paper

CoInteract 提出了一个端到端的框架,利用具有特殊模块的 Diffusion Transformer 主干来合成人体-物体交互视频,这些模块专注于结构稳定性和物理合理性。

3. AgentSPEX: An Agent SPecification and EXecution Language

Read the paper

AgentSPEX 是一种领域特定语言和框架,用于创建结构化、模块化且可解释的大型语言模型 Agent 工作流,并具有明确的控制流和状态管理。

4. AnyRecon: Arbitrary-View 3D Reconstruction with Video Diffusion Model

Read the paper

AnyRecon 利用具有持久场景记忆和几何感知条件的扩散模型,实现了从任意稀疏输入进行可扩展的三维重建,从而提高了几何一致性。

5. TEMPO: Scaling Test-time Training for Large Reasoning Models

Read the paper

TEMPO 是一种测试时训练框架,通过交替进行策略精炼和评估器重新校准,在不发生多样性崩溃的情况下持续提升语言模型的性能。

6. PlayCoder: Making LLM-Generated GUI Code Playable

Read the paper

大型语言模型在生成逻辑正确的 GUI 应用程序方面存在困难,这促使了 PlayEval 基准和 PlayCoder 框架的开发,该框架采用多智能体方法,通过迭代修复来提高功能正确性。

7. ShadowPEFT: Shadow Network for Parameter-Efficient Fine-Tuning

Read the paper

ShadowPEFT 是一种参数高效的微调框架,通过深度共享的 Shadow 模块进行层级精炼,与传统的低秩适配方法相比,在计算开销较低的情况下实现了具有竞争力的性能。

8. Chat2Workflow: A Benchmark for Generating Executable Visual Workflows with Natural Language

Read the paper

Chat2Workflow 提出了一个基准和智能体框架,用于从自然语言自动生成可执行的可视化工作流,揭示了尽管语言模型取得了进步,但在实现工业级自动化方面仍然存在显著挑战。

9. AJ-Bench: Benchmarking Agent-as-a-Judge for Environment-Aware Evaluation

Read the paper

Agent-as-a-Judge 基准通过全面的任务评估,评估了跨多个领域的自动化验证能力。

10. Understanding and Enforcing Weight Disentanglement in Task Arithmetic

Read the paper

任务算术的成功缺乏理论解释,但提出的 OrthoReg 方法通过在微调期间强制更新的权重正交性来促进权重解耦,从而解决了这一问题。