Daily Papers - 2026-04-24


This daily digest collects the top 10 papers from the Hugging Face papers feed for 2026-04-24.

Browse the daily feed

1. LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics

Read the paper

LLaTiSA 引入了一个分层时间序列推理数据集和模型,旨在通过可视化模式和数值表格增强大型语言模型对时间数据的理解能力。

2. WorldMark: A Unified Benchmark Suite for Interactive Video World Models

Read the paper

WorldMark 建立了一个标准化的基准套件,用于评估交互式视频生成模型。该基准套件在统一的控制、相同的场景和跨多个模型架构的全面评估指标方面实现了标准化。

3. UniT: Toward a Unified Physical Language for Human-to-Humanoid Policy Learning and World Modeling

Read the paper

UniT 通过创建一种统一的视觉-语言表示,实现了人类到人形机器人的策略迁移。该表示通过交叉重构机制和共享的潜在空间来弥合运动学上的差异。

4. StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition

Read the paper

StyleID 提出了一个感知感知数据集和评估框架,用于在风格化处理下进行面部身份识别,同时保持身份的保真度。该框架包含两个源自心理测量实验的数据集,以及能够提高与人类判断相关性的校准语义编码器。

5. Seeing Fast and Slow: Learning the Flow of Time in Videos

Read the paper

通过自监督的时间推理,开发了视频速度操纵和感知模型。这使得能够从真实视频中进行速度检测、慢动作视频生成和时间超分辨率。

6. Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

Read the paper

一个协同演化框架使大型语言模型能够在长时序交互环境中,通过一个可学习的技能库和技能管道,跨多个回合发现、保留和重用结构化技能。

7. TingIS: Real-time Risk Event Discovery from Noisy Customer Incidents at Enterprise Scale

Read the paper

TingIS 是一个企业级的事件发现系统,它使用多阶段事件链接、LLMs、级联路由和降噪技术,从海量、嘈杂的客户报告中高效地识别关键问题。

8. VLAA-GUI: Knowing When to Stop, Recover, and Search, A Modular Framework for GUI Automation

Read the paper

VLAA-GUI 是一个模块化的 GUI 自动化代理框架,通过集成验证、循环中断和搜索功能,解决了早期停止和重复循环的问题。

9. Hybrid Policy Distillation for LLMs

Read the paper

混合策略蒸馏结合了前向和反向 KL 散度方法,以提高不同模型大小和任务上的知识蒸馏的稳定性和效率。

10. Context Unrolling in Omni Models

Read the paper

Omni 是一个在多样化数据类型上训练的统一多模态模型,它实现了上下文展开,以提高跨异构模态的推理能力。