Yuyang Hu's picture

Yuyang Hu

namespace-ERI

·

https://namespace-eri.github.io/

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

OPD-Evolver: Cultivating Holistic Agent Evolver via On-Policy Distillation

upvoted a paper 10 days ago

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

upvoted a paper 10 days ago

Agents' Last Exam

View all activity

Organizations

None yet

upvoted a paper 5 days ago

OPD-Evolver: Cultivating Holistic Agent Evolver via On-Policy Distillation

Paper • 2606.17628 • Published 8 days ago • 27

upvoted 2 papers 10 days ago

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

Paper • 2606.13681 • Published 13 days ago • 140

Agents' Last Exam

Paper • 2606.05405 • Published 21 days ago • 359

upvoted 2 papers 12 days ago

FORT-Searcher: Synthesizing Shortcut-Resistant Search Tasks for Training Deep Search Agents

Paper • 2606.12087 • Published 14 days ago • 75

Toward Generalist Autonomous Research via Hypothesis-Tree Refinement

Paper • 2606.11926 • Published 14 days ago • 117

upvoted a paper 22 days ago

From Prompt Injection to Persistent Control: Defending Agentic Harness Against Trojan Backdoors

Paper • 2605.31042 • Published 26 days ago • 19

upvoted a paper 26 days ago

AgentFugue: Agent Scaling for Long-Horizon Tasks through Collective Reasoning

Paper • 2605.24486 • Published May 23 • 6

upvoted 2 papers 27 days ago

SAM: State-Adaptive Memory for Long-Horizon Reasoning Agent

Paper • 2605.24468 • Published May 23 • 9

PlanningBench: Generating Scalable and Verifiable Planning Data for Evaluating and Training Large Language Models

Paper • 2605.20873 • Published May 20 • 44

upvoted 2 papers about 2 months ago

ClawGym: A Scalable Framework for Building Effective Claw Agents

Paper • 2604.26904 • Published Apr 29 • 54

AutoResearchBench: Benchmarking AI Agents on Complex Scientific Literature Discovery

Paper • 2604.25256 • Published Apr 28 • 30

upvoted a paper 2 months ago

Agent-World: Scaling Real-World Environment Synthesis for Evolving General Agent Intelligence

Paper • 2604.18292 • Published Apr 20 • 87

upvoted 2 papers 3 months ago

MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild

Paper • 2603.17187 • Published Mar 17 • 141

OpenSeeker: Democratizing Frontier Search Agents by Fully Open-Sourcing Training Data

Paper • 2603.15594 • Published Mar 16 • 150

upvoted 6 papers 4 months ago

MemSifter: Offloading LLM Memory Retrieval via Outcome-Driven Proxy Reasoning

Paper • 2603.03379 • Published Mar 3 • 32

OmniGAIA: Towards Native Omni-Modal AI Agents

Paper • 2602.22897 • Published Feb 26 • 53

DeepImageSearch: Benchmarking Multimodal Agents for Context-Aware Image Retrieval in Visual Histories

Paper • 2602.10809 • Published Feb 11 • 59

LawThinker: A Deep Research Legal Agent in Dynamic Environments

Paper • 2602.12056 • Published Feb 12 • 35

Towards Autonomous Mathematics Research

Paper • 2602.10177 • Published Feb 10 • 36

When to Memorize and When to Stop: Gated Recurrent Memory for Long-Context Reasoning

Paper • 2602.10560 • Published Feb 11 • 31