Zhaohui

zhaohuiwang

3

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

GQLA: Group-Query Latent Attention for Hardware-Adaptive Large Language Model Decoding

upvoted a paper about 2 months ago

MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference

upvoted a paper 2 months ago

HISA: Efficient Hierarchical Indexing for Fine-Grained Sparse Attention

View all activity

Organizations

None yet

upvoted a paper about 1 month ago

GQLA: Group-Query Latent Attention for Hardware-Adaptive Large Language Model Decoding

Paper • 2605.15250 • Published May 14 • 14

upvoted a paper about 2 months ago

MISA: Mixture of Indexer Sparse Attention for Long-Context LLM Inference

Paper • 2605.07363 • Published May 8 • 12

upvoted a paper 2 months ago

HISA: Efficient Hierarchical Indexing for Fine-Grained Sparse Attention

Paper • 2603.28458 • Published Mar 30 • 44