Hi, I'm Haokun Lin (林浩坤) 🍻

I’m a Ph.D. candidate at New Laboratory of Pattern Recognition (NLPR), Institute of Automation, Chinese Academy of Sciences under the supervision of Prof. Zhenan Sun. I’m also a joint Ph.D. candidate at Department of Computer Science, City University of Hong Kong, working with Prof. Ying Wei and Prof. Zhichao Lu. Before joining CASIA, I received my B.Eng. in Software Engineering from Huazhong University of Science and Technology in 2021.

My research interests include Multi-modal Learning, Large Language/Vision Models, and Efficient Deep Learning.

👋👋👋 If you’re interested in my work, please feel free to reach out for discussions or collaborations!

Contact me via:
📧 Mail: haokun.lin[AT]cripac.ia.ac.cn or haokunlin2-c[AT]my.cityu.edu.hk

🌈 What's new:

[05/2026] 🚀 Award: Honored to be selected as Silver Reviewer for ICML'26!
[05/2026] 🎉 ICML'26: "MedREK: Retrieval-Based Editing for Medical LLMs with Key-Aware Prompts." [Code/PDF]
[05/2026] 🎉 ICML'26: "Concept-Guided Tokenization: Closing the Gap Between Reconstruction and Generation."
[04/2026] 🎉 Four papers are accepted to ACL'26, IJCNN'26, ICMR'26 and Neurocomputing.
[02/2026] 🎉 CVPR'26: "QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models." [Code/PDF]
[01/2026] 📜 Preprint: "Efficient Diffusion Language Models: A Comprehensive Survey." [Repo/PDF]
[11/2025] 🎉 MIR: "Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs." [Code/PDF]
[11/2025] 🎉 ResponsibleFM @ NeurIPS 2025: "MedREK: Retrieval-Based Editing for Medical LLMs with Key-Aware Prompts." [Code/PDF]
[11/2025] 🚀 Award: Delighted to have received the National Scholarship at UCAS! Grateful to my supervisors!
[08/2025] 📜 Preprint: "LRQ-DiT: Log-Rotation Post-Training Quantization of Diffusion Transformers for Text-to-Image Generation." [PDF]
[06/2025] 🎉 ICCV'25: "DOGR: Towards Versatile Visual Document Grounding and Referring." [Code/PDF]
[05/2025] 📜 Preprint: "TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation." [Code/PDF]
[02/2025] 🎉 TMM: "Scale Up Composed Image Retrieval Learning via Modification Text Generatio." [PDF]
[01/2025] 🎉 ICLR'25: "Image-level Memorization Detection via Inversion-based Inference Perturbation." [PDF]
[11/2024] 🚀 Award: Delighted to have received the First Prize in the 2024 Graduate Academic Forum at UCAS!
[11/2024] 🚀 Award: Honored to be selected as a Top Reviewer at NeurIPS 2024!
[09/2024] 🎉 NeurIPS'24 Oral: "DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs." Big Congs! 🔥🔥🔥 [Code/PDF]
[07/2024] 🎉 ECCV'24: "MATHVERSE: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?" [Code/PDF]
[05/2024] 🎉 ACL'24 Findings: "IntactKV: Improving Large Language Model Quantization by Keeping Pivot Tokens Intact." [Code/PDF]
[02/2024] 🎉 CVPR'24: "MoPE-CLIP: Structured Pruning for Efficient Vision-Language Models with Module-wise Pruning Error Metric." [PDF]
[01/2024] 🎉 ICLR'24: "Plug-and-Play: An Efficient Post-training Pruning Method for Large Language Models." [Code/PDF]
[03/2022] 🎓 Starting Joint Ph.D.@CityU: I will join Prof. Ying Wei's group at CityU in 2022 Fall!
[09/2021] 🎓 Starting Ph.D.@CASIA: I will join Prof. Zhenan Sun's group at NLPR, CASIA in 2021 Fall!
[06/2021] 🎓 Graduation@HUST: Recieved my Bachelor's Degree from Huazhong University of Science and Technology with Honorary degree.

🎓 Selected Publications (Google Scholar)

(*: co-first author; ^: corresponding author; #: Project Lead)

DuQuant: Distributing Outliers via Dual Transformation Makes Stronger Quantized LLMs.
Haokun Lin*, Haobo Xu*, Yichen Wu*, Jingzhi Cui, Yingtao Zhang, Linzhan Mou, Linqi Song, Zhenan Sun^, Ying Wei^,
in 38th Conference on Neural Information Processing Systems (NeurIPS 2024 Oral).
[PDF] [arXiv] [Project] [Github] [QbitAI/量子位] [bibtex]

MoPE-CLIP: Structured Pruning for Efficient Vision-Language Models with Module-wise Pruning Error Metric.
Haokun Lin, Haoli Bai, Zhili Liu, Lu Hou, Muyi Sun, Linqi Song, Ying Wei^, Zhenan Sun^,
in IEEE / CVF Computer Vision and Pattern Recognition Conference 2024 (CVPR 2024).
[PDF] [arXiv] [bibtex]

TokLIP: Marry Visual Tokens to CLIP for Multimodal Comprehension and Generation.
Haokun Lin*, Teng Wang*, Yixiao Ge^, Yuying Ge, Zhichao Lu, Ying Wei, Qingfu Zhang, Zhenan Sun, Ying Shan,
Preprint.
[PDF] [arXiv] [Github] [HuggingFace] [QbitAI/量子位] [bibtex]

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs.
Haokun Lin*, Haobo Xu*, Yichen Wu, Ziyu Guo, Renrui Zhang, Zhichao Lu, Ying Wei, Qingfu Zhang, Zhenan Sun,
in Machine Intelligence Research, 2025.
[PDF] [arXiv] [Github] [bibtex]

Efficient Diffusion Language Models: A Comprehensive Survey.
Haokun Lin*#, Xinle Jia*, Shaozhen Liu*, Shujun Xia*, Weitao Huang*, Haobo Xu, Junyang Li, Yicheng Xiao, Xingrun Xing, Ziyu Guo, Renrui Zhang, Qi Li, Yichen Wu, Renzhen Wang, Xiaojuan Qi, Caifeng Shan, Hongsheng Li, Zhenan Sun,
Preprint.
[PDF] [TechXriv] [Github] [Synced/机器之心] [bibtex]

MedREK: Retrieval-Based Editing for Medical LLMs with Key-Aware Prompts.
Shujun Xia*, Haokun Lin#*, Yichen Wu^, Yinan Zhou, Zixuan Li, Zhongwei Wan, Xingrun Xing, Yefeng Zheng, Xiang Li, Caifeng Shan, Zhenan Sun, Quanzheng Li^,
in Forty-Third International Conference on Machine Learning (ICML 2026).
[PDF] [arXiv] [Github] [bibtex]

Image-level Memorization Detection via Inversion-based Inference Perturbation.
Yue Jiang*, Haokun Lin*, Yang Bai, Bo Peng, Zhili Liu, Yueming Lyu, Yong Yang, Xing Zheng, Jing Dong,
in 13th International Conference on Learning Representations (ICLR 2025).
[PDF] [bibtex]

QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models.
Jingxuan Zhang*, Yunta Hsieh*, Zhongwei Wan, Haokun Lin, Xin Wang, Ziqi Wang, Yingtie Lei, Mi Zhang,
in IEEE / CVF Computer Vision and Pattern Recognition Conference 2026 (CVPR 2026).
[PDF] [arXiv] [Project] [Github] [bibtex]

DOGR: Towards Versatile Visual Document Grounding and Referring.
Yinan Zhou*, Yuxin Chen*, Haokun Lin, Yichen Wu, Shuyu Yang, Zhongang Qi, Chen Ma, Li Zhu, Ying Shan,
in IEEE / CVF International Conference on Computer Vision 2025 (ICCV 2025).
[PDF] [arXiv] [Github] [bibtex]

MATHVERSE: Does Your Multi-modal LLM Truly See the Diagrams in Visual Math Problems?
Renrui Zhang*, Dongzhi Jiang*, Yichi Zhang*, Haokun Lin, Ziyu Guo, Pengshuo Qiu, Aojun Zhou, Pan Lu, Kai-Wei Chang, Peng Gao, Hongsheng Li,
in 18th European Conference on Computer Vision (ECCV 2024).
[PDF] [arXiv] [Project] [Github] [Dataset] [Synced/机器之心] [bibtex]

Plug-and-Play: An Efficient Post-training Pruning Method for Large Language Models.
Yingtao Zhang, Haoli Bai, Haokun Lin, Jialin Zhao, Lu Hou, Carlo Vittorio Cannistraci,
in 12th International Conference on Learning Representations (ICLR 2024).
[PDF] [OpenReview] [Github] [bibtex]

IntactKV: Improving Large Language Model Quantization by Keeping Pivot Tokens Intact.
Ruikang Liu, Haoli Bai, Haokun Lin, Yuening Li, Han Gao, Zhengzhuo Xu, Lu Hou, Jun Yao, Chun Yuan,
in Findings of 62nd Annual Meeting of the Association for Computational Linguistics (ACL 2024 Findings)
[PDF] [arXiv] [Github] [bibtex]

LRQ-DiT: Log-Rotation Post-Training Quantization of Diffusion Transformers for Text-to-Image Generation.
Lianwei Yang*, Haokun Lin*, Tianchen Zhao*, Yichen Wu, Hongyu Zhu, Ruiqi Xie, Zhenan Sun, Yu Wang, Qingyi Gu,
Preprint.
[PDF] [arXiv] [Github] [bibtex]

🏆 Honors and Awards

2026.05 ICML 2026 Silver Reviewer Award.
2025.11 National Scholarship, UCAS, Gradeduate Students.
2025.06 First prize, UCAS Excellent Graduate Scholarship.
2024.12 First Prize, 2024 Graduate Academic Forum, University of Chinese Academy of Sciences.
2024.11 NeurIPS 2024 Top Reviewer Award.
2021.06 Honorary degree of HUST, Top 2%, Highest Honour for Undergraduate.
2020.10 National Scholarship, HUST, Undergraduate Students.
2018-2020 First prize, HUST Excellent Undergraduate Scholarship.

🎖 Services

Invited Reviewer:
- AAAI’2026, ICLR’2026, AISTATS’2026, CVPR’2026, ICML’2026, ECCV’2026.
- ICDE’2025, ICML’2025, ACL’2025 Feb ARR, ICCV’2025, NeurIPS’2025.
- EMNLP’2023, NeurIPS’2024, ICLR’2025, CVPR’2025, AISTATS’2025.
- IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI).
- IEEE Transactions on Neural Networks and Learning Systems (TNNLS).
- IEEE Transactions on Multimedia (TMM).
- IEEE Transactions on Circuits and Systems for Video Technology (TCSVT).
- Transactions on Machine Learning Research (TMLR).
Teaching Assistant:
- CityU, CS1302 Introduction to Computer Programming, 2025 Spring.
- CityU, CS5481 Data Engineering, 2025 Fall.
- CityU, CS1302 Introduction to Computer Programming, 2024 Spring.
- CityU, CS1315 Computer Programming, 2024 Fall.

💬 Talks

Invited talk at the QingKe AI about DuQuant.
Invited talk at the AI Time.

Site Analytics