Research
欢迎来到我的研究页面!在这里你可以了解我在多模态大语言模型、强化学习和智能体的最新工作和兴趣。
强化学习智能体视觉语言模型后训练
强化学习
Uni-OPD: Unifying On-Policy Distillation with a Dual-Perspective Recipe
Uni-DPO: A Unified Paradigm for Dynamic Preference Optimization of LLMs
视觉语言模型
HunyuanOCR Technical Report
Chronicles-OCR: A Cross-Temporal Perception Benchmark for the Evolutionary Trajectory of Chinese Characters
智能体
Safe, or Simply Incapable? Rethinking Safety Evaluation for Phone-Use Agents
欢迎浏览以上项目或联系我获取更多信息!