LLM Safety Alignment Researcher | Ph.D. Student
I am a first-year PhD student at the School of Electronic Science and Engineering, Nanjing University, specializing in the safety alignment of large language models, with a focus on risk identification and defense mechanisms in multi-turn conversations. My work is dedicated to making AI systems safer and more reliable.
Ph.D. 电子科学与工程学院 | 电子信息专业 (直博)
Research Interests: LLMs Alignment, Agentic RL
Advisor: Prof. Yang Gao
本科 | 人工智能学院 | 人工智能专业
Rank: 1/114 | GPA: 3.82/4.00
Honors: 2023年国家奖学金(全院唯一)| 班长 | 院学生会主席 | CET6-556
共同一作 (Co-first Author)
第一作者 (First Author)
2025年2月 - 2025年10月
2024年12月 - 2025年9月
熟练掌握SFT流程,包括数据构建、训练策略、超参数调优等;深入理解DPO、IPO、KTO等偏好优化方法; 熟悉RLHF、PPO、GRPO等强化学习对齐算法的原理与实现;具备偏好数据构建、标注、质量控制全流程经验
PyTorch, Hugging Face Transformers, PEFT/LoRA; DeepSpeed, FSDP等大规模训练框架; vLLM等推理加速工具